久久精品中文字幕,狠狠色丁香婷婷综合,精品国产制服丝袜高跟,国内精品久久久久久久久齐齐 ,国模冰莲极品自慰人体

灰鴿子遠(yuǎn)程控制軟件

 找回密碼
 立即注冊(cè)

QQ登錄

只需一步,快速開始

查看: 12611|回復(fù): 2
打印 上一主題 下一主題

灰鴿子遠(yuǎn)程控制軟件音頻算法實(shí)際應(yīng)用中的難點(diǎn)及解決方案(二)

[復(fù)制鏈接]
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2017-12-17 14:43:30 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式
灰鴿子遠(yuǎn)程控制軟件音頻算法實(shí)際應(yīng)用中的難點(diǎn)及解決方案(二)

如果僅僅依靠上述的技術(shù)就能實(shí)現(xiàn)一個(gè)效果良好的應(yīng)用于廣域網(wǎng)上的語音對(duì)話系統(tǒng),那就沒什么太大的必要來撰寫此文了。正是有很多現(xiàn)實(shí)的因素為上述的概念模型引入了眾多挑戰(zhàn),使得網(wǎng)絡(luò)語音系統(tǒng)的實(shí)現(xiàn)不是那么簡(jiǎn)單,其涉及到很多專業(yè)技術(shù)。當(dāng)然,這些挑戰(zhàn)大多已經(jīng)有了成熟的解決方案。首先,我們要為“效果良好”的語音對(duì)話系統(tǒng)下個(gè)定義,我覺得應(yīng)該達(dá)到如下幾點(diǎn):
(1)低延遲。只有低延遲,才能讓通話的雙方有很強(qiáng)的Realtime的感覺。當(dāng)然,這個(gè)主要取決于網(wǎng)絡(luò)的速度和通話雙方的物理位置的距離,就單純軟件的角度,優(yōu)化的可能性很小。
(2)背景噪音小。
(3)聲音流暢、沒有卡、停頓的感覺。
(4)沒有回音。
      下面我們就逐個(gè)說說實(shí)際網(wǎng)絡(luò)語音對(duì)話系統(tǒng)中額外用到的技術(shù)。

1.回音消除 AEC

      現(xiàn)在大家?guī)缀醵家呀?jīng)都習(xí)慣了在語音聊天時(shí),直接用PC或筆記本的聲音外放功能。殊不知,這個(gè)小小的習(xí)慣曾為語音技術(shù)提出了多大的挑戰(zhàn)。當(dāng)使用外放功能時(shí),揚(yáng)聲器播放的聲音會(huì)被麥克風(fēng)再次采集,傳回給對(duì)方,這樣對(duì)方就聽到了自己的回音。所以,實(shí)際應(yīng)用中,回音消除的功能是必需的。
      在得到采集的音頻幀后,在編碼之前的這個(gè)間隙,是回音消除模塊工作的時(shí)機(jī)。
     
  其原理簡(jiǎn)單地來說就是,回音消除模塊依據(jù)剛播放的音頻幀,在采集的音頻幀中做一些類似抵消的運(yùn)算,從而將回聲從采集幀中清除掉。這個(gè)過程是相當(dāng)復(fù)雜的,而且其還與你聊天時(shí)所處的房間的大小、以及你在房間中的位置有關(guān),因?yàn)檫@些信息決定了聲波反射的時(shí)長(zhǎng)。 智能的回音消除模塊,能動(dòng)態(tài)調(diào)整內(nèi)部參數(shù),以最佳適應(yīng)當(dāng)前的環(huán)境。
2.噪聲抑制 DENOISE
      噪聲抑制又稱為降噪處理,是根據(jù)語音數(shù)據(jù)的特點(diǎn),將屬于背景噪音的部分識(shí)別出來,并從音頻幀中過濾掉。有很多編碼器都內(nèi)置了該功能。
3.抖動(dòng)緩沖區(qū) JitterBuffer


      抖動(dòng)緩沖區(qū)用于解決網(wǎng)絡(luò)抖動(dòng)的問題。所謂網(wǎng)絡(luò)抖動(dòng),就是網(wǎng)絡(luò)延遲一會(huì)大一會(huì)小,在這種情況下,即使發(fā)送方是定時(shí)發(fā)送數(shù)據(jù)包的(比如每100ms發(fā)送一個(gè)包),而接收方的接收就無法同樣定時(shí)了,有時(shí)一個(gè)周期內(nèi)一個(gè)包都接收不到,有時(shí)一個(gè)周期內(nèi)接收到好幾個(gè)包。如此,導(dǎo)致接收方聽到的聲音就是一卡一卡的。
      JitterBuffer工作于解碼器之后,語音播放之前的環(huán)節(jié)。即語音解碼完成后,將解碼幀放入JitterBuffer,聲卡的播放回調(diào)到來時(shí),從JitterBuffer中取出最老的一幀進(jìn)行播放。  
  JitterBuffer的緩沖深度取決于網(wǎng)絡(luò)抖動(dòng)的程度,網(wǎng)絡(luò)抖動(dòng)越大,緩沖深度越大,播放音頻的延遲就越大。所以,JitterBuffer是利用了較高的延遲來?yè)Q取聲音的流暢播放的,因?yàn)橄啾嚷曇粢豢ㄒ豢▉碚f,稍大一點(diǎn)的延遲但更流暢的效果,其主觀體驗(yàn)要更好。
      當(dāng)然,JitterBuffer的緩沖深度不是一直不變的,而是根據(jù)網(wǎng)絡(luò)抖動(dòng)程度的變化而動(dòng)態(tài)調(diào)整的。當(dāng)網(wǎng)絡(luò)恢復(fù)到非常平穩(wěn)通暢時(shí),緩沖深度會(huì)非常小,這樣因?yàn)镴itterBuffer而增加的播放延遲就可以忽略不計(jì)了。
4.靜音檢測(cè) VAD

      在語音對(duì)話中,要是當(dāng)一方?jīng)]有說話時(shí),就不會(huì)產(chǎn)生流量就好了。靜音檢測(cè)就是用于這個(gè)目的的。靜音檢測(cè)通常也集成在編碼模塊中。靜音檢測(cè)算法結(jié)合前面的噪聲抑制算法,可以識(shí)別出當(dāng)前是否有語音輸入,如果沒有語音輸入,就可以編碼輸出一個(gè)特殊的的編碼幀(比如長(zhǎng)度為0)。
      特別是在多人視頻會(huì)議中,通常只有一個(gè)人在發(fā)言,這種情況下,利用靜音檢測(cè)技術(shù)而節(jié)省帶寬還是非?捎^的。

5.混音算法

      在多人語音聊天時(shí),我們需要同時(shí)播放來自于多個(gè)人的語音數(shù)據(jù),而聲卡播放的緩沖區(qū)只有一個(gè),所以,需要將多路語音混合成一路,這就是混音算法要做的事情。即使,你可以想辦法繞開混音而讓多路聲音同時(shí)播放,那么對(duì)于回音消除的目的而言,也必需混音成一路播放,否則,回音消除最多就只能消除多路聲音中的某一路。
      混音可以在客戶端進(jìn)行,也可以在服務(wù)端進(jìn)行(可節(jié)省下行的帶寬)。如果使用了P2P通道,那么混音就只能在客戶端進(jìn)行了。如果是在客戶端混音,通常,混音是播放之前的最后一個(gè)環(huán)節(jié)。

      綜合上面的概念模型以及現(xiàn)實(shí)中用到的網(wǎng)絡(luò)語音技術(shù),下面我們給出一個(gè)完整的模型圖:

我們只是對(duì)圖中各個(gè)環(huán)節(jié)做了一個(gè)最簡(jiǎn)單的說明,而任何一塊深入下去,都可以寫成一篇長(zhǎng)篇論文甚至是一本書。所以,本文就算是為那些剛剛接觸網(wǎng)絡(luò)語音系統(tǒng)開發(fā)的人提供一個(gè)入門的地圖,給出一些線索。

評(píng)帖賺銀幣(0) 收起
分享到:  QQ好友和群QQ好友和群
收藏收藏
板凳
發(fā)表于 2018-3-9 07:33:53 | 只看該作者
真的牛,雙手贊成,謝謝了
評(píng)帖賺銀幣(0) 收起

本版積分規(guī)則

Archiver|手機(jī)版|小黑屋|灰鴿子遠(yuǎn)程控制軟件|灰鴿子遠(yuǎn)程控制軟件 ( 魯ICP備14000061號(hào)-4 )

GMT+8, 2025-5-17 21:12 , Processed in 0.067225 second(s), 30 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回復(fù) 返回頂部 返回列表