久久精品人妻一区二区蜜桃-欧美精品人妻一区二区免费视频-久久精品免费一区二区喷潮-久久精品中文闷骚内射-精品bbw-精品久久无码中文字幕-小小水蜜桃3视频高清在线观看-日韩免费一级aaa片毛太久-欧美激情肉欲高潮无码鲁大师-欧美影片一区二区三区-亚洲精品无码av无码专区一本,波多野吉衣一区二区三区在线观看,囯精品人妻无码一区二区三区99,包哟哟在线观看免费观看

產品分類

當前位置: 首頁 > 工業(yè)電子產品 > 其他電子產品 > 麥克風

類型分類:
科普知識
數據分類:
麥克風

深度解讀麥克風陣列技術 語音交互應該選用怎樣的方案?

發(fā)布日期:2022-10-09 點擊率:189


  亞馬遜Echo和谷歌Home爭奇斗艷,除了云端服務,他們在硬件上到底有哪些差異?我們先將Echo和Home兩款音箱拆開來看,區(qū)別最大的還是麥克風陣列技術。Amazon Echo采用的是環(huán)形6+1麥克風陣列,而Google Home(包括Surface Studio)只采用了2麥克風陣列。這里想稍微深入談談麥克風陣列技術,以及智能語音交互設備到底應該選用怎樣的方案。

  什么是麥克風陣列技術?

  學術上有個概念是“傳聲器陣列”,主要由一定數目的聲學傳感器組成,用來對聲場的空間特性進行采樣并處理的系統(tǒng)。而這篇文章講到的麥克風陣列是其中一個狹義概念,特指應用于語音處理的按一定規(guī)則排列的多個麥克風系統(tǒng),也可以簡單理解為2個以上麥克風組成的錄音系統(tǒng)。

  麥克風陣列一般來說有線形、環(huán)形和球形之分,嚴謹的應該說成一字、十字、平面、螺旋、球形及無規(guī)則陣列等。至于麥克風陣列的陣元數量,也就是麥克風數量,可以從2個到上千個不等。這樣說來,麥克風陣列真的好復雜,別擔心,復雜的麥克風陣列主要應用于工業(yè)和國防領域,消費領域考慮到成本會簡化很多。

  

  為什么需要麥克風陣列?

  消費級麥克風陣列的興起得益于語音交互的市場火熱,主要解決遠距離語音識別的問題,以保證真實場景下的語音識別率。這涉及了語音交互用戶場景的變化,當用戶從手機切換到類似Echo智能音箱或者機器人的時候,實際上麥克風面臨的環(huán)境就完全變了,這就如同兩個人竊竊私語和大聲嘶喊的區(qū)別。

  前幾年,語音交互應用最為普遍的就是以Siri為代表的智能手機,這個場景一般都是采用單麥克風系統(tǒng)。單麥克風系統(tǒng)可以在低噪聲、無混響、距離聲源很近的情況下獲得符合語音識別需求的聲音信號。但是,若聲源距離麥克風距離較遠,并且真實環(huán)境存在大量的噪聲、多徑反射和混響,導致拾取信號的質量下降,這會嚴重影響語音識別率。而且,單麥克風接收的信號,是由多個聲源和環(huán)境噪聲疊加的,很難實現各個聲源的分離。這樣就無法實現聲源定位和分離,這很重要,因為還有一類聲音的疊加并非噪聲,但是在語音識別中也要抑制,就是人聲的干擾,語音識別顯然不能同時識別兩個以上的聲音。

  顯然,當語音交互的場景過渡到以Echo、機器人或者汽車為主要場景的時候,單麥克風的局限就凸顯出來。為了解決單麥克風的這些局限性,利用麥克風陣列進行語音處理的方法應時而生。麥克風陣列由一組按一定幾何結構(常用線形、環(huán)形)擺放的麥克風組成,對采集的不同空間方向的聲音信號進行空時處理,實現噪聲抑制、混響去除、人聲干擾抑制、聲源測向、聲源跟蹤、陣列增益等功能,進而提高語音信號處理質量,以提高真實環(huán)境下的語音識別率。

下一篇: PLC、DCS、FCS三大控

上一篇: 索爾維全系列Solef?PV

推薦產品

更多