我們非常重視您的個人隱私,當(dāng)您訪問我們的網(wǎng)站時,請同意使用的所有cookie。有關(guān)個人數(shù)據(jù)處理的更多信息可訪問《隱私政策》

001002.png
【媒體聚焦】開放式音頻系統(tǒng)引入AI大模型,藍(lán)牙音頻SOC邁向高端化
2024-07-17
閱讀量2603
分享

電子發(fā)燒友網(wǎng)報道 隨著技術(shù)的迭代以及市場需求的興起,智能眼鏡作為一種新型智能穿戴設(shè)備,可以通過獨立的操作系統(tǒng),安裝各種應(yīng)用程序,并通過語音、手勢,或者與智能手表、智能手機(jī)的聯(lián)動,實現(xiàn)多種功能,如今正逐漸成為市場的焦點。

不過智能眼鏡設(shè)備不能忽視的挑戰(zhàn)是其開放式音頻系統(tǒng),音頻作為智能眼鏡最基礎(chǔ)的功能,在完成多種交互體驗之外,如何實現(xiàn)更好的音頻體驗,也是需要不斷突破的技術(shù)難題。

AI技術(shù)加持,推進(jìn)藍(lán)牙音頻SOC的高端化

OWS耳機(jī)、智能音頻眼鏡等產(chǎn)品,對開放式的音頻系統(tǒng)提出了更高的要求。面對開放式的音頻系統(tǒng),主控芯片的技術(shù)瓶頸、難點是在哪里?

物奇微藍(lán)牙產(chǎn)品線銷售負(fù)責(zé)人陳武清在接受電子發(fā)燒友網(wǎng)采訪時表示,開放式的音頻系統(tǒng)有著三大挑戰(zhàn),一是低頻泄露問題,二是大回聲結(jié)構(gòu)下的通話效果和運動風(fēng)噪場景下的通話質(zhì)量問題,三是輕巧舒適結(jié)構(gòu)狀態(tài)小尺寸的設(shè)計對電池的要求的低功耗。

為了符合人體工學(xué)的設(shè)計,大多數(shù)OWS耳機(jī)都采用U型聲學(xué)腔體結(jié)構(gòu),內(nèi)部搭載了發(fā)聲單元,例如SoundPEATS 的GoFree2,以及beyerdynamic拜雅的VERIO 200都搭載了超大16.2mm動圈單元。較大的動圈單元在低頻響應(yīng)和聲壓級上有更好的表現(xiàn),但依舊解決不了低頻泄露、通話效果、降風(fēng)噪等方面的挑戰(zhàn)。

陳武清提到,開放式耳機(jī)的通話大回聲結(jié)構(gòu)存在mic-spk間距短,聲隔離弱、信回比低的問題,相對入耳式,有效回波損耗 (ERL) 小近20dB、通話回聲雙講效果差。

同樣有著開放式音頻系統(tǒng)的智能眼鏡,在音頻系統(tǒng)存在的挑戰(zhàn)不比OWS耳機(jī)小。一般而言,OWS耳機(jī)會通過不同的人體工學(xué)結(jié)構(gòu)設(shè)計,讓前出聲孔靠近耳道,改善開放式音頻系統(tǒng)的音量、低音體驗等問題,這些不同的人體工學(xué)設(shè)計雖然治標(biāo)不治本,但都能夠在一定程度上提升音頻體驗。而智能眼鏡的音頻系統(tǒng)在鏡腿的位置,難以通過上述方式進(jìn)行改善。

隨著技術(shù)的發(fā)展,AI已經(jīng)成為提升開放式音頻系統(tǒng)音頻體驗的關(guān)鍵技術(shù)之一。據(jù)了解,物奇的多模態(tài)AI能力已經(jīng)落地多個領(lǐng)域,其中邊緣計算AI處理技術(shù)已經(jīng)引入藍(lán)牙音頻SOC中。

為了提升開放式音頻系統(tǒng)的通話質(zhì)量,物奇基于先進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò),經(jīng)過40G的大量數(shù)據(jù)訓(xùn)練大模型,加上LMS+KLM雙濾波結(jié)構(gòu),線性回聲抑制能力達(dá)30dB,非線性殘余回聲引入AI處理。在降風(fēng)噪等方面,通過多麥技術(shù)、神經(jīng)網(wǎng)絡(luò)算法的加持,通過大量風(fēng)噪數(shù)據(jù)訓(xùn)練AI模型,達(dá)到了風(fēng)噪殘留少、語音穩(wěn)定,損傷小,可辨度高的效果。

相較以往只是在算法上做處理,加入邊緣計算AI處理技術(shù)能夠?qū)崿F(xiàn)更清晰的通話質(zhì)量,在很大程度上提升了開放式音頻系統(tǒng)的音頻體驗。

在功耗方面,智能眼鏡的藍(lán)牙芯片、傳感器、麥克風(fēng)等元器件基本放在鏡腿的位置,受限于空間的限制,一般只能采用容量較小的電池,因此續(xù)航性能較差,此時需要藍(lán)牙芯片也要有強(qiáng)大的低功耗性能。

物奇的藍(lán)牙芯片在提升續(xù)航方面帶來創(chuàng)新和突破。率先采用RISC-V + DSP的設(shè)計架構(gòu),以及多模塊化處理的軟件SDK。以O(shè)WS的應(yīng)用為例,物奇可以在芯片級功耗只有3.xmA的情況下,增加了針對OWS形態(tài)必須增加的低頻補(bǔ)償/虛擬低音/動態(tài)EQ和多MIC AI的ENC等算法,讓功耗維持在4.xmA的低功耗水平,“在45mAh的電池容量下,聽音樂可以使用10小時”。

在芯片廠商的技術(shù)迭代下,AI技術(shù)在音頻處理上的應(yīng)用取得了新的進(jìn)展,AI技術(shù)引入藍(lán)牙音頻SOC,成為藍(lán)牙音頻SOC走向高端的象征之一,由此也將推動音頻市場的創(chuàng)新和進(jìn)步。

音頻眼鏡將在音頻設(shè)備市場上逐漸起量

今年一季度,全球個人智能音頻設(shè)備市場迎來6%的同比增長,出貨量超過9000萬臺。在TWS耳機(jī)、無線頸掛式、無線頭戴式三大類產(chǎn)品中,TWS耳機(jī)品類已經(jīng)出現(xiàn)增長乏力,筆者認(rèn)為,接下來OWS耳機(jī)、智能音頻眼鏡將成為智能音頻設(shè)備市場中增長明顯的細(xì)分品類。

如果從智能眼鏡這個大品類來看,智能音頻眼鏡這一品類也會首先在市場上起量。陳武清認(rèn)為在AI/智能音頻/AR智能眼鏡三大品類中,智能音頻眼鏡會率先起量,其次是AI眼鏡,最終朝著包含音頻/視頻/內(nèi)容為一體的AR智能眼鏡方向演進(jìn)。

“智能音頻眼鏡會先開始起量,在當(dāng)前技術(shù)背景下優(yōu)先解決輕巧和輕度語音處理的問題,其次通過技術(shù)的演進(jìn)延伸到可以具備AI語音處理能力的AI眼鏡,再繼續(xù)演進(jìn)到包含音視頻及內(nèi)容為一體的AR智能眼鏡,需要解決痛點非常多?!?/span>

陳武清表示,對于芯片而言,主芯片平臺需要高集成度以及豐富的外設(shè)接口和AI處理能力,在各種各樣的語音/視頻處理算法的加持下,維持高算力下的低功耗要求。

從長期的演進(jìn)來看,信息/數(shù)據(jù)經(jīng)過終端的基礎(chǔ)處理后,會到云端做進(jìn)一步的處理,因此設(shè)備在終端的處理會越來越多,同時在云端處理的需求也會增長。隨著智能眼鏡需要處理的場景越來越多,云端也需要有更強(qiáng)的能力去應(yīng)對這些處理任務(wù)。但在這之前,終端設(shè)備的主芯片平臺需要更加強(qiáng)大應(yīng)對更復(fù)雜的終端處理任務(wù),芯片廠商也需要持續(xù)迭代產(chǎn)品推出更具競爭力的芯片。