繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

飛利信實現會議場景實時人工智能降噪算法及核心部件技術突破

2025-09-26 17:25

噪聲抑制新突破:

飛利信AI降噪技術重塑會議音頻體驗新標準

在現代會議環境中,空調運行聲、鍵盤敲擊聲及遠程參會者的環境噪聲往往交織疊加,嚴重影響溝通效率與會議質量。為此,北京飛利信科技股份有限公司正式發佈會議場景專用人工智能降噪算法及配套核心硬件,基於公司在聲學處理與人工智能領域的長期技術積累,實現了AI聲學感知能力在會議場景中的深度融合,為政務會議、企業協作等場景帶來音頻體驗的跨越式提升。

技術架構突破:

構建新一代會議降噪技術體系

本次發佈的AI降噪系統基於三大核心技術突破,重新定義了會議音頻處理的技術標準:

智能算法架構:採用深度神經網絡模型,基於超過數十萬小時的真實場景噪聲數據進行訓練,能夠精準識別並抑制突發性衝擊噪聲(如玻璃破碎)、非平穩噪聲(如交通噪聲)以及寬頻穩態噪聲(如通風系統噪聲)。相較於傳統基於固定閾值的降噪方法,本系統在噪聲適應性與語音保真度方面實現顯著提升。通過時頻域聯合分析與語音特徵分離技術,在高效降噪的同時完整保留語音諧波結構與人聲自然度,徹底解決傳統降噪算法常見的「機器人聲」失真問題。算法與硬件層深度融合,實現計算延迟降低三個數量級。

專用硬件平臺:配套推出的AI圓形陣列麥克風具備360°全向拾音與聲源定位能力,結合內置語音處理單元(VPU)加速架構,在48kHz採樣率、32位精度條件下,實現端側推理延迟低於9ms,內存佔用低於512KB。該設備可無縫集成於飛利信智能會議系統,並與身份識別、智能表決等終端形成協同作業能力。

多場景自適應:創新性地集成「近場+遠場」雙工作模式,全面覆蓋本地會議室與遠程視頻會議場景,兼顧低延迟處理與高語音可懂度的雙重要求。

應用場景拓展:

從政務會議到企業協同的全方位賦能

作為在智能會議領域具備二十余年技術積累的領先企業,飛利信長期服務於全國兩會等國家級高規格會議場景。本次AI降噪技術的突破,將進一步擴展其應用邊界:

政務會議場景:為重大決策會議提供「零干擾」音頻環境,顯著提升議事效率與決策質量;

企業協作場景:有效解決開放式辦公與跨地域會議中的音頻痛點,結合AI融媒體平臺,語音轉寫準確率提升40%以上;

行業特殊場景:適配能源、交通等行業的户外巡檢與移動會議需求,結合物聯網技術,構建「語音清晰、狀態可視」的協同作業體系。

戰略佈局:

AI技術驅動音視頻產品體系升級

本技術成果是飛利信推進「AI+音頻」產品化戰略的重要里程碑。公司正加速將AI音視頻技術從政府市場向企業級與消費級領域延伸,構建「AI一體機+場景化解決方案」的雙軌產品生態。該降噪技術不僅將全面提升現有會議系統的音頻性能,也為具身智能交互、AI訓練仿真等新興領域提供了高可靠性的聲學感知基礎,進一步強化了公司在技術創新與產品化方面的綜合競爭力。

從國家級會議的高標準保障到企業日常協作的體驗升級,飛利信持續以技術創新推動行業標準演進。此次AI降噪算法與核心部件的成功研發,標誌着中國智能會議技術正式進入「自適應聲學感知」新階段。未來,飛利信將繼續深化人工智能與產業應用的融合創新,致力於讓每一次溝通都更加清晰、高效、自然。

技術驗證:

深度AI降噪算法性能分析

飛利信基於自研圓形陣列麥克風開發板,成功集成深度人工智能降噪算法。該算法通過模型結構優化與硬件底層加速,具備卓越的實時性與確定性低延迟特性,完全滿足高實時性會議場景的嚴苛要求。

該技術能夠有效識別並抑制各類環境噪聲,同時精準保留人聲成分,顯著提升語音清晰度與可懂度。以下為算法在不同噪聲環境下的語譜圖對比分析:

圖 1 飛利信圓形陣列麥克風開發板示意圖

圖2 白噪聲環境下AI降噪前后語譜圖對比

圖3 多人交談噪聲(babble)環境下AI降噪前后語譜圖對比

圖4 鍵盤噪聲環境下AI降噪前后語譜圖對比

降噪前的語譜圖顯示,語音信號被寬頻背景噪聲嚴重掩蓋,表現爲全頻段連續分佈的穩態噪聲與突發性非穩態噪聲斑塊,嚴重影響語音成分的可辨識度。經AI降噪處理后,噪聲基底得到顯著抑制,語譜圖背景趨於純淨,語音結構完整保留:元音共振峰條紋連續清晰、能量集中,清輔音的高頻細節明顯增強,系統在強噪聲環境下仍保持優異的語音保真度與聽覺自然度。

(飛利信)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。