繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

打造2700萬聽障者的「翻譯官」與銀發族的「數字助手」,百度ESG實踐的技術温度

2025-07-21 17:03

6月13日,廣東時代傳媒集團主辦的「2025ESG與高質量發展創新論壇」在京舉行,論壇聚焦全球產業變革下的高質量發展路徑,並揭曉了年度「ESG金羚優秀實踐案例」。百度集團成功入選「2025年度ESG典範企業」。

當我們深入瞭解百度智能雲智慧養老團隊與AI手語數字人團隊的實踐現場,能清晰看到一條以技術突破解決聽障人士的就醫場景、獨居老人生活問題等真實社會痛點的ESG 路徑。

圖源:AI製作 圖源:AI製作

手語數字人:讓2700萬聽障者被「看見」

當談及百度為什麼要做手語數字人,「盲人的行動不便總能被注意到,但聽障者因外觀與普通人無異,常常被忽略需要幫助」。百度智能雲曦靈手語數字人團隊負責人魏琪告訴筆者。

據2006年第二次全國殘疾人抽樣調查,我國有2780萬聽力言語殘疾人,佔殘疾人總數的三分之一。

百度智能雲曦靈手語數字人相關技術研發最早始於2021年。2022年,北京舉辦大型體育賽事冬奧會,全球矚目。當時,爲了讓聽障羣體更好的觀看和實時理解賽事解説,百度智能雲的數字人團隊首次將3D數字人技術與手語翻譯結合,AI手語翻譯的直播吸引了超過1億人次觀看,百度智能雲曦靈手語數字人是官方唯一合作伙伴。不過,由於手語動作與語速難以同步,當時受限於技術,專業術語翻譯準確率不足,最終依賴大量人工校驗才完成服務。

賽后,感受到用户需求,百度智能雲曦靈手語數字人產品團隊開始加快投入雙向手語翻譯機的研發及生產。2023年,百度推出了AI手語平臺,研發了針對線上場景的AI手語數字人和針對線下場景的雙向手語翻譯機,這種一體機既能打出手語,也能翻譯手語,能夠在輸入和輸出兩個方面幫助聾人對外溝通交流。

但產品研發仍需繼續迭代。2023年,百度智能雲曦靈手語數字人團隊通過與手語專家和聾人羣體的接觸和交流,瞭解到對於聽障人士而言,不同城市、不同地區之間的手語表達因方言存在區別,沒有絕對通用的手語詞典。有趣的是,如果把不同城市的聽障人士安排一起幾個小時后,大家很快就能無障礙交流,這背后可能存在聽障人士獨特或相近的交流習慣。

因此,做智能手語翻譯的關鍵難題是「手語翻譯不是簡單的手勢對應,它有聽障人士的語法邏輯,而聽障人士詞匯量遠超現有語料庫覆蓋範圍,且實際生活詞匯量遠超手語辭典中的詞匯量,需要更多的手語範本加入語料庫。除了補充詞匯,翻譯模型需要學會理解、拆分、組合,來對文本進行手語翻譯。」

對於手語翻譯模型而言,許多伴隨社會發展新誕生的特定場景詞匯也需要學習和擴充。以機場的「值機」為例,首先要讓翻譯模型理解「值機」,再瞭解可以如何組句子,最后才能進行合理翻譯。

面對龐大的詞匯數據收集、錄入及校驗工作,百度智能雲曦靈手語數字人團隊在數據收集環節聯動了上百位聽障人士和手語專家,並和天津理工大學聾人工學院共同制定了面向人工智能應用的自然手語標註規範,建設了大規模自然手語翻譯語料庫。天津理工大學聾人工學院自1991年開創我國聾人高等教育的先河,素有「聾人小清華」美譽,也是世界四大聾人高等工科院校之一。

在語料庫打造方面,以前的手語數字人動作僵硬,就像「沒有感情的翻譯機器」,但真實的手語里,皺眉、撇嘴、點頭都是表達的一部分,是表達情感和增強交流效果的重要因素。

為此,團隊請來了多位聽障人士和手語專家,查閲了整套《國家通用手語詞典》,進行表情數據的收集、歸納、錄製並逐個精修,豐富手語數字人的理解和表達。

圖源:百度提供 圖源:百度提供

AI浪潮帶來的技術革新,能夠讓手語數字人翻譯的精簡度和準確度都有所提升。

此前,團隊在走訪天津理工大學聾人工學院時,認識了天津理工大學聾人工學院的學生明靜,明靜每次走進醫院,都被護士或是分診台導醫勸説回家帶上父母再來。每一件日常小事,對於聽障人士而言都困難重重。而當明靜接觸手語數據的採集工作並體驗產品交互性測試后,她非常開心,「終於有人開始做這件事了」。

在這個探索過程中,百度的技術突破沉澱了多項專利,例如,虛擬數字人處理、數字人表情生成、驅動數字人的模型訓練等專利。比如在手語數字人表情生成相關專利中,通過表情生成模型可以實現手語數字人在表達不同情感時擁有相應的表情,如高興、悲傷、驚訝等,使手語數字人的表達更加生動、富有感染力。據瞭解,百度數字人相關專利申請量已經超過1000件,這些專利為數字人技術在手語場景的應用提供着更加堅實的技術保障,也是百度在數字人技術領域不斷探索的證明。

目前,百度智能雲曦靈手語數字人已經能夠識別語音、打出手語,在實時直播中用數字人形象進行手語同步翻譯,通過百度數字人4D掃描技術訓練的AI手語數字人,不僅能呈現出真實生動的面部表情,還可以如真人般流暢表達11000多個符合《國家通用手語詞典》的手語動作,助力聽障羣體溝通。

魏琪在一次與聾人學生的線下交流中,詢問對方覺得手語數字人是否有用?對方回覆:「有用。」隨后又描述了自己的體驗感,以及相信「未來可以達到的效果」。

魏琪表示:「百度的團隊在研發這個產品時,不單單考慮盈利,也會追求商業價值之外的社會意義。如果他沒有告訴我,我有時會以為做這件事的價值感是自己理想主義的幻想,但當這名學生表示相信時,會帶給我繼續投入的信心。」

圖源:百度提供 圖源:百度提供

智慧養老:幫助銀發羣體跨越數字橋樑

除了聽障人士,銀發羣體也是互聯網時代不可忽視的羣體。2023年,工信部曾專門發文提出《促進數字技術適老化高質量發展工作方案》,其中提出要優化數字化技術適老化服務用户體驗。根據最新普查數據,我國60歲及以上人口已經超過3.1億人。

圖源:百度提供 圖源:百度提供

在百度智能雲居民服務團隊的養老產研負責人孫宇慧看來,老年羣體的數字困境遠不止「把APP字體變大」這麼簡單。孫宇慧告訴筆者,自從研發智慧養老產品,團隊驚訝地發現一件事,全國各地老年大學都有手機課,重複教授智能手機基礎操作,但這門課每月的老人復報率超過50%。

「不是老人學不會,是現在的智能設備根本沒考慮他們的習慣。」孫宇慧表示。例如,早期互聯網產品的系統採用傳統 NLP 技術,要求精準指令,可老人容易手抖,點不準屏幕上的功能按鈕,此外,老年人對於年輕人習以為常的「左滑刪除」等產品使用邏輯也陌生。這意味着適老化改造需要更深層的突破。

爲了瞭解更多的老年用户使用習慣,獲取更真實的需求場景,孫宇慧沒有選擇坐在辦公室思考,而是選擇實地調研。2023年,他曾在山東淄博、天津河西區等地駐點兩三個月,反覆上門傾聽了解老年人的使用體驗反饋,手把手的教學、記錄、調整產品需求。

通過反覆調整產品設計,百度居民服務團隊已打造了面向銀發經濟、社區經濟、基層服務和治理場景的產品矩陣,包含標準化的居民服務智慧終端、居民服務輕應用、企業運營SaaS、政府監管Saas等。

百度智慧養老AI系統研發負責人宋瑞東介紹:「該產品矩陣構建於文心大模型(包括ERNIE 4.5、ERNIE Speed等大小模型)構建的多智能體(Multi-Agent)架構,能夠實現多個智能體間的自主協同,適應老年人多樣化的使用場景,可覆蓋生活助理、健康監測、安全預警、媒資娛樂、訂餐購物等複雜需求,實現跨場景、一體化的智慧服務體驗。

通俗來講,通過一整套覆蓋醫療、就餐、團購、問答等不同場景的多個產品組成的智能體產品矩陣,搭載在百度的小度智能屏硬件等終端上,老人可以面對一個智慧終端產品,通過AI大模型的自然語言對話能力,通過語音對話可以輕松表達清楚自己的需求,從而在產品矩陣中自動調用相應場景的智能體。

「例如,當老人説:‘我家馬桶壞了,需要疏通馬桶。’管家智能體就會幫老人預約上門服務解決訴求。因此,產品矩陣是由多個智能體自主理解需求后調用相應產品滿足老人各種各樣的任務。」宋瑞東舉例道。

當這套智能體產品矩陣要落地到硬件終端,還藏着不少「反常識」的調整。

孫宇慧以實際調研中的「下單購物頁面是否需要購物車」的場景舉例。通常購物APP都有購物車,但團隊發現,老年人習慣和需求場景具備特殊性。

「他們不會像年輕人一樣‘逛’購物平臺,而是通常有明確需求‘買雙布鞋’等情況下才去購物,加上考慮到防誘導等因素,老年人購物場景可能不需要購物車,看準產品直接下單。而在食堂吃飯的場景中,就餐肯定需要一次點多個菜和主食,而點一個菜付款一次十分不便,這時候購物車就成了剛需。」孫宇慧説道。

此外,百度的這套產品矩陣的記憶模塊還能通過大模型提煉總結出關鍵信息,形成用户長期記憶,記錄老人健康狀況、飲食習慣、購買偏好等信息;在不同的場景下,Agent會根據老人的個性化特徵,做出針對性的建議與回覆。

而這些場景,不能單純靠邏輯推理,而老人用實際場景教會我們怎麼做。宋瑞東認為,智慧養老思考下研發的產品,是要讓產品從「聽不懂」到「會辦事」,圍繞老人的需求進行升級。

爲了相關技術創新,百度智能雲已對相應的智慧養老方案所涉及技術進行專利佈局,這套名為「養老服務管理方法」的專利技術,聚焦老齡社會服務痛點,融合語音識別、物聯網與AI技術,打造「零門檻」智慧養老體系。老年人可通過語音自然交互實現就餐、就醫、預警等服務調用,突破操作障礙。系統聯動感知設備,實現服務閉環與主動響應,顯著降低人工成本,重塑高效、安全、有温度的養老體驗。

圖源:百度提供 圖源:百度提供

目前,百度居民服務團隊近兩年已服務超過100+客户,覆蓋泰康保險、中國平安、全景醫學等行業巨頭。百度還積極參與並助力制定了由住建部、工信部牽頭的團體標準《基於智能家居的智慧物業居家養老總體技術要求》,為大模型在居家養老行業應用做出顯著貢獻。截至目前,已累計服務超過10萬用户。在大模型智能體的加持下,用户體驗實現質的飛躍。

事實上,百度的ESG實踐並非侷限於單一領域。在技術賦能社會的版圖上,AI手語數字人與智慧養老只是其中兩塊重要拼圖。

在人才培養與就業領域,百度2020 年提出的「5年內培養500萬Al人才」計劃已在2024年提前完成。在Create2025百度AI開發者大會上,百度創始人李彥宏宣佈,未來5年,百度將加大力度,再為社會培養1000萬AI人才。

此外,百度聯合武漢市總工會推出的「勞動者第二技能學習平臺」提供豐富的專家課程資源,為武漢308萬名職工和2.1萬個基層工會組織提供技能培訓,幫助傳統勞動者實現AI轉型。目前已在北京、廣州、武漢、南京等多個省市開放。

而在AI守護未成年人數字安全方面,2024年,百度清理了596億余條有害信息,通過設立專項審覈小組,訓練大模型精準識別高風險內容,使涉及未成年人的有害信息量下降了74%,守護青少年的數字安全與自由。

技術投入的背后是人工智能領域持續的研發支撐。截至2024年底,百度AI全球專利申請超過2.7萬件;AI全領域中國專利申請超過2.2萬件,授權超過1.2萬件,連續7年AI專利申請量位居國內第一。

這些實踐和成果,成為百度成功入選「2025年度ESG典範企業」的重要註腳。羚羊善於跳躍、長於奔跑,靈動而優雅。它適應性亦極強,棲居在草原、漫灘、沼澤甚至沙漠。硅谷亦有「瞪羚企業」一説,它們具有與「瞪羚」共同的特徵——跑得快、跳得高、活力強。「金羚」這一概念正是借鑑了羚羊的特質,寓意着企業應以「瞪羚」的韌性適應環境(E)的新要求,以協同能力協調社會(S)的新需求,以敏捷性響應治理(G)的新變化。

過去多年,百度推動智能雲、智能交通等低碳方案落地,利用AI技術幫助聽障人士便利生活、輔助視障開發者開展技術研發、守護瀕危動物、提升老年人生活質量,推動技能普及與AI人才培養,通過AI賦能可持續發展,不斷嘗試「用科技技術讓複雜的世界更簡單」,用實際行動詮釋「技術向善」並持續創造更廣泛的社會價值。技術的研發應用永無止境,而人類運用技術讓生活更美好的探索也將不斷向前。

(文中魏琪、孫宇慧為化名)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。