熱門資訊> 正文
2025-01-10 12:20
當下,企業內部積累了海量且結構多樣的知識數據,包括業務手冊、技術文檔、政策法規、標準流程以及內部培訓資料等,而傳統的人工數據整理和查詢過程費時費力,愈發低效。如何在海量信息中又快又準地查詢到所需內容,為業務發展提供即時、可信的信息服務,成為企業數字化轉型及智能化升級亟待解決的問題。
我們人類查詢動態信息要藉助搜索而無法事先背誦記憶,遇到記不住的生僻字要查字典,在嚴肅場景發言時要依賴講稿。大模型也類似,事先訓練時用的數據集里缺少最新動態信息、個人或企業私有數據等,有時會一本正經地「胡說八道」,而通過外掛即時數據庫、私有知識庫、參考文檔等可以有效緩解。基於此,大模型的RAG(Retrieval-Augmented Generation,檢索增強生成)技術迅速崛起,成為有效破解這一難題的主流解決方案。
然而用户的實際需求和數據是多樣的,導致通用RAG在實踐中仍面臨多重挑戰,如檢索信息缺失、複雜PDF解析困難、無法提取特定內容、格式處理不佳、統計類問答能力缺失等。這些問題削弱了RAG在實際場景中的精度與可信度,亟需通過技術創新與優化進行解決。
中國聯通發揮其豐富業務場景和廣泛客户觸點等優勢,通過大量項目經驗歷練深耕與創新實踐打造了元景RAG技術,首批通過了信通院檢索增強生成評估,並獲得當前最高評級4+,並在企業真實落地場景中,進行了多項自主創新突破,例如級聯切分與自適應切分、多路檢索融合、OCR精準解析、富文本知識問答、融合代碼模型支持統計分析類問答、支持答案定位至出處等,顯著提升了RAG技術在真實場景中的召回率、問答準確率、及答案可追溯性。
目前,元景RAG已成功應用聯通內外部企業的多個項目中,成為助力企業智能化升級的關鍵引擎。
級聯切分
增強文本召回匹配度
元景RAG通過級聯切分技術,可以將原描述較長的文本塊逐級切分至與用户的問題長度相當、語義相似的短文本,以解決用户問題短,但文本塊描述較長導致的匹配相似度差的問題,提升信息檢索的召回率,確保每一次檢索都更加精準高效。
自適應切分
增強知識理解的完整性
在表格問答場景,傳統RAG切分容易導致完整描述被切斷,知識切片缺失表頭、標題等問題,影響信息檢索效果。元景RAG自適應切分可以做到自適應語料拆分與整合,為切片補全表頭、標題等關鍵信息,大大提升了表格問答場景的召回率和問答準確率。
多路檢索融合
增強檢索能力多樣性
檢索環節,聯通元景RAG技術在語義檢索的基礎上,擴展了稀疏向量、關鍵詞等多維檢索方式,對用户查詢詞進行全方位、多角度的檢索,實現信息的全面覆蓋和精準定位,最終融合各路檢索結果進行綜合排序,這一突破,讓信息檢索更加全面精準。
元景OCR解析
實現PDF內容精準查找
聯通元景自研攻關融合多種視覺模型解決RAG應用中PDF類文檔OCR識別(Optical Character Recognition,光學字符識別)、分欄順序、表格解析等難點瓶頸,實現PDF內容「查得更準、答得更對」,且基於實際數據集評測,元景RAG性能領先業界一流競品。
富文本知識問答
圖文並茂生成答案
除了解析、處理和回答文檔中的文本內容,元景RAG創新性的增加了對文檔中圖片等富文本知識的解析、處理和回答,可以根據用户提問找出文檔中的相關圖片,圖文並茂生成答案,使得答案更加直觀易懂。
融合代碼模型
支持統計類問答
傳統RAG問答主要以非結構化文本類知識問答為主,在結構化數據統計類問答方面能力不足。元景RAG通過融合代碼模型,在統計類問題中,能夠智能識別並檢索相關代碼和數據,利用代碼模型進行深度分析和計算,生成準確可靠的答案,為用户來帶統計類問答領域的智能體驗。
答案出處定位
追根溯源,有據可依
知識庫問答中,獲得答案固然重要,知道答案的來源也同樣關鍵。元景RAG在生成答案時,創新性的根據答案的出處,精準定位到答案在原文中的位置,這一功能增強了RAG生成答案的可信度和可追溯性,在專業知識問答領域尤其重要,可以幫助用户清楚瞭解答案來源,從而更加信任系統的輸出結果。
基於以上檢索、增強、生成等環節的多項突破性成果,聯通元景RAG在多個行業項目評測集中,召回率達到90%以上,問答準確率達到85%以上,達到業界領先水平。作為新質生產力的重要組成部分,元景RAG全方位賦能聯通內外部企業,助力企業實現數字化轉型和智能化升級,在醫院問詢、採購招投標、招生諮詢、辦公助手、黨建、設備故障診斷、專利開發等場景中打造了數十個行業標杆案例,在智能問答領域為用户提供了前所未有的智能、高效的信息獲取體驗。
在中山三院,依託聯通元景RAG技術打造的醫療智能問答助手,已經成為醫護人員日常工作中不可或缺的智能助手。無論是最新醫療政策的解讀,還是院內各類操作流程與規範的查詢,醫護人員都可以隨時隨地諮詢,輕松獲得準確、權威的答案,為工作提供強有力的支持。
中山三院醫療智能問答助手
中國聯通集團採購部基於聯通元景RAG技術打造了「聯通易達」應用,實現針對供應鏈領域近萬份法律法規、規章制度的智能諮詢服務,面向全國授權用户開放,為內部用户及合作伙伴查詢國家招投標法規提供隨身寶典,爲了解聯通採購規則提供專業指南,為挖掘潛在商機拓展業務合作提供合作錦囊。
聯通易達
為解決大學在招生階段無法快速回復學生、家長諮詢的需求,中國聯通與寧夏各高校達成合作,依託聯通元景RAG服務自研構建高校大模型智能問答助手,已在寧夏大學應用,可有效解決高校回覆不及時、不準確的問題,緩解高校在高峰期的答疑壓力。
寧夏大學智能問答助手
未來,聯通元景RAG將繼續探索和創新,為企業提供更多、更好、更智能的信息服務,持續推動人工智能的普惠化發展。