熱門資訊> 正文
2024-08-27 17:04
登錄新浪財經APP 搜索【信披】查看更多考評等級
人工智能產業已經發展許多年,但一直並未出現「殺手級」的應用,直至2022年OpenAI公司發佈ChatGPT,這款產品帶來了震撼的產品體驗,引領生成式技術浪潮,人工智能拉開了新一輪技術和產業革命。
語言大模型能夠模仿人類的對話和決策能力,是率先實現技術突破和應用落地的大模型,也是當下人工智能的「主賽道」。目前,語言大模型在金融、醫療、教育、工業、遊戲、法律等多個行業得到了廣泛的應用。
大語言模型的發展歷程雖然只有短短六年的時間,但是發展速度相當驚人,迄今為止,國內外有超過百種大模型相繼發佈。
2023年末,根據我國工信部數據,2023年全年我國語言大模型市場規模實現較快提升,應用場景不斷豐富,增長率突破100%。據統計,2023年,我國大語言模型市場規模為147億元。
根據SuperCLUE最新發布的大語言模型排行榜,國內大模型中,百川3、GLM-4、通義千問2.1以綜合得分73.32、72.58、72.45依此居於行業第一、二、三名。騰訊混元-pro、文心一言4.0、MoonShot(Kimichat)緊隨其后。
注:SuperCLUE是國內權威的通用大模型綜合性測評基準,一直致力於提供科學、客觀、中立的語言模型評測,為AI技術的發展樹立了重要標杆。該評分體系包括代表性的數據集、基準(預訓練)模型、語料庫、排行榜。評分體系會選擇一系列有一定代表性的任務對應的數據集,做為測試基準的數據集。這些數據集會覆蓋不同的任務、數據量、任務難度。
從產業鏈各環節的參與者來看,核心環節大語言模型平臺的建設由於技術密集程度較高、訓練成本巨大,因此,僅有部分少數互聯網巨頭可參與其中,搭建自研大語言模型憑條。產業鏈上游技術層面中,包括芯片生產、雲平臺搭建以及數據要素收集等,這些領域技術壁壘同樣較高,參與者均為互聯網、計算機行業頭部公司。
根據前瞻產業研究院報告《2024-2029年全球及中國大模型產業發展前景與投資戰略規劃分析報告》整理得出,2024年中國大語言模型行業十大代表性研發企業匯總如下(注:排名不分先后):
綜合來看,我國大語言模型行業主要參與者有百川智能、智譜AI、阿里巴巴、騰訊、百度等。
百川3
——北京百川智能技術有限公司
百川智能於2024年1月29日發佈了Baichuan 3,這是一款擁有超千億參數的大語言模型。在CMMLU、GAOKAO和AGI-Eval等評測中,Baichuan 3宣稱在中文任務上超過了GPT-4。 值得一提的是,不同於其他的大模型企業,百川智能是國內唯一一家專注醫療的大模型公司,並在AI醫療技術和應用上均取得了階段性進展,被稱為是「中文醫療任務表現最佳的大模型」。
據瞭解,百川智能在Baichuan 3的訓練過程中採用了多種技術手段和方案,包括「動態數據選擇」、「重要度保持」以及「異步 CheckPoint 存儲」。這些措施穩定了訓練時間達到一個月以上,並且故障恢復時間不超過10分鍾。此外,Baichuan 3還突破了「迭代式強化學習」技術,進一步提升了語義理解和生成能力,在詩詞創作方面也進行了改進。
根據企查貓數據顯示,百川智能成立於2023年4月10日,由前搜狗公司CEO王小川創立。公司的核心團隊由來自搜狗、百度、華為、微軟、字節、騰訊等知名科技公司的AI頂尖人才組成。
2024年7月28日,百川智能宣佈完成了金額達50億元人民幣的A輪融資,並且公司還將以200億元的估值開啟B輪融資。
百川智能此輪融資的投資方有阿里、小米、騰訊、亞投資本、中金等頭部大廠和市場化投資機構,也包括北京市人工智能產業投資基金、上海人工智能產業投資基金、深創投等國資背景產業投資基金。
GLM-4
——北京智譜華章科技有限公司
智譜AI是國內最早入局大模型賽道的公司之一,也是目前國內頭部大模型廠商代表之一。
2024年1月16日,智譜AI發佈新一代基座大模型GLM-4。
據官網報道,GLM-4的整體性能相比GLM-3有了顯著的60%提升,這一進步幾乎可與GPT-4相媲美。具體表現上,GLM-4可以支持128k的上下文窗口長度,單次提示詞可以處理的文本可以達到300頁。同時在多模態能力方面,文生圖和多模態理解都得到了增強。
據企查貓數據,智譜AI是一家專注於人工智能技術研發和應用的公司,成立於2019年6月,由清華大學的技術成果轉化而來。智譜AI的創始團隊來自清華大學計算機系KEG實驗室,一直致力於人工智能技術的研發和產業落地。
在2024年6月智譜AI Open Day上,智譜AI披露已有企業級客户30萬+,日均調用量達到 400 億 Tokens。
通義千問2.1
——阿里雲計算有限公司
阿里雲是國內最早開源自研大模型的科技企業。
2023年12月1日,阿里雲發佈通義千問閉源模型2.1版,相比前序版本,通義千問2.1的代碼理解生成能力、數學推理能力、中英文百科知識、幻覺誘導抵抗能力分別提升30%、10%、近5%和14%。
2024年8月15日,阿里巴巴發佈2025財年第一季度財報(截至2024年6月30日止三個月)。財報顯示,阿里巴巴該季度營收2432.4億元,上年同期營收2341.56億元,同比增長4%。
除了電商之外,阿里雲被視作阿里巴巴的另一核心業務。財報數據顯示,阿里雲本季度營收增長6%至265.49億元,其中AI相關產品收入實現三位數增長,公共雲業務實現兩位數增長,經調整EBITA利潤同比增長155%,單季度EBITA利潤達到23.37億元。具體來看,該季度阿里雲的外部收入(不包含阿里巴巴關聯公司用雲收入)同比增長達到6%,阿里雲AI平臺百鍊的付費用户數,比上一個季度增長超過200%。
根據企查貓介紹,阿里雲創立於2008年,是全球領先的雲計算及人工智能科技公司,為200多個國家和地區的企業、開發者和政府機構提供服務。
騰訊混元-pro
——深圳市騰訊計算機系統有限公司
騰訊混元大模型(Tencent Hunyuan)是由騰訊研發的大語言模型,該模型基於Transformer神經網絡架構,具有萬億參數規模,具備強大的中文創作能力、複雜語境下的邏輯推理能力,以及可靠的任務執行能力。
截至2024年7月30日,混元生文已上線6個版本,分別為hunyuan-pro、hunyuan-standard、hunyuan-lite、hunyuan-role、hunyuan-functioncall、hunyuan-code。
據瞭解,騰訊,全稱「深圳市騰訊計算機系統有限公司」,1998年11月由馬化騰、張志東、許晨曄、陳一丹、曾李青共同創立,2023年總收入6090.15億元。
2024年8月16日,騰訊控股發佈2024年第二季度財報。2024年第二季度騰訊實現營收1611.17億元,毛利858.95億元,經營利潤584.43億元,毛利和經營利潤增速分別達到21%和27%。
根據財報數據,目前騰訊混元大模型已在近700個騰訊內部業務和場景中落地;小遊戲的月活用户達5億人,小遊戲總流水同比增長超30%等。
文心一言4.0
——北京百度網訊科技有限公司
文心一言是中國公眾最早能夠體驗測試的AI大模型。2023年10月17日,在百度世界大會上,創始人、董事長兼首席執行官李彥宏正式發佈文心大模型4.0。
8月22日,百度集團發佈2024年第二季度財報,顯示季度總營收339億元,百度核心營收267億元,百度核心經營利潤56億元,同比增長23%,超出市場預期。其中,百度雲業務營收51億元,同比增長14% ,AI收入佔比9%。
據財報數據,百度文心大模型日調用量超6億次,近半年來增長超10倍,文心大模型日均tokens使用量超1萬億。值得注意的是,當前,百度搜索上18%的搜索結果由AI生成。
從容大模型V1.5
——雲從科技集團股份有限公司
2023年8月22日,雲從科技正式發佈從容大模型1.5版本。該版本包含十億級、百億級、千億級多種模型規格。
據介紹,此次1.5版本模型上下文長度(Context length)實現了32K Tokens,同時,從容大模型對中文編碼器進行了深度優化,一箇中文漢字平均僅佔0.7 Tokens,這使得從容大模型1.5版本支持的上下文長度超過4.5萬字。
雲從科技集團股份有限公司,簡稱「雲從科技(Cloudwalk)」,與商湯科技、曠視科技、依圖科技並稱為「AI四小龍」,該公司總部位於廣州,由周曦創立於2015年,孵化於中國科學院重慶綠色智能技術研究院,是一家人工智能科技企業。
2024年4月18日,雲從科技集團股份有限公司發佈2023年年度報告。數據顯示,2023 年營收6.28億(2022年5.26億);2023 年虧損6.43億(2022年虧損8.69億)。
4月30日,雲從科技發佈2024年一季度業績報告。從營收和利潤方面看,公司本報告期實現營業總收入5440.35萬元,同比增長19.99%,淨虧損1.61億元,虧損同比擴大11.62%,基本每股收益為-0.15元。
MiniMax-abab6.1
——上海稀宇極智科技有限公司
Minimax-abab6.5系列模型是MiniMax推出的萬億參數大語言模型,可以很好地滿足複雜生產力以及多語言人設對話場景需求,最大支持245k上下文窗口,在知識、推理、數學、編程、指令遵循等各項測試中接近行業最領先的大模型水平。
MiniMax稀宇科技是2021年12月成立的大模型初創公司,該公司已自研出文本到視覺、文本到語音以及文本到文本三個基礎模型。
2023年6月1日,MiniMax接近完成規模超2.5億美元的一輪融資,其估值有望達到近12億美元。MiniMax的最新一輪融資吸引到新的投資者,包括與騰訊有關聯的實體。據悉,MiniMax在此前的融資中吸引到米哈遊參投。其他早期投資者包括雲啟資本和明勢資本等。
MoonShot(Kimichat)
——北京月之暗面科技有限公司
Kimi Chat(Kimi)是月之暗面(Moonshot AI)於2023年10月推出的一款智能助手,主要有「長文總結和生成、聯網搜索、數據處理、編寫代碼、用户交互、翻譯」6項功能,是全球首個支持輸入20萬漢字的智能助手產品。作為對比,Anthropic的Claude-100k模型支持約8萬字,而OpenAI的GPT-4-32k只支持約2.5萬字。
截至2024年3月19日,Kimi智能助手累計下載量突破50萬次大關。
月之暗面(Moonshot AI),成立於2023年3月,迅速成為國內大模型領域的關鍵參與者。公司的核心團隊成員曾參與Google Gemini、Google Bard、盤古NLP和悟道等多個重要大模型項目的研發。
2024年8月6日,有消息稱騰訊參與國內大模型獨角獸、Kimi智能助手開發公司月之暗面(Moonshot AI)3億美元融資,這使得該公司估值提升至 33 億美元。對此,有接近公司的知情人士表示,此次騰訊參投消息屬實。而月之暗面則稱,對該融資消息不予置評。
根據企查貓數據,自成立起,月之暗面經歷了4輪融資,背后的股東陣營豪華,包括紅杉中國、真格基金、美團龍珠、藍馳創投、阿里巴巴、招商局中國基金、小紅書、騰訊以及高榕資本等一系列知名投資平臺。
山海大模型
——雲知聲智能科技股份有限公司
山海是雲知聲於2023年5月24日正式發佈的AGI領域大模型,其基於自建的300P算力Atlas智算平臺,構建起語言生成、語言理解、數理能力、代碼能力、知識問答、邏輯推理、安全合規、領域增強等十大能力,並逐步拓展出文生圖、文生視頻、圖片問答等多模態能力。目前,山海大模型已全面接入並重塑各類人工智能應用場景,在智慧醫療、智慧交通、智慧座艙等諸多場景實現落地應用。
2024年8月26日,雲知聲宣佈正式推出山海多模態大模型。據介紹,山海多模態大模型通過整合跨模態信息,山海多模態大模型可接收文本、音頻、圖像等多種形式作為輸入,並實時生成文本、音頻和圖像的任意組合輸出。基於多模態交互能力,可根據不同的場景和需求,模擬出各種人物性格和對話風格。
據企查貓數據,雲知聲成立於 2012 年,是我國作為國內AGI技術產業化的先行者,該公司專注於物聯網人工智能,擁有自主知識產權的智能語音人工智能企業。雲知聲業務主要覆蓋智慧生活和智慧服務兩大場景,在包括家居、車載、醫療、教育、政府、機器人等領域擁有廣泛佈局。
截至目前,雲知聲被曝再度向港交所更新招股書,繼續其申請上市進程,中金公司與海通國際為聯席保薦人。具體來看,報告期內,雲知聲的營業收入自2021年至2023年度,分別為4.56億元、6.01億元、7.27億元。
訊飛星火V3.5
——科大訊飛股份有限公司
訊飛星火認知大模型是科大訊飛發佈的大模型。該模型具有7大核心能力,即文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模交互,該模型對標ChatGPT。
2024年1月30日,科大訊飛舉行了訊飛星火認知大模型V3.5升級發佈會,會上,訊飛星火V3.5版本正式發佈,這是是首個基於全國產化算力平臺「飛星一號」訓練的全民開放大模型。
科大訊飛董事長劉慶峰表示,訊飛星火V3.5整體已經接近GPT-4水平;其在數學、語言理解、語音交互能力超過GPT-4Turbo。代碼能力方面達到了GPT-4 Turbo的96%,多模態理解能力也達到了GPT-4V的 91%。
截至發稿,訊飛星火仍在持續迭代。8月19日,科大訊飛股份有限公司發佈星火語音大模型更新,推出對標GPT-4o的語音功能產品——星火極速超擬人交互。星火極速超擬人可實現隨時打斷、插話后實時回覆,感知情緒變化,改變方言、情感和強度,還可以模仿不同角色進行交流。
根據科大訊飛2024年半年報,公司報告期內實現營業收入93.25億元,同比增長18.91%,毛利增長19.08%,銷售回款總額90億元,較去年同期增長15億元,增幅達20%。
其中,上半年,科大訊飛圍繞大模型相關的總投入超過13億,具體為圍繞通用大模型研發投入增加4億,圍繞大模型訓練推理平臺工程化的研發投入增加1.6億,圍繞大模型推廣和應用推廣投入增加1.2億,各BG、BU圍繞大模型產品化的投入增加超過6億。
大語言模型行業發展現狀及前景趨勢預測
大語言模型產業鏈區域分佈熱力圖
我國大語言模型產業鏈分佈主要集中在北京、上海、深圳、廣州、杭州等經濟發達的一線城市、新一線城市中,截至2023年11月,根據前瞻不完全統計,全國已有130個左右的大語言模型產品,其中,北京已有54個大語言模型公司,上海市有12個,深圳市11個,杭州市8個,廣州4個,成都3個,南京3個,其他地區11個。總體來看,大語言模型產業鏈分佈呈現明顯的區域化特徵,主要聚集在經濟發達地區。
注:該圖表數據截至2023年12月。
大語言模型市場規模預測
綜合來看,前瞻初步測算,到2027年,我國大語言模型市場規模將達到600億元,到2029年將達到1186億元,年複合增速在40%以上。
大語言模型發展趨勢預測
大型語言模型(LLMs)的發展趨勢預示着向更大規模、多模態交互、行業定製化、增強的可解釋性、強化的安全性與隱私保護、跨語言能力、開源協作、商業化服務、硬件協同優化,以及法規與倫理框架的構建方向發展。這些趨勢將共同推動LLMs在提升性能、拓寬應用場景、增強用户信任、促進技術共享與創新、加快企業集成和部署,以及確保社會責任和倫理標準等方面的進步,從而更廣泛地融入各行各業,實現AI技術的可持續和負責任的發展。
前瞻經濟學人APP資訊組
更多本行業研究分析詳見前瞻產業研究院《全球及中國大模型產業發展前景與投資戰略規劃分析報告》
同時前瞻產業研究院還提供產業新賽道研究、投資可行性研究、產業規劃、園區規劃、產業招商、產業圖譜、產業大數據、智慧招商系統、行業地位證明、IPO諮詢/募投可研、專精特新小巨人申報等解決方案。在招股説明書、公司年度報告等任何公開信息披露中引用本篇文章內容,需要獲取前瞻產業研究院的正規授權。
更多深度行業分析盡在【前瞻經濟學人APP】,還可以與500+經濟學家/資深行業研究員交流互動。更多企業數據、企業資訊、企業發展情況盡在【企查貓APP】,性價比最高功能最全的企業查詢平臺。