熱門資訊> 正文
2025-07-28 17:09
本文來源:時代財經 作者:郭美婷

「2019年,我們還在討論單點突破的語言模型;到2025年的今天,大模型已呈現‘周級迭代’的爆發態勢。」在WAIC 2025上,阿里雲副總裁、大數據和智能實驗室負責人葉傑平表示,當前AI模型技術正經歷從「漸進式創新」到「指數級躍遷」的轉變。
在今年WAIC的展區里,阿里巴巴(09988.HK;BABA.NYSE)展示了從AI基礎設施到大模型再到平臺及應用的「全棧AI」能力,陳列了雲原生CPU芯片倚天710、飛天雲計算操作系統、智算集羣網絡架構HPN7.0架構、AI Stack一體機等底層硬核技術,通義千問及通義萬相大模型系列,以及阿里雲百鍊、人工智能平臺PAI等大模型平臺和夸克、釘釘等AI應用。

這其中,包括最新開源的三款大模型:千問3最新版基礎模型(非思考版)、千問3推理模型、AI編程模型Qwen3-Coder。值得注意的是,這三款模型均是在一周內宣佈開源。
AI賽道上,阿里巴巴正在「狂奔」。按照預算,未來三年,這家巨頭還將投入3800億元,主要用於建設雲和AI硬件基礎設施,總額超過去十年總和。
一周內開源三款模型
「三年前,我們發佈了通義大模型,並承諾將核心模型開源開放。如今,通義千問已實現全尺寸、全模態的全面開源,真正打破了開源與閉源模型之間的技術壁壘。」葉傑平稱。
開源一直是阿里雲發展AI的主題詞,這一思路在今年由DeepSeek翻起的開源浪潮下愈發得到驗證。
據瞭解,千問3最新版基礎模型(非思考版)性能有顯著提升,在GPQA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(Agent能力)等測評中表現超越Claude4(Non-thinking)等閉源模型。
千問3推理模型支持256K上下文長度,在知識(SuperGPQA)、編程(LiveCodeBench v6)、數學(AIME25)、人類偏好對齊(Arena-Hard v2)、創意寫作(WritingBench)、多語言能力(MultilF)等核心能力上,千問3推理模型可比肩Gemini-2.5 pro、o4-mini等閉源模型。
AI編程模型Qwen3-Coder則是千問系列模型中首個採用混合專家MoE架構的代碼模型,總參數達480B,激活35B參數,原生支持256K token的上下文並可擴展至1M長度,能幫助程序員完成基礎編程任務,比如寫代碼、補全代碼、修Bug等。
海外模型API聚合平臺OpenRouter數據顯示,上述三大模型開源后,阿里千問API調用量暴漲,三天突破1000億Tokens,熱度超越GPT、Gemini、Claude等模型,千問包攬OpenRouter趨勢榜前三名。截至目前,通義千問在全球主要模型社區的下載量已經突破4億,衍生模型突破14萬個。
阿里雲百鍊高級產品專家徐志遠在接受時代財經等採訪時談到,千問系列模型在誕生之初就面向全球市場而非侷限於國內市場。國內市場方面,依託國內龐大的市場空間以及阿里雲自身的公共雲基礎產品,阿里雲更多通過API服務或低成本模式為用户提供支持。而在全球市場,若要參與競爭並實現模型能力的對比排序,開源是極為重要且有效的方式——它能讓全球開發者成為反饋主體,提供關於模型的直接反饋與信息,幫助阿里雲準確判斷模型在全球市場的真實水平。
事實上,阿里巴巴在開源上的相關實踐獲得海外認可也比在國內更早。徐志遠談到,「(在開源過程中)我們收到了全球開發者的反饋,這類反饋在商業場景中往往難以如此直接獲取,因為在開源生態中,開發者與我們並無絕對利益綁定,他們的反饋僅基於對模型問題的判斷,供我們參考迭代。」
20萬開發者、70萬Agent
阿里雲百鍊是全鏈路大模型服務與Agent應用開發平臺,據介紹,目前已有超20萬開發者在百鍊上開發了70多萬個Agent。
徐志遠表示,阿里雲百鍊目前核心包含三個層面的服務:第一個層面是基礎層,即結合阿里雲廣泛的基礎設施以及可調度的AI算力,將模型轉化為可供調用的高性價比、高性能API,也即「model service」(模型服務)層。
第二個層面是 agent(智能代理)層,在模型服務層之上,阿里雲百鍊整合了部分領先的agent框架與架構,為agent的開發構建提供一整套支持能力。在該層面,阿里雲百鍊提供包括兼容金融領域主流的ATO協議、MCP協議,以及支持阿里全棧自研的agent模型調度能力等。
第三個層面是AI大模型行業及領域應用層。在阿里雲百鍊上,開發者通過agent搭建基礎能力后,可進一步構建一系列行業及領域應用。目前,電力、互聯網、醫療、金融等行業,均已基於相關能力構建出面向企業內部及企業客户的各類應用。
據徐志遠介紹,在阿里雲百鍊服務的企業中,其中一個核心場景是多元異構複雜數據的處理。他舉例解釋,在如招聘平臺等互聯網平臺上,每天會產生大量視頻、音頻、文檔等,企業需要通過不同模態模型將內容轉化為所需數據,並對這些內容進行結構化提取、入庫、向量化或打標,以便用於下游的推薦匹配、分析解析等業務場景。
第二類是企業內部助理相關的應用,面向企業員工、內部子部門等提升生產效率。其他應用場景還包括以圖搜圖、以視頻搜視頻、IPC(網絡攝像機)等。例如,過去的IPC只有攝像頭組件,僅具備記錄功能,無法自主分析。而如今多模態模型不斷發展,尤其是輕量化多模態模型的出現,尺寸更小,使得大量上游廠商可以在IPC中內置多模態模型,讓設備能基於監控畫面快速判斷是否存在異常。今年3月,阿里巴巴就與KUMEROS咖啡達成戰略合作,為后者提供從門店運營到產品創新的全鏈路解決方案。
徐志遠進一步補充,具體到百鍊服務企業客户,目前頭部是互聯網行業,這是因為大量互聯網公司本身就以新技術驅動業務增長;其次是新消費行業,如咖啡門店等能在小程序等用户觸點中融入 AI 能力,幫助用户更好地完成消費,還依託自身基礎設施在內部業務中落地相關應用。
徐志遠還着重提到了消費電子領域,未來多模態組件等融入模型后,如AI玩具等AI消費設備有望實現增長。「近期我們已經看到該行業涌現出大量需求,也正在做豐富的適配工作,以提升消費電子行業對模型的應用能力。」徐志遠説。