熱門資訊> 正文
2023-07-09 21:27
本報記者 李立 上海報道
正在上海舉行的2023年WAIC(世界人工智能大會),參展企業數量、展覽面積創下歷屆之最。超400家企業集中展示包括大模型、芯片、機器人、智能駕駛等領域的最新科技成果,ChatGPT大熱引發的「百模大戰」也在繼續。
《中國經營報》記者瞭解到,包括百度文心一言、科大訊飛星火認知大模型、華為雲盤古大模型、阿里雲通義千問、京東雲言犀大模型、清華大學ChatGLM、360智腦大模型等10余家廠商研發的基礎應用大模型,都將集體亮相WAIC。
WAIC同時也是新產品與新技術的秀場。7月7日,在2023世界人工智能大會上,阿里雲宣佈AI繪畫創作大模型「通義萬相」開啟定向邀測。這是繼大語言模型「通義千問」、聚焦音視頻內容的「通義聽悟「之后,阿里雲通義大模型家族的又一位新成員。
該模型可輔助人類進行圖片創作,未來可應用於藝術設計、電商、遊戲和文創等應用場景。阿里雲智能集團CTO周靖人表示,這是阿里雲大模型全面掌握多模態能力的關鍵一步,該能力將逐步向行業客户開放。
「通義萬相」亮相
周靖人在現場演示了「通義萬相」如何通過語言文字生成圖片。
當輸入「沉浸在全頁灰度塗色的迷人世界中,有一隻老虎在曼陀羅寧靜的森林中,畫面採用線條、筆畫」后,系統能迅速生成線條細節豐富的老虎圖片,如果繼續使用風格遷移功能,還可隨意切換圖片風格。
據阿里雲方面介紹,「通義萬相」將首批上線3大能力:在基礎文生圖功能中,可根據文字內容生成水彩、扁平插畫、二次元、油畫、中國畫、3D卡通和素描等風格圖像;在相似圖片生成功能中,用户上傳任意圖片后,即可進行創意發散,生成內容、風格相似的AI畫作;該模型還在業內率先支持圖像風格遷移,用户上傳原圖和風格圖,可自動把原圖處理為指定的風格圖。
據瞭解,「通義萬相」基於阿里研發的組合式生成模型Composer,其可通過對配色、佈局、風格等圖像設計元素進行拆解和組合,提供高度可控性和極大自由度的圖像生成效果,僅需一個模型即可支持多類圖像生成類任務能力。
在去年的世界人工智能大會上,阿里雲「通義」大模型系列首次亮相,在此之后,「通義千問」「通義聽悟」等模型和產品相繼推出,「通義萬相」的問世意味着阿里雲在大模型領域已經具備處理或生成文本、語音和圖片等模態的能力。目前,阿里雲大模型正逐步走進千行百業,已有超過30萬家企業申請測試「通義千問」,「通義聽悟」累計用户數達到36萬人。
「多模態是大模型演進的必然路徑,我們希望用不同模態的能力服務千行百業,幫助企業全面擁抱智能化時代。」周靖人表示。
意在「大模型生態」
不過加速發力大模型只是阿里雲發力大模型的A面,作為硬幣的另一面,搭建大模型生態,吸引更多的玩家進入,使其成為生態底座,顯然是更大的市場。
「找大模型上魔搭,我們將努力把魔搭社區培育成中國最大的‘大模型自由市場’。」周靖人在WAIC上廣撒「英雄帖」。
「阿里雲將把促進中國大模型生態的繁榮作為首要目標,向大模型創業公司提供全方位的服務,包括最強大的智能算力和開發工具,並在資金和商業化探索方面提供充分支持。」周靖人在演講中還明確表示。
據周靖人介紹,在開發者生態層,阿里發起的AI模型社區魔搭集聚了180多萬名AI開發者和900多個優質AI模型。模型貢獻者基本覆蓋國內大模型賽道核心玩家,如百川智能、嗶哩嗶哩、IDEA研究院、蘭丁股份、瀾舟科技、openBMB社區、啟智社區、清華TSAIL、RWKV、深勢科技、WeNet社區、元語智能、浙江大學、智譜AI等(排名不分先后),貢獻了30多個10億以上參數規模大模型。
據阿里雲方面介紹,在魔搭這個自由市場,所有模型生產者都可上傳模型,驗證模型的技術能力,探索模型的應用場景和商業化模式。魔搭社區打通了與靈積平臺的部署鏈路,支持社區的模型通過靈積平臺來實現服務化。
值得注意的是,大模型的「國家隊」也在本屆WAIC上誕生。
據2023世界人工智能大會的最新消息,國家標準委指導的國家人工智能標準化總體組宣佈我國首個大模型標準化專題組組長,由上海人工智能實驗室與百度、華為、阿里等企業聯合擔任,現場進行了證書頒發,並正式啟動大模型測試國家標準制訂工作。這意味着百度、華為、阿里等入局了「大模型國家隊」。
據悉,國家人工智能標準化總體組設立大模型專題組時,要求組長單位需要在大模型理論研究和產業應用等方面具有較高專業水平,熟悉該領域國際前沿科技發展態勢、法規制度與標準規範等。牽頭起草過國際、國家或行業標準,具有在主要國際組織或標委會中有大模型標準化相關工作經驗的優先。
(編輯:吳清 校對:顏京寧)