熱門資訊> 正文
2023-04-10 17:13
商湯科技發佈「日日新」大模型體系,並推出最新研發的語言大模型「商量SenseChat」。該模型含自然語言生成、照片生成服務、感知模型預標註、模型研發。1800億參數中文語言大模型應用平臺「商量」支持超長文本知識理解,支持問答、理解與生成等中文語言能力。
現場演示用「商量SenseChat」寫作兒童故事
4月10日,商湯科技董事長兼CEO徐立在商湯技術交流日上發佈「日日新」大模型體系,取自《禮記·大學》,湯之盤銘:苟日新,日日新,又日新。「日日新」大模型體系包含自然語言生成、照片生成服務、感知模型預標註、模型研發。商湯發佈中文語言大模型應用平臺「商量」,1800億參數中文大語言模型支持超長文本知識理解,支持問答、理解與生成等中文語言能力,可實現多輪對話、邏輯推理、語言糾錯、內容創作、情感分析等。
現場演示了中文語言大模型寫作廣告語、續寫兒童故事、編程等。編程核心功能包括代碼補全、擴寫、翻譯、重構、修正,以及註釋生成代碼、複雜度分析、測試用例生成等。徐立表示,內部實測代碼編寫效率提升62%,HumanEval測試集一次通過率40.2%。下一代軟件開發範式是AI for AI,代碼=80% AI生成+20%人工。
商湯科技董事長兼CEO徐立表示,下一代軟件開發範式是AI for AI,代碼=80% AI生成+20%人工。
超10億參數自研文生圖生成模型「秒畫」,支持二次元等多種生成風格。單卡A100支持,2秒生成1張512K分辨率的圖片。用户可基於單卡A100自訓練。基於平臺發佈的模型,可設置toB服務API(應用程序編程接口),結合商湯大算力對外提供服務。
現場演示用「秒畫」生成上世紀80年代港風女性圖片
此外,商湯科技對外發布3D內容生成平臺「瓊宇」(場景生成)、「格物」(物體生成),基於3D內容生成技術對空間和物體的復刻與交互。100平方公里城市級生成,「瓊宇」用時2天,具有釐米級重建精度,還原場景的真實細節和光照效果,應用場景涵蓋城市及園區數字孿生、建築設計、影視創作、文旅和電商等。
城市級生成,應用場景涵蓋城市及園區數字孿生、建築設計、影視創作、文旅和電商等。
徐立表示,在這個時間點推出大模型體系,是希望吸引更多下游用户,自然語言模型能夠把各種垂直類的任務串聯起來,用多模態混合的模式迭代行業場景。通過提供新的多模態訓練框架,訓練下一個階段的多模態大模型,通過細分場景端到端的迭代和應用,幫助多模態大模型的發展。目前已有8家商業客户使用商湯多模態訓練框架進行大模型訓練。「我們希望我們的大模型體系能夠幫助行業生產出下一代最領先的多模態模型,並且升級性能。」
免責聲明:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,亦並非旨在提供任何投資意見。有關內容不構成任何專業意見、買賣任何投資產品或服務的要約、招攬或建議。本頁面的內容可隨時進行修改,而本公司毋須另作通知。本公司已盡力確保以上所載之數據及內容的準確性及完整性,如對上述內容有任何疑問,應徵詢獨立的專業意見,本公司不會對任何因該等資料而引致的損失承擔任何責任。以上內容未經香港證監會審閲。