熱門資訊> 正文
2023-02-25 12:06
當地時間周五(2月25日),臉書母公司Meta首席執行官扎克伯格最新推出了「Meta人工智能大型語言模型」(Large Language Model Meta AI),簡稱「LLaMA」。
扎克伯格在社交媒體上稱,Facebook AI Research研發的LLaMA是「目前水平最高的」大型語言模型,目標是幫助研究人員推進他們在人工智能(AI)領域的工作。
「大型語言模型」(LLM)可以消化大量的文本數據,並推斷文本的單詞之間的關係。隨着計算能力的進步,以及輸入數據集與參數空間的不斷擴大,LLM的能力也相應提高。
目前,LLM已經被證明能高效地執行多種任務,包括文本生成、問題回答、書面材料總結等。扎克伯格稱,LLM在自動證明數學定理、預測蛋白質結構等更復雜的方面也有很大的發展前景。
值得一提的是,近期大火的ChatGPT就是採用LLM構建的聊天機器人。ChatGPT由GPT3.5提供支持,而GPT3.5是一款基於OpenAI 175B參數基礎模型訓練的LLM,175B是它從訓練數據中所學習、沉澱下來的內容。
Meta在官網介紹中稱,LLaMA有7B、13B、33B和65B四個基礎模型,在大多數基準測試中都優於GPT3.5的前身GPT3-175B,而LLaMA-65B可與業內最佳的Chinchilla-70B和PaLM-540B競爭。
Meta還宣佈,將針對學術研究者共享其模型,正在接受研究人員的申請。與之截然不同的是,谷歌旗下的DeepMind和OpenAI並不公開訓練代碼。
根據2021年媒體的一份調查顯示,AI專家們通常將DeepMind、OpenAI和FAIR(Facebook AI Research)視為該領域的「前三甲」。
去年年底,Meta發佈了另一款名為Galactica的模型,但因經常分享偏見和不準確的信息而遭到下架。
免責聲明:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,亦並非旨在提供任何投資意見。有關內容不構成任何專業意見、買賣任何投資產品或服務的要約、招攬或建議。本頁面的內容可隨時進行修改,而本公司毋須另作通知。本公司已盡力確保以上所載之數據及內容的準確性及完整性,如對上述內容有任何疑問,應徵詢獨立的專業意見,本公司不會對任何因該等資料而引致的損失承擔任何責任。以上內容未經香港證監會審閲。