繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

Meta發佈最強開源大模型Llama 3!多模態版本隨后將上線

2024-04-19 08:57

當地時間周四,美國科技巨頭Meta推出了其最強大的開源人工智能(AI)模型Llama 3,以追趕行業領導者OpenAI。美股盤中,Meta股價上漲逾2%,今年迄今漲近43%。

Meta首席執行官扎克伯格聲稱,Llama 3有8B和70B兩個版本,大版本的Llama 3將有超過4000億參數。由於預訓練和指令微調,Llama 3相比Llama 2有了極大的改進。

image

Llama 3在多種行業基準測試上展現了最先進的性能,並提供了包括改進的推理能力在內的新功能。Meta認為Llama 3是市場上最好的開源大模型。開源意味着這些模型的代碼和數據對公眾開放,任何人都可以查看、修改和使用。

開發人員抱怨之前的Llama 2模型無法理解基本的上下文,在處理查詢時經常出現混淆。谷歌的Gemini AI圖像生成工具也遇到了類似問題,它在生成歷史人物的圖像時產生了不準確的描述,這引起了廣泛批評。

現在,Meta在訓練Llama 3時使用了更高質量的數據,這些數據幫助AI模型更好地識別語言中的細微差別,從而提高其對上下文的理解能力。

Meta提到,他們為Llama 3模型輸入的數據量是Llama 2的七倍,這可能有助於提高模型的性能和準確性。還利用了由AI生成的「合成」數據來加強模型在編碼和推理等特定領域的能力。

據Meta介紹,Llama 3將被整合到其虛擬助手Meta AI中,這是免費使用的同類產品中最先進的AI應用程序。Meta AI助手已經在Facebook、Instagram、WhatsApp和Messenger等應用中上線,隨后也將迎來更新。

Meta首席產品官Chris Cox在接受採訪時説,這家社交媒體巨頭為Llama 3配備了新的計算機編碼能力,這次除了可以輸入文本外,還可以輸入了圖像,不過目前該模型只能輸出文本內容。因此,Llama 3目前還不是多模態大模型。

但他補充説,更高級的推理能力,比如制定更長的多步驟計劃的能力,將在隨后的版本中出現。並計劃在未來幾個月發佈多模態版本,這意味着它們可以同時生成文本和圖像。

Cox表示,最終的目標是幫助用户從繁雜的工作中解脫出來,讓生活更輕松快樂,無論是與企業互動,還是寫作,或者是計劃旅行。

此外,Llama 3很快將在亞馬遜AWS、Databricks、谷歌雲、Hugging Face、Kaggle、IBM的雲平臺WatsonX、微軟雲Azure、英偉達的NIM和Snowflake上推出,並得到AMD、AWS、戴爾、英特爾、英偉達提供的硬件平臺支持。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。