Meta發佈最強開源大模型Llama 3！多模態版本隨后將上線

2024-04-19 08:57

當地時間周四，美國科技巨頭Meta推出了其最強大的開源人工智能(AI)模型Llama 3，以追趕行業領導者OpenAI。美股盤中，Meta股價上漲逾2%，今年迄今漲近43%。

Meta首席執行官扎克伯格聲稱，Llama 3有8B和70B兩個版本，大版本的Llama 3將有超過4000億參數。由於預訓練和指令微調，Llama 3相比Llama 2有了極大的改進。

Llama 3在多種行業基準測試上展現了最先進的性能，並提供了包括改進的推理能力在內的新功能。Meta認為Llama 3是市場上最好的開源大模型。開源意味着這些模型的代碼和數據對公眾開放，任何人都可以查看、修改和使用。

開發人員抱怨之前的Llama 2模型無法理解基本的上下文，在處理查詢時經常出現混淆。谷歌的Gemini AI圖像生成工具也遇到了類似問題，它在生成歷史人物的圖像時產生了不準確的描述，這引起了廣泛批評。

現在，Meta在訓練Llama 3時使用了更高質量的數據，這些數據幫助AI模型更好地識別語言中的細微差別，從而提高其對上下文的理解能力。

Meta提到，他們為Llama 3模型輸入的數據量是Llama 2的七倍，這可能有助於提高模型的性能和準確性。還利用了由AI生成的「合成」數據來加強模型在編碼和推理等特定領域的能力。

據Meta介紹，Llama 3將被整合到其虛擬助手Meta AI中，這是免費使用的同類產品中最先進的AI應用程序。Meta AI助手已經在Facebook、Instagram、WhatsApp和Messenger等應用中上線，隨后也將迎來更新。

Meta首席產品官Chris Cox在接受採訪時説，這家社交媒體巨頭為Llama 3配備了新的計算機編碼能力，這次除了可以輸入文本外，還可以輸入了圖像，不過目前該模型只能輸出文本內容。因此，Llama 3目前還不是多模態大模型。

但他補充説，更高級的推理能力，比如制定更長的多步驟計劃的能力，將在隨后的版本中出現。並計劃在未來幾個月發佈多模態版本，這意味着它們可以同時生成文本和圖像。

Cox表示，最終的目標是幫助用户從繁雜的工作中解脫出來，讓生活更輕松快樂，無論是與企業互動，還是寫作，或者是計劃旅行。

此外，Llama 3很快將在亞馬遜AWS、Databricks、谷歌雲、Hugging Face、Kaggle、IBM的雲平臺WatsonX、微軟雲Azure、英偉達的NIM和Snowflake上推出，並得到AMD、AWS、戴爾、英特爾、英偉達提供的硬件平臺支持。