繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

改變格局?Meta與微軟合作發佈開源模型可免費商用,威脅OpenAI

2023-07-19 15:19

·Meta發佈其最新開源人工智能模型Llama 2,可免費用於研究和商業用途。微軟成為Llama 2的首選合作伙伴。這可能對生成式人工智能軟件市場的現有格局帶來改變,加劇大模型間的競爭。

·高通和Meta同日宣佈,從2024年開始,Llama 2可以在手機和PC上的高通芯片上運行,該技術將使智能虛擬助理等應用成為可能。

Meta首席執行官馬克·扎克伯格最近攻勢猛烈。

在發佈社交媒體產品Threads挑戰推特併成為史上用户增長最快的App之一后,當地時間7月18日,Meta發佈其最新開源人工智能模型Llama 2,可免費用於研究和商業用途。Llama自發布后便被稱為AI社區內最強大的開源大模型,但因為開源協議一直不可免費商用。

值得注意的是,Meta同時宣佈微軟是Llama 2的首選合作伙伴,Llama 2將由微軟通過其雲服務分發,並在Windows操作系統上運行。衆所周知,微軟一直和OpenAI在生成式人工智能方面密切合作。

Llama 2也將在亞馬遜雲(AWS)、Hugging Face和其他提供商上使用。Meta首席人工智能科學家楊立昆(Yann LeCun)在推特上表示,「這將改變大語言模型(LLM)市場的格局。」

Llama模型是什麼?

Llama全稱為Large Language Model Meta AI,今年2月,Meta推出了第一個較小版本的Llama,僅限研究人員使用。Meta當時稱,Llama參數量僅為OpenAI的大模型GPT-3的10%,但性能卻優於GPT-3。

與GPT-3相比,Meta在一開始就將Llama定位成一個「開源的研究工具」,該模型所使用的是各類公開可用的數據集(例如Common Crawl、維基百科以及C4)。該項目組成員紀堯姆·蘭普爾(Guillaume Lample)在推文中指出,「與Chinchilla、PaLM或GPT-3不同,我們只使用公開可用的數據集,這就讓我們的工作與開源兼容且可以重現。而大多數現有模型,仍依賴於非公開可用或未明確記錄的數據內容。」

Llama 2的參數。

此次Meta發佈的Llama 2實際上是一個開源AI大語言模型系列,包含70億、130 億和700億3種參數變體。此外,他們還訓練了340億參數變體,但只在技術報告中提及,並未發佈。

據扎克伯格介紹,Llama 2的訓練數據相比Llama 1多了40%,納入了超過100萬條人工註釋,以提高其輸出的質量。

Meta副總裁艾哈邁德·阿爾達勒(Ahmad Al-Dahle)表示,訓練數據有兩個來源:在線抓取的數據,以及根據人類註釋者的反饋進行微調和調整的數據集。Meta表示,它沒有在Llama 2中使用Meta的用戶數據,並排除了來自擁有大量個人信息的網站的數據。

業內人士認為,從某種意義上講,Llama是對2022年3月發表的Chinchilla模型及其論文《訓練計算優化型大模型》(Training Compute-Optimal Large Models)的直接反應。這篇論文的核心觀點是,AI訓練與推理的最佳性能未必由大模型的參數量直接決定。相反,增加訓練數據並縮小模型體量纔是達成最佳性能的前提。這樣的訓練可能需要更多時間,但也會帶來有趣的意外收穫——在推理新數據時,小模型的速度更快。

也是在這種思路下,大模型Llama 2可以「在邊緣」或「在設備上」,而不是「在雲端」運行。

當地時間7月18日,高通和Meta同日宣佈,從2024年開始,Llama 2可以在手機和PC上的高通芯片上運行。到目前為止,因為對計算能力和數據的巨大需求,大型語言模型主要在大型數據中心運行。高通表示,該技術將使智能虛擬助理等應用成為可能。

「100億-150億參數級別的模型可以覆蓋絕大多數生成式AI的用例。」高通技術公司產品管理高級副總裁兼AI負責人齊亞德·阿斯哈爾(Ziad Asghar)7月初在接受澎湃科技(www.thepaper.cn)採訪時介紹,「屆時我們會擁有非常豐富的使用場景,手機會成為真正的個人助理,與手機交流和交互,能夠成為我們日常行為的自然延伸,如用於預約會議、寫郵件,以及在娛樂和內容生產上。」

成為OpenAI的領先替代方案

Llama模型商業版本的開源將對生成式人工智能軟件市場的現有格局帶來改變,它可以成為收費的ChatGPT的絕佳替代品,可能將加劇大模型間的競爭。

某種程度上,開源模型的任何漸進式改進都會蠶食閉源模型的市場份額。斯坦福大學基礎模型研究中心主任Percy Liang表示,像Llama 2這樣強大的開源模型對OpenAI構成了相當大的威脅。Liang是自然語言處理(NLP)領域的著名研究者,師從機器學習泰斗邁克爾·喬丹(Michael I. Jordan)。

「Llama 2不是GPT-4。」Liang説,Meta在其研究論文中承認,Llama 2和GPT-4(目前OpenAI最先進的人工智能語言模型)在性能上仍然存在很大差距。「但對於許多用例,你不需要GPT-4。」

Liang認為,像Llama 2這樣更加可定製和透明的模型,比起大型、複雜的專有模型,或能讓使用者更快地創建產品和服務。

加州大學伯克利分校教授史蒂夫·韋伯(Steve Weber)表示,「讓Llama 2成為OpenAI的領先開源替代方案,對Meta來説將是一個巨大的勝利。」

Meta在發佈Llama 2的新聞稿里稱,他們相信,「開放的方法是當今人工智能模型開發的正確方法,特別是在技術快速發展的生成領域。」此外,「我們相信它更安全。開放對當今人工智能模型的訪問意味着一代開發人員和研究人員可以作為一個社區對其進行壓力測試,快速識別和解決問題。」

微軟現在是Meta的合作伙伴

作為OpenAI的親密夥伴,此次微軟作為Meta首選合作伙伴的出現意味深長。

一方面可以理解為,爲了應對主要雲服務競爭對手,微軟也希望多種人工智能模型可供選擇。此前,亞馬遜雲(AWS)宣佈,除了自家的Titan之外,還提供由著名初創公司Anthropic開發的人工智能Claude的訪問權限。同樣,谷歌也表示有意讓其雲客户使用Claude和其他模型。

另一方面,據此前《華爾街日報》揭祕,微軟與OpenAI合作的背后實際上也是「相愛相殺」的關係。

知情人士稱微軟內部出現了抱怨AI研發預算減少的聲音,微軟部分研究人員還抱怨OpenAI不願開放技術細節。知情人士稱,雖然微軟有少數內部團隊可以接觸到該模型的底層工作原理,例如代碼庫和模型權重,但大多數團隊還是被直接拒之門外。儘管微軟持有OpenAI大量股份,可大部分員工在使用OpenAI模型時享受的待遇甚至等同於普通外部供應商。

與此同時,微軟和OpenAI都在營銷大模型的使用權,有時是針對同一個客户。而且OpenAI正在加速與企業合作,包括與微軟競爭對手的合作,如客户關係管理(CRM)軟件服務提供商Salesforce。它們在ChatGPT的支持下打造了Einstein GPT,主要賣點是自動完成某些日常任務,比如生成營銷類電子郵件,這跟微軟基於OpenAI技術打造的功能高度重合。

當天,微軟還宣佈,計劃就使用其辦公軟件Microsoft 365的人工智能助手向企業收取每人每月30美元的費用,該軟件包括Word和Excel。這個價格是微軟目前對這款生產力軟件最廉價版本收費的兩倍多。消息宣佈后,微軟股價18日收盤創下歷史新高,當天上漲4%,收於359.49美元,今年上漲了約50%。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。