繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

鈦媒體獨家|大模型獨角獸MiniMax將於11月發佈首款對標GPT-4o的端到端實時語音對話API產品

2024-10-25 10:35

(圖片來源:鈦媒體App編輯林志佳拍攝) (圖片來源:鈦媒體App編輯林志佳拍攝)

鈦媒體App 10月25日消息,鈦媒體App獨家獲悉,AI 大模型領域的獨角獸MiniMax將於今年11月發佈對標GPT-4o的Realtime API服務,將提升端到端實時多模態處理能力,並帶來更低延時、更自然、更沉浸的實時語音對話,為企業協作、社交、直播、遊戲等多種場景提供服務。

這是MiniMax推出的首款端到端實時語音對話產品。消息人士告訴鈦媒體App,內部正在打磨這款產品,並非常希望11月發佈時產品效果直接對標OpenAI GPT-4o。

據悉,今年5月,OpenAI公司推出可免費使用的全新旗艦AI模型GPT-4o,可實時進行音頻、視覺和文本推理,它可以在短至232毫秒、平均320毫秒的時間內響應音頻輸入,與人類在對話中的反應速度一致。在API使用方面,相比去年11月發佈的GPT-4-turbo,GPT-4o價格降低一半(50%),速度提升兩倍(200%)。

OpenAI CEO奧爾特曼(Sam Altman)在推文中表示,新的GPT-4o是OpenAI有史以來最好的模型,它很智能,速度很快,是原生多模態,並且它可供所有ChatGPT用户使用,無論是免費版本還是付費GPT-4版

今年10月,實時語音技術公司、聲網的兄弟公司Agora作為語音API合作者出現在了OpenAI 發佈的Realtime API 公開測試版中。而MiniMax也看到了機會,開始與聲網進行合作,聲網創始人兼CEO趙斌在RTE 2024 第十屆實時互聯網大會上表示,聲網與MiniMax正在打磨中國第一個Realtime API,基於該API的智能體產品,能夠與人類進行輕松且流暢的實時語音交流。

除了MiniMax,目前包括科大訊飛、智譜AI、商湯科技等中國企業都在研發生成式AI對話產品,均與GPT-4o效果不相上下,OpenAI近期也開放了ChatGPT-4o對話功能。

根據艾瑞諮詢的統計,2021年,對話式AI的市場規模為45億元,帶動規模126億元。預計2026年,對話式 AI 市場規模將達108億元,帶動規模超385億元,五年複合年均增長率(CAGR)達32.5%。

(本文首發於鈦媒體App,作者|林志佳,編輯|胡潤峰)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。