繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

Anthropic聯合創始人表示AGI到2028年「可能」,但「變革性人工智能」必須通過「經濟圖靈測試」

2025-06-14 19:01

Anthropic聯合創始人Ben Mann表示,只有在系統通過他所謂的「經濟圖靈測試」之后,真正的「變革性人工智能」纔會到來。"

發生了什麼:Mann最近在「No Priors」播客中將「經濟圖靈測試」定義為一種工作場所試驗,迫使招聘經理在為期一個月的承包商和人工智能代理之間進行選擇。

曼指出,通過測試將標誌着「從社會和文化的角度來看,事情開始變得非常有趣」。

曼恩的標準將實驗室基準換成了涵蓋「50%有經濟價值的任務」的市場籃子。「每個人類主管都會‘聘請一名代理人’來執行工作。如果月底,經理更喜歡這臺機器,「那麼它就通過了,」他説。

曼恩確實警告説,這種做法有其侷限性。「面試只是現實世界工作表現的糟糕近似,」他觀察到,並認為目前的測試措施有限且過於理論化。

另請參閱:拉里·埃里森超越傑夫·貝佐斯、馬克·扎克伯格成為甲骨文「分水嶺」時刻世界第二富豪

Anthropic已經通過內部採訪運行了其Claude模型,並發現它們「非常好」,儘管曼恩承認正式試驗「尚未開始」,可能要到公司下一個發佈周期之后纔會開始。他將2028年視為人工通用智能「很有可能」的窗口,但警告説,精確的時間表仍然是猜測。

為什麼重要:曼提出的「經濟圖靈測試」一詞是基於圖靈測試,圖靈測試是人工智能中的一種簡單查詢方法,用於確定計算機是否能夠像人類一樣思考。

OpenAI的ChatGPT 4成為第一個通過雙人圖靈測試的AI LLM,早在2024年7月,54%的時間欺騙了人類對話夥伴。GPT-4.5在今年早些時候的一次更正式的測試中取得了73%的成功率。然而,多年來,批評者提出了幾個原因,質疑測試在確定機器真正智能方面的準確性。

沃頓商學院的一項新研究還發現,大型語言模型現在創建的模因比普通人更有趣,有效地通過了「模因圖靈測試」。"

Anthropic的勢頭正在加速。3月份的E輪融資將其估值推至615億美元,使這家由Amazon.com Inc.支持的初創公司定位。(納斯達克股票代碼:AMZN)和Alphabet Inc.(納斯達克股票代碼:GOOGL)(納斯達克股票代碼:GOOG)是OpenAI最激烈的私人持股競爭對手。

圖片來自Shutterstock

閲讀下一頁:ChatGPT在「初級」國際象棋對決中被1979年Atari 2600擊敗之前一直「乞求重啟」

圖片來自Shutterstock

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。