Anthropic聯合創始人表示AGI到2028年「可能」，但「變革性人工智能」必須通過「經濟圖靈測試」

2025-06-14 19:01

Anthropic聯合創始人Ben Mann表示，只有在系統通過他所謂的「經濟圖靈測試」之后，真正的「變革性人工智能」纔會到來。"

發生了什麼：Mann最近在「No Priors」播客中將「經濟圖靈測試」定義為一種工作場所試驗，迫使招聘經理在為期一個月的承包商和人工智能代理之間進行選擇。

曼指出，通過測試將標誌着「從社會和文化的角度來看，事情開始變得非常有趣」。

曼恩的標準將實驗室基準換成了涵蓋「50%有經濟價值的任務」的市場籃子。「每個人類主管都會‘聘請一名代理人’來執行工作。如果月底，經理更喜歡這臺機器，「那麼它就通過了，」他説。

曼恩確實警告説，這種做法有其侷限性。「面試只是現實世界工作表現的糟糕近似，」他觀察到，並認為目前的測試措施有限且過於理論化。

另請參閱：拉里·埃里森超越傑夫·貝佐斯、馬克·扎克伯格成為甲骨文「分水嶺」時刻世界第二富豪

Anthropic已經通過內部採訪運行了其Claude模型，並發現它們「非常好」，儘管曼恩承認正式試驗「尚未開始」，可能要到公司下一個發佈周期之后纔會開始。他將2028年視為人工通用智能「很有可能」的窗口，但警告説，精確的時間表仍然是猜測。

為什麼重要：曼提出的「經濟圖靈測試」一詞是基於圖靈測試，圖靈測試是人工智能中的一種簡單查詢方法，用於確定計算機是否能夠像人類一樣思考。

OpenAI的ChatGPT 4成為第一個通過雙人圖靈測試的AI LLM，早在2024年7月，54%的時間欺騙了人類對話夥伴。GPT-4.5在今年早些時候的一次更正式的測試中取得了73%的成功率。然而，多年來，批評者提出了幾個原因，質疑測試在確定機器真正智能方面的準確性。

沃頓商學院的一項新研究還發現，大型語言模型現在創建的模因比普通人更有趣，有效地通過了「模因圖靈測試」。"

Anthropic的勢頭正在加速。3月份的E輪融資將其估值推至615億美元，使這家由Amazon.com Inc.支持的初創公司定位。（納斯達克股票代碼：AMZN）和Alphabet Inc.（納斯達克股票代碼：GOOGL）（納斯達克股票代碼：GOOG）是OpenAI最激烈的私人持股競爭對手。

圖片來自Shutterstock

閲讀下一頁：ChatGPT在「初級」國際象棋對決中被1979年Atari 2600擊敗之前一直「乞求重啟」

圖片來自Shutterstock