熱門資訊> 正文
2025-06-14 19:01
Anthropic聯合創始人Ben Mann表示,只有在系統通過他所謂的「經濟圖靈測試」之后,真正的「變革性人工智能」纔會到來。"
發生了什麼:Mann最近在「No Priors」播客中將「經濟圖靈測試」定義為一種工作場所試驗,迫使招聘經理在為期一個月的承包商和人工智能代理之間進行選擇。
曼指出,通過測試將標誌着「從社會和文化的角度來看,事情開始變得非常有趣」。
曼恩的標準將實驗室基準換成了涵蓋「50%有經濟價值的任務」的市場籃子。「每個人類主管都會‘聘請一名代理人’來執行工作。如果月底,經理更喜歡這臺機器,「那麼它就通過了,」他説。
曼恩確實警告説,這種做法有其侷限性。「面試只是現實世界工作表現的糟糕近似,」他觀察到,並認為目前的測試措施有限且過於理論化。
另請參閱:拉里·埃里森超越傑夫·貝佐斯、馬克·扎克伯格成為甲骨文「分水嶺」時刻世界第二富豪
Anthropic已經通過內部採訪運行了其Claude模型,並發現它們「非常好」,儘管曼恩承認正式試驗「尚未開始」,可能要到公司下一個發佈周期之后纔會開始。他將2028年視為人工通用智能「很有可能」的窗口,但警告説,精確的時間表仍然是猜測。
為什麼重要:曼提出的「經濟圖靈測試」一詞是基於圖靈測試,圖靈測試是人工智能中的一種簡單查詢方法,用於確定計算機是否能夠像人類一樣思考。
OpenAI的ChatGPT 4成為第一個通過雙人圖靈測試的AI LLM,早在2024年7月,54%的時間欺騙了人類對話夥伴。GPT-4.5在今年早些時候的一次更正式的測試中取得了73%的成功率。然而,多年來,批評者提出了幾個原因,質疑測試在確定機器真正智能方面的準確性。
沃頓商學院的一項新研究還發現,大型語言模型現在創建的模因比普通人更有趣,有效地通過了「模因圖靈測試」。"
Anthropic的勢頭正在加速。3月份的E輪融資將其估值推至615億美元,使這家由Amazon.com Inc.支持的初創公司定位。(納斯達克股票代碼:AMZN)和Alphabet Inc.(納斯達克股票代碼:GOOGL)(納斯達克股票代碼:GOOG)是OpenAI最激烈的私人持股競爭對手。
圖片來自Shutterstock
閲讀下一頁:ChatGPT在「初級」國際象棋對決中被1979年Atari 2600擊敗之前一直「乞求重啟」
圖片來自Shutterstock