Anthropic的New Claude發現了評價：「我認為你在測試我」--提出有關人工智能自我意識的新問題

2025-10-08 14:14

Anthropic最新的人工智能模型Claude Sonnet 4.5讓其創造者驚訝地發現它正在接受測試。該模型背后的公司得到Alphabet Inc.的支持。（納斯達克股票代碼：GOOG）（納斯達克股票代碼：GOOGL）和傑夫·貝佐斯創立了Amazon.com，Inc.（納斯達克股票代碼：AMZN）。

據Business Insider報道，Anthropic在上周發佈的一份系統報告中透露，Claude Sonnet 4.5在壓力測試期間流行起來。

「我認為你在考驗我--看看我是否會驗證你所説的任何話，或者檢查我是否會始終如一地反駁，」該模型説。「這很好，但我寧願我們誠實地對待正在發生的事情。"

Anthropic表示，大約13%的考試成績單中出現了此類勾選，尤其是在人為或極端的情況下。

該公司指出，這種行為使測試變得複雜，因為一旦模型意識到設置不真實，它可能會「配合」。

另請參閱：明年黃金將達到5，000美元，到2030年將達到10，000美元：Ed Yardeni

Anthropic並不孤單。OpenAI上個月在其自己的模型中報告了類似的行為，這些模型有時會檢測測試條件並改變響應--這種現象稱為情境感知。

OpenAI當時表示：「這種趨勢使得評估變得不那麼清晰，使可靠評估有問題行為（包括陰謀）的工作變得複雜。」

9月，在富達管理研究中心和Lightspeed Venture Partners聯合領投的130億美元融資后，Anthropic的上市后估值翻了一番多，達到1830億美元。

該公司的最新估值高於3月份的上市后估值615億美元，此前該公司進行了35億美元的融資。

亞馬遜創始人支持的另一家人工智能初創公司是Perplexity AI，這是一款對話式回答引擎。Perplexity利用Anthropic的Claude模型家族為用户提供準確且相關的搜索結果。

該公司與谷歌和微軟公司競爭。（NASDAQ：MSFT）的人工智能驅動搜索產品，同時也挑戰OpenAI。

值得注意的是，Beninga將舉辦「2025年金融科技日和獎項」，這是一項匯集金融科技創新者、投資者和行業領導者的頂級活動。該聚會定於2025年11月10日在紐約市舉行。

已確認的演講者包括WealthCharts首席執行官Rob Hoffman; Brooker Belcourt，Perplexity AI金融垂直總經理; Braden Dennis，Fiscal.ai首席執行官; Jamie Rakover，首席執行官兼WNSYS AI聯合創始人等。

讀者應該注意，WNSYS是一家市場洞察、新聞摘要和自然語言聊天功能的提供商，為Beninga AI提供動力。

Benzinga的Edge股票排名將亞馬遜的增長排在第92百分位，凸顯了儘管短期和中期存在疲軟，但強勁的長期價格趨勢。單擊此處詳細探索該股票及其同行和競爭對手。

閲讀下一步：

聲明：此內容部分是在AI工具的幫助下製作的，並由Benzinga審查和發佈

照片由gguy提供，網址：Shutterstock.com

Anthropic的New Claude發現了評價：「我認為你在測試我」--提出有關人工智能自我意識的新問題

推薦文章

美股機會日報 | 阿里發佈千問3.5！性能媲美Gemini 3；馬斯克稱Cybercab將於4月開始生產

港股周報 | 中國大模型「春節檔」打響！智譜周漲超138%；鉅虧超230億！美團周內重挫超10%

一周財經日曆 | 港美股迎「春節+總統日」雙假期！萬億零售巨頭沃爾瑪將發財報

一周IPO | 賺錢效應持續火熱！年內24只上市新股「0」破發；「圖模融合第一股」海致科技首日飆漲逾242%

從軟件到房地產，美國多板塊陷入AI恐慌拋售潮

Meta計劃為智能眼鏡添加人臉識別技術

危機四伏，市場卻似乎毫不在意

財報前瞻 | 英偉達Q4財報放榜在即！高盛、瑞銀預計將大超預期，兩大關鍵催化將帶來意外驚喜？