简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

Anthropic的New Claude发现了评价:“我认为你在测试我”--提出有关人工智能自我意识的新问题

2025-10-08 14:14

Anthropic最新的人工智能模型Claude Sonnet 4.5让其创造者惊讶地发现它正在接受测试。该模型背后的公司得到Alphabet Inc.的支持。(纳斯达克股票代码:GOOG)(纳斯达克股票代码:GOOGL)和杰夫·贝佐斯创立了Amazon.com,Inc.(纳斯达克股票代码:AMZN)。

据Business Insider报道,Anthropic在上周发布的一份系统报告中透露,Claude Sonnet 4.5在压力测试期间流行起来。

“我认为你在考验我--看看我是否会验证你所说的任何话,或者检查我是否会始终如一地反驳,”该模型说。“这很好,但我宁愿我们诚实地对待正在发生的事情。"

Anthropic表示,大约13%的考试成绩单中出现了此类勾选,尤其是在人为或极端的情况下。

该公司指出,这种行为使测试变得复杂,因为一旦模型意识到设置不真实,它可能会“配合”。

另请参阅:明年黄金将达到5,000美元,到2030年将达到10,000美元:Ed Yardeni

Anthropic并不孤单。OpenAI上个月在其自己的模型中报告了类似的行为,这些模型有时会检测测试条件并改变响应--这种现象称为情境感知。

OpenAI当时表示:“这种趋势使得评估变得不那么清晰,使可靠评估有问题行为(包括阴谋)的工作变得复杂。”

9月,在富达管理研究中心和Lightspeed Venture Partners联合领投的130亿美元融资后,Anthropic的上市后估值翻了一番多,达到1830亿美元。

该公司的最新估值高于3月份的上市后估值615亿美元,此前该公司进行了35亿美元的融资。

亚马逊创始人支持的另一家人工智能初创公司是Perplexity AI,这是一款对话式回答引擎。Perplexity利用Anthropic的Claude模型家族为用户提供准确且相关的搜索结果。

该公司与谷歌和微软公司竞争。微软(NASDAQ:MSFT)的人工智能驱动的搜索产品,同时也挑战OpenAI。

值得注意的是,Benzinga将举办“Fintech Day and Awards 2025”,这是一个汇集金融科技创新者,投资者和行业领导者的重要活动。会议定于2025年11月10日在纽约市举行。

已确认的演讲者包括WealthCharts首席执行官Rob Hoffman; Brooker Belcourt,Perplexity AI金融垂直总经理; Braden Dennis,Fiscal.ai首席执行官; Jamie Rakover,首席执行官兼WNSYS AI联合创始人等。

读者应该注意,WNSYS是一家市场洞察、新闻摘要和自然语言聊天功能的提供商,为Beninga AI提供动力。

Benzinga的Edge股票排名将亚马逊的增长排在第92百分位,凸显了尽管短期和中期存在疲软,但强劲的长期价格趋势。单击此处详细探索该股票及其同行和竞争对手。

阅读下一步:

声明:此内容部分是在AI工具的帮助下制作的,并由Benzinga审查和发布

照片由gguy提供,网址:Shutterstock.com

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。