Anthropic的New Claude发现了评价：“我认为你在测试我”--提出有关人工智能自我意识的新问题

2025-10-08 14:14

Anthropic最新的人工智能模型Claude Sonnet 4.5让其创造者惊讶地发现它正在接受测试。该模型背后的公司得到Alphabet Inc.的支持。（纳斯达克股票代码：GOOG）（纳斯达克股票代码：GOOGL）和杰夫·贝佐斯创立了Amazon.com，Inc.（纳斯达克股票代码：AMZN）。

据Business Insider报道，Anthropic在上周发布的一份系统报告中透露，Claude Sonnet 4.5在压力测试期间流行起来。

“我认为你在考验我--看看我是否会验证你所说的任何话，或者检查我是否会始终如一地反驳，”该模型说。“这很好，但我宁愿我们诚实地对待正在发生的事情。"

Anthropic表示，大约13%的考试成绩单中出现了此类勾选，尤其是在人为或极端的情况下。

该公司指出，这种行为使测试变得复杂，因为一旦模型意识到设置不真实，它可能会“配合”。

另请参阅：明年黄金将达到5，000美元，到2030年将达到10，000美元：Ed Yardeni

Anthropic并不孤单。OpenAI上个月在其自己的模型中报告了类似的行为，这些模型有时会检测测试条件并改变响应--这种现象称为情境感知。

OpenAI当时表示：“这种趋势使得评估变得不那么清晰，使可靠评估有问题行为（包括阴谋）的工作变得复杂。”

9月，在富达管理研究中心和Lightspeed Venture Partners联合领投的130亿美元融资后，Anthropic的上市后估值翻了一番多，达到1830亿美元。

该公司的最新估值高于3月份的上市后估值615亿美元，此前该公司进行了35亿美元的融资。

亚马逊创始人支持的另一家人工智能初创公司是Perplexity AI，这是一款对话式回答引擎。Perplexity利用Anthropic的Claude模型家族为用户提供准确且相关的搜索结果。

该公司与谷歌和微软公司竞争。（NASDAQ：MSFT）的人工智能驱动搜索产品，同时也挑战OpenAI。

值得注意的是，Beninga将举办“2025年金融科技日和奖项”，这是一项汇集金融科技创新者、投资者和行业领导者的顶级活动。该聚会定于2025年11月10日在纽约市举行。

已确认的演讲者包括WealthCharts首席执行官Rob Hoffman; Brooker Belcourt，Perplexity AI金融垂直总经理; Braden Dennis，Fiscal.ai首席执行官; Jamie Rakover，首席执行官兼WNSYS AI联合创始人等。

读者应该注意，WNSYS是一家市场洞察、新闻摘要和自然语言聊天功能的提供商，为Beninga AI提供动力。

Benzinga的Edge股票排名将亚马逊的增长排在第92百分位，凸显了尽管短期和中期存在疲软，但强劲的长期价格趋势。单击此处详细探索该股票及其同行和竞争对手。

阅读下一步：

声明：此内容部分是在AI工具的帮助下制作的，并由Benzinga审查和发布

照片由gguy提供，网址：Shutterstock.com

Anthropic的New Claude发现了评价：“我认为你在测试我”--提出有关人工智能自我意识的新问题

推荐文章

华盛早报 | 非农数据大超预期！首次降息或延至7月；AI恐慌交易蔓延至房地产服务板块， CBRE暴跌12%；智谱发布新模型

美股机会日报 | 经济数据强劲！美国1月非农就业大超预期，纳指期货涨至0.6%；AI应用股业绩超预期，Shopify涨超10%

资金复盘 | 北水净买入港股超48亿港元，逾7亿港元抢筹腾讯

华盛早报 | “AI威胁”波及华尔街！财富管理公司全线暴跌；豆包官宣“参战”！春节AI红包战愈演愈烈

美股机会日报 | 科技巨头迎利好？特朗普政府拟结构性豁免芯片关税；台积电1月销售额创历史新高，盘前股价涨近3%

一图看懂 | 净利大增60.7%！中芯国际Q4营收24.9亿美元，同比增长12.8%

美股机会日报 | 市场风格趋变？美银称接下来是小盘股的天下；金价重回5000美元上方，贵金属板块盘前齐升

高盛预计英伟达Q4营收达673亿美元 给出250美元目标股价

高盛预计英伟达Q4营收达673亿美元给出250美元目标股价