热门资讯> 正文
2026-06-23 18:22
周一,Box Inc. (NYSE:BOX)首席执行官Aaron Levie表示,人工智能的进步,从模型训练到企业部署,从根本上取决于系统的评估和测量程度。
Levie在X上的一篇帖子中认为,“几乎所有人工智能模型和代理进展都在evals的下游。"
他补充说,开权模型的改进、特定领域的后训练以及代理人工智能系统都取决于严格的评估方法。
他写道:“应用人工智能层中的代理改进都是为了评估。”他强调,能够增强工作的企业人工智能部署也严重依赖于测试框架。
列维进一步表示,“这都是评估”,强调了他的观点,即评估系统是开发可靠人工智能代理的核心。
Box首席执行官的言论呼应了加勒特·洛德(Garrett Lord)强调的更广泛行业讨论,他表示,公司正在努力将人工智能超越试点计划,因为他们缺乏一致的绩效衡量方法。
洛德写道:“每个人都意识到:如果你想要能够真正完成工作的生产质量代理,那就从evals开始。”
他补充说,公司通常无法“量化其人工智能程序的准确性”,这使得扩展变得困难。
几乎所有的AI模型和智能体进度都在评估的下游。特定领域的开放权重训练后归结为评估。应用AI层的代理改进都是关于评估的。实际上可以增强工作的企业部署都是关于评估的。https://t.co/QGvmbMGtbK
下一篇:借助Salesforce Ventures和SBI的1550万美元,Datumo加速了AI评估工具-三星,LG可能正在关注
投资者越来越优先考虑人工智能风险而不是盈利能力,随着对人工智能相关增长的热情增强,未盈利的小型股公司表现优于盈利的同行。
早些时候,Meta Platforms Inc.(纳斯达克股票代码:Meta)在Facebook搜索中引入了“人工智能模式”,使用人工智能从公共内容生成答案,并扩大其对人工智能工具的推动。
它包括照片和视频编辑,同时将自己定位为针对传统搜索引擎。
Nvidia Corp.(纳斯达克股票代码:NVDA)首席执行官Jensen Huang公布了一项扩大的人工智能基础设施战略,重点介绍了人工智能工厂、全栈系统和旨在创造商业价值的代理人工智能,因为该公司从芯片转向更广泛的计算平台。
声明:此内容部分是在人工智能工具的帮助下制作的,并由Benzinga编辑审查和发布。
另请阅读:OpenAI称人工智能破坏了网络安全-现在它希望人工智能来修复它
图片来源:Alexander 56891,来自Shutterstock