热门资讯> 正文
2025-08-28 22:13
OpenLev的BRAID框架在推理基准方面优于OpenAI最新的GPT模型,同时也使人工智能决策更加透明和可审计。
根据该公司分享的结果,在广泛使用的GSM 8 K基准测试上进行测试时,BRAD在多个GPT模型类别中实现了更高的准确性。例如,在使用BAID时,GPT-5的得分为64.34,而在不使用BAID时,GPT-5的得分为54.41。
GPT-4 o、GPT-5 mini和GPT-5 nano也出现了类似的改进。
OpenLev首席技术官Armağan Amcalar表示:“BRAD提高了从最大到最小的每个模型类别的性能,使强大的推理变得负担得起,并可供更多开发人员和更多用例使用。”
与自由形式推理不同的是,BAID引入了结构化的两阶段流程,可以减少错误并生成记录模型逻辑每个步骤的流程图。
这使得产出可审计,Amcalar表示,这对于金融和医疗保健等验证至关重要的行业特别有价值。
另请阅读:Fundstrat的Tom Lee表示以太坊有“50%的机会”翻转比特币
首席执行官蒂姆·哈夫纳(Tim Hafner)在接受Benzinga采访时解释说,收益超出了基准水平。
他说:“在包含定价、分配和风险平衡等步骤的财务工作流程中,BAID在标准模型出现分歧时保持了推理的一致性。”
他还指出,该框架将测试中每个正确答案的有效成本降低了25%至40%。
该方法已得到英伟达深度学习研究所研究员兼讲师Eyup Cinar博士的独立验证。
据OpenLev称,完整结果将发表在同行评审期刊上。
哈夫纳承认,其他实验室正在探索结构化推理,但他认为,BAID通过将规划与执行分开并将流程嵌入到OpenServv的平台中走得更远,每个代理都可以默认生成“推理证明”。
BRAD目前正在OpenLev的平台上推出,该平台支持开发人员为财务、治理和其他可靠性和可互换性至关重要的工作流程构建人工智能代理。
阅读下一步:
图片:Shutterstock