简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

商汤“日日新SenseNova 5.0”宣布升级,大模型性能超越GPT-4 Turbo

2024-04-23 21:34

  新浪科技讯 4月23日晚间消息,在商汤科技SenseTime技术交流日活动上,商汤发布“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,同时宣布升级“日日新SenseNova 5.0”大模型体系,综合能力全面对标GPT-4 Turbo。

  据介绍,基于超过10TB tokens训练、覆盖大量合成数据,全新的“日日新SenseNova 5.0”(以下简称:日日新5.0)采用混合专家架构,推理时上下文窗口可以有效到 200K 左右。

  本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标 GPT-4 Turbo,主流客观评测上达到或超越 GPT-4 Turbo。在多模态能力上,商汤多模态大模型的图文感知能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU 取得领先成绩。

  商汤科技董事长兼CEO徐立表示:“商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”(文猛)

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。