简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

【华鑫计算机|行业周报】 阿里深夜开源Qwen2.5-Omni, DeepSeek-V3 上线新版本

2025-04-07 09:14

(来源:华鑫研究)

▌算力:算力租赁价格平稳,阿里深夜开源Qwen2.5-Omni

3 月 27 日凌晨,阿里通义千问团队发布 Qwen2.5-Omni。

这是 Qwen 系列中全新的旗舰级多模态大模型,专为全面的多模式感知设计,可以无缝处理包括文本、图像、音频和视频的各种输入,同时支持流式的文本生成和自然语音合成输出。

团队提出了 Thinker-Talker 架构,这是一个端到端的多模态模型,旨在感知包括文本、图像、音频和视频在内的多种模态,同时以流式方式生成文本和自然语音响应。此外,团队还提出了一种名为 TMRoPE(Time-aligned Multimodal RoPE)的新型位置嵌入,用于同步视频输入与音频的时间戳。实时语音和视频聊天方面,该架构专为完全实时交互而设计,支持分块输入和即时输出。它还具备自然且稳健的语音生成:在语音生成方面,Qwen2.5-Omni 超越了许多现有的流式和非流式替代方案,展现出卓越的稳健性在和自然性。

多模态性能强劲:在与同样大小的单模态模型进行基准测试时,Qwen2.5-Omni 在所有模态上均展现出卓越的性能。Qwen2.5-Omni 在音频能力上超越了同样大小的 Qwen2-Audio,并且达到了与 Qwen2.5-VL-7B 相当的性能;出色的端到端语音指令遵循能力:Qwen2.5-Omni 在端到端语音指令遵循方面的表现可与文本输入的有效性相媲美,这一点在 MMLU 和 GSM8K 等基准测试中得到了证明。

Thinker 对于Qwen2.5-Omni就像大脑一样,负责处理和理解来自文本、音频和视频模态的输入,生成高级表示以及对应的文本。Talker 则像人类的嘴巴,以流式方式接收 Thinker 产生的高级表示和文本,并流畅地输出离散的语音 token。Thinker 是一个 Transformer 解码器,配备有音频和图像的编码器,以便于提取信息。相比之下,Talker 被设计为一种双轨自回归 Transformer 解码器架构。

▌AI应用: Gemini搜索访问量环比+6.85%,DeepSeek-V3 上线新版本

DeepSeek上线新版本DeepSeek-V3-0324,参数量为6850亿,相较上个版本参数增幅不大(6710亿)。DeepSeek V3的一大亮点在于采用MIT开源协议,上个版本还是自定义许可证,这不仅可以自由修改、分发模型,还支持模型蒸馏、商业化应用。

DeepSeek-V3-0324所有指标性能暴涨,击败了Claude 3.5 Sonnet,成为目前最强的非推理模型。就代码能力来看,DeepSeek-V3-0324同样能够与Claude 3.5 Sonnet一决高下。另外,在Aider的多语言基准测试中,DeepSeek-V3-0324拿下55% 的成绩,较前代版本显著提升,成为仅次于Sonnet 3.7的非推理类模型第二名。其表现已可媲美R1和o3-mini等具备推理能力的模型。

在 KCORES大模型竞技场中,Claude-3.7-Sonnet-Thinking无疑是LLM当之无愧的王者,DeepSeek-V3-0324以328.3分拿下第三名,仅次于Claude 3.5 Sonnet。在mandelbrot-set-meet-libai测试中,DeepSeek-V3-0324没有过多变化,较初版仅仅低了2分,完成度提升很高。还有在火星任务测试中,DeepSeek-V3-0324星球渲染正确,所有模型中位列第三。九大行星测试,DeepSeek-V3-0324真正绘制出了太阳系的完整图。此外,DeepSeek-V3-0324在Misguided Attention基准上,跃居非推理类模型榜首,甚至超越了Claude Sonnet 3.7(非推理模型)。

▌AI融资动向: 两兄妹再次出手惊艳AI圈,再次融资250亿

近日,Anthropic宣布完成E轮35亿美元(约合人民币250亿元)融资,投后估值615亿美元(约合人民币4450亿元),这距离Anthropic上一轮10亿美元的融资仅仅过去不到10天。

达里奥·阿莫迪和丹妮拉·阿莫迪兄妹——2021年离开OpenAI开始创业,以他们为代表的AI新贵们正在进行一场史无前例的融资竞赛。2025年短短3个月,从OpenAI到xAI、再到Anthropic,以及OpenAI前CTO创立的新AI公司都在疯狂融资。

通过这项融资,Anthropic将推进其下一代AI系统的发展,扩大其计算能力,加深其在机械性和一致性方面的研究,并加速其国际扩张。

诞生于前OpenAI最早期员工达里奥·阿莫迪和妹妹丹妮拉·阿莫迪之手,Anthropic融资之路可谓势如破竹。就在两个月前已经获得来自谷歌的10亿美元投资,估值一度增长至600亿美元,条件之一是必须使用谷歌的云服务,在此之前,Anthropic也和亚马逊签过类似的条款。

2025年仅过去四分之一,Anthropic就拿下了超45亿美元。而再回过头来看,从2021年2月创立开始,Anthropic已经陆陆续续完成10多轮融资,估值飙升至615亿美元(约合人民币4400亿元),是崛起速度最快的AI公司之一。

▌投资建议 

DeepSeek-V3-0324的新版本代码能力显著提升,数学与逻辑推理能力增强,模型架构与开源生态进一步提升,凸显中国AI企业在技术与成本上的竞争力,更重要的是,其性能跳跃表明该团队可能在为后续重大版本铺路。目前,借助借助新版 DeepSeek-V3,Ai应用将在垂直领域加速渗透。建议关注临床 AI 产品成功落地验证的嘉和美康(688246.SH)、以AI为核心的龙头厂商科大讯飞(002230.SZ)、芯片技术有望创新突破的寒武纪(688256.SH)、高速通信连接器业务或显著受益于 GB200 放量的鼎通科技(688668.SH)、已与Rokid等多家知名AI眼镜厂商建立紧密合作的亿道信息(001314.SZ)、加快扩张算力业务的精密零部件龙头迈信林(688685.SH)、持续加码高速铜缆的泓淋电力(301439.SZ)、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ)等。

▌ 风险提示

 1)AI 底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI 应用落地效果不及预期。4)推荐公司业绩不及预期风险。

算力动态:算力租赁价格平稳,阿里深夜开源Qwen2.5-Omni

1.1

数据跟踪:算力租赁价格平稳

本周算力租赁价格保持平稳。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G价格为8.50元/时;阿里云16核+125GiB价格为34.74元/时;显卡配置为A800-80G中,恒源云16+256G价格为6.17元/时。

1.2

产业动态:阿里深夜开源Qwen2.5-Omni,真正意义上

的“open ai”

3 月 27 日凌晨,阿里通义千问团队发布 Qwen2.5-Omni。

这是 Qwen 系列中全新的旗舰级多模态大模型,专为全面的多模式感知设计,可以无缝处理包括文本、图像、音频和视频的各种输入,同时支持流式的文本生成和自然语音合成输出。

团队提出了 Thinker-Talker 架构,这是一个端到端的多模态模型,旨在感知包括文本、图像、音频和视频在内的多种模态,同时以流式方式生成文本和自然语音响应。此外,团队还提出了一种名为 TMRoPE(Time-aligned Multimodal RoPE)的新型位置嵌入,用于同步视频输入与音频的时间戳。实时语音和视频聊天方面,该架构专为完全实时交互而设计,支持分块输入和即时输出。它还具备自然且稳健的语音生成:在语音生成方面,Qwen2.5-Omni 超越了许多现有的流式和非流式替代方案,展现出卓越的稳健性在和自然性。

多模态性能强劲:在与同样大小的单模态模型进行基准测试时,Qwen2.5-Omni 在所有模态上均展现出卓越的性能。Qwen2.5-Omni 在音频能力上超越了同样大小的 Qwen2-Audio,并且达到了与 Qwen2.5-VL-7B 相当的性能;出色的端到端语音指令遵循能力:Qwen2.5-Omni 在端到端语音指令遵循方面的表现可与文本输入的有效性相媲美,这一点在 MMLU 和 GSM8K 等基准测试中得到了证明。

Thinker 对于Qwen2.5-Omni就像大脑一样,负责处理和理解来自文本、音频和视频模态的输入,生成高级表示以及对应的文本。Talker 则像人类的嘴巴,以流式方式接收 Thinker 产生的高级表示和文本,并流畅地输出离散的语音 token。Thinker 是一个 Transformer 解码器,配备有音频和图像的编码器,以便于提取信息。相比之下,Talker 被设计为一种双轨自回归 Transformer 解码器架构。

AI应用动态:Gemini搜索访问量环比+6.85%,DeepSeek-V3 上线新版本

2.1

流量跟踪:Gemini搜索访问量环比+6.85% 

本期(2025.3.24-2025.3.28)AI相关网站流量数据:访问量前三位分别为ChatGPT(1016.0M)、Bing(334.5M)和Canva(180.7M),访问量环比增速第一为Gemini(6.85%);平均停留时长前三位分别为Character.AI(00:17:07)、Discord(00:11:47)和NotionAI(00:9:07);平均停留时长环比增速第一为文心一言(11.22%)。

2.2

产业动态:DeepSeek-V3 上线新版本DeepSeek-V3-0324

DeepSeek上线新版本DeepSeek-V3-0324,参数量为6850亿,相较上个版本参数增幅不大(6710亿)。DeepSeek V3的一大亮点在于采用MIT开源协议,上个版本还是自定义许可证,这不仅可以自由修改、分发模型,还支持模型蒸馏、商业化应用。

DeepSeek-V3-0324所有指标性能暴涨,击败了Claude 3.5 Sonnet,成为目前最强的非推理模型。就代码能力来看,DeepSeek-V3-0324同样能够与Claude 3.5 Sonnet一决高下。另外,在Aider的多语言基准测试中,DeepSeek-V3-0324拿下55% 的成绩,较前代版本显著提升,成为仅次于Sonnet 3.7的非推理类模型第二名。其表现已可媲美R1和o3-mini等具备推理能力的模型。

在 KCORES大模型竞技场中,Claude-3.7-Sonnet-Thinking无疑是LLM当之无愧的王者,DeepSeek-V3-0324以328.3分拿下第三名,仅次于Claude 3.5 Sonnet。在mandelbrot-set-meet-libai测试中,DeepSeek-V3-0324没有过多变化,较初版仅仅低了2分,完成度提升很高。还有在火星任务测试中,DeepSeek-V3-0324星球渲染正确,所有模型中位列第三。九大行星测试,DeepSeek-V3-0324真正绘制出了太阳系的完整图。此外,DeepSeek-V3-0324在Misguided Attention基准上,跃居非推理类模型榜首,甚至超越了Claude Sonnet 3.7(非推理模型)。

AI融资动向:两兄妹再次出手惊艳AI圈,再次融资250亿

近日,Anthropic宣布完成E轮35亿美元(约合人民币250亿元)融资,投后估值615亿美元(约合人民币4450亿元),这距离Anthropic上一轮10亿美元的融资仅仅过去不到10天。

达里奥·阿莫迪和丹妮拉·阿莫迪兄妹——2021年离开OpenAI开始创业,以他们为代表的AI新贵们正在进行一场史无前例的融资竞赛。2025年短短3个月,从OpenAI到xAI、再到Anthropic,以及OpenAI前CTO创立的新AI公司都在疯狂融资。

通过这项融资,Anthropic将推进其下一代AI系统的发展,扩大其计算能力,加深其在机械性和一致性方面的研究,并加速其国际扩张。

诞生于前OpenAI最早期员工达里奥·阿莫迪和妹妹丹妮拉·阿莫迪之手,Anthropic融资之路可谓势如破竹。就在两个月前已经获得来自谷歌的10亿美元投资,估值一度增长至600亿美元,条件之一是必须使用谷歌的云服务,在此之前,Anthropic也和亚马逊签过类似的条款。

2025年仅过去四分之一,Anthropic就拿下了超45亿美元。而再回过头来看,从2021年2月创立开始,Anthropic已经陆陆续续完成10多轮融资,估值飙升至615亿美元(约合人民币4400亿元),是崛起速度最快的AI公司之一。

行情复盘

本周,AI算力指数/AI应用指数/万得全A/中证红利日涨幅最大值分别为0.51%/0.22%/0.12%/0.63%, AI算力指数/AI应用指数/万得全A/中证红利日跌幅最大值分别为-4.31%/-2.15%/-0.80%/-0.73%。 AI算力指数内部,芯原股份以+9.71%录得本周最大涨幅,首都在线以-26.11%录得本周最大跌幅。 AI应用指数内部,芯原股份以+9.71%得本周最大涨幅,返利科技以-18.54%录得本周最大跌幅。

投资建议

DeepSeek-V3-0324的新版本代码能力显著提升,数学与逻辑推理能力增强,模型架构与开源生态进一步提升,凸显中国AI企业在技术与成本上的竞争力,更重要的是,其性能跳跃表明该团队可能在为后续重大版本铺路。目前,借助借助新版 DeepSeek-V3,Ai应用将在垂直领域加速渗透。建议关注临床 AI 产品成功落地验证的嘉和美康(688246.SH)、以AI为核心的龙头厂商科大讯飞(002230.SZ)、芯片技术有望创新突破的寒武纪(688256.SH)、高速通信连接器业务或显著受益于 GB200 放量的鼎通科技(688668.SH)、已与Rokid等多家知名AI眼镜厂商建立紧密合作的亿道信息(001314.SZ)、加快扩张算力业务的精密零部件龙头迈信林(688685.SH)、持续加码高速铜缆的泓淋电力(301439.SZ)、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ)等。

1)AI 底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI 应用落地效果不及预期。4)推荐公司业绩不及预期风险。

证券研究报告:《阿里深夜开源Qwen2.5-Omni, DeepSeek-V3 上线新版本—计算机行业周报》

对外发布时间:2025年4月5日

发布机构:华鑫证券

本报告分析师:

宝幼琛  SAC编号:S1050521110002

计算机&AI&互联网组介绍

宝幼琛:本硕毕业于上海交通大学,多次新财富、水晶球最佳分析师团队成员,7年证券从业经验,2021年11月加盟华鑫证券研究所,目前主要负责计算机与中小盘行业上市公司研究。擅长领域包括:云计算、网络安全、人工智能、区块链等。

谢孟津:伦敦政治经济学院硕士,2023年加入华鑫证券。

费强:曼彻斯特大学硕士,2023年加入华鑫证券研究所。

本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并注册为证券分析师,以勤勉的职业态度,独立、客观地出具本报告。本报告清晰准确地反映了本人的研究观点。本人不曾因,不因,也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。

法律声明

本微信平台所载内容仅供华鑫证券的客户参考使用。因本资料暂时无法设置访问限制,若您并非华鑫证券的客户,为保证服务质量、控制投资风险,还请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。我们对由此给您造成的不便表示诚挚歉意,非常感谢您的理解与配合!

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。