简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

【华西计算机】0930 | DeepSeek-V3.2-Exp模型正式发布并开源

2025-09-30 19:42

(来源:科技晶选)

► DeepSeek-V3.2-Exp模型正式发布并开源

DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏Attention架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台MaaS,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。

(来源:36Kr

► 蚂蚁推出首个开源的万亿参数推理大模型

蚂蚁集团推出开源自研的首个万亿参数大模型Ring-1T-preview,该模型是一款自然语言推理大模型。蚂蚁百灵团队还透露,团队一直在投入Ling2.0家族1T语言基座的后训练,试图最大程度地激发这个万亿规模基座模型的自然语言推理潜力。Ring-1T正式版正在训练中。

(来源:36Kr

► 智谱GLM-4.6发布,代码能力超DeepSeek-V3.2-Exp寒武纪、摩尔线程已适配

国内大模型厂商智谱正式发布并开源新一代大模型GLM-4.6,代码能力较GLM-4.5提升27%,在公开基准测试与真实编程任务中表现已对齐Claude Sonnet 4,超过DeepSeek-V3.2-Exp,是国内已知的最好的Coding模型。GLM-4.6已在寒武纪国产芯片上实现FP8+Int4混合量化推理部署,同时,基于vLLM框架,还可在摩尔线程新一代GPU原生FP8精度稳定运行。

(来源:TechWeb)

海外行业要闻

► OpenAIChatGPT推出及时支付功能,允许用户在ChatGPT内直接购物

OpenAIChatGPT中新增即时支付功能,用户在ChatGPT内如果找到了匹配他们需求的商品,又是来自EtsyShopify的商家,可直接购买,无需跳出ChatGPT应用或者网页前往这两大平台购买。

(来源:TechWeb

► 微软宣布重组Windows 团队,整合工程业务以推进AI操作系统愿景

微软宣布重组Windows业务,将核心Windows工程团队再次归入单一组织架构下,Windows与设备部门总裁达武鲁里表示,此次调整将负责Windows客户端与服务器的团队整合为一个组织,有助于集中精力推进核心工作重点。目前,Windows的部分底层组件仍将由微软Azure团队维护,但操作系统的核心业务已归入单一负责人管理。

(来源:IT之家)

公司公告

乐鑫科技2025年度向特定对象发行A股股票发行情况报告书

公司本次向特定对象发行股票的发行价格为170.29元/股,共发行10,440,288股,募集资金总额为1,777,876,643.52元。发行对象包括兴证全球基金、睿郡资产、国泰海通证券等17名对象,均符合相关法律法规。

► 同花顺关于持股5%以上股东减持计划实施完成的公告

杭州凯士顺科技有限公司通过集中竞价方式,在2025年9月29日完成了减持计划,减持价格区间为357.21元至361.14元,减持均价为359.50元,共减持699,100股,占公司总股本的0.13%。

历史报告回顾

四、人工智能类:

1、80页深度:《全球科技股复盘-云的下一站:AI》

2、ChatGPT 深度(11):《华为算力分拆-全球AI算力的第二极》

3、Chatgpt 海外模型应用复盘:《国内AI奇点已至》

4、行业跟踪:《海外AI高景气度,A股科技静待花开》

5、Sora 行业跟踪:《算力应用再加速》

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。