熱門資訊> 正文
2025-08-01 06:06
(來源:南京晨報)
轉自:南京晨報
6月17日,阿里巴巴通義團隊開源了全新的千問3量化模型,完成基於蘋果硬件的MLX框架的全系模型深度適配。MLX框架是專為蘋果芯片優化的機器學習框架,在AI開源社區廣受關注。此次千問3一次性推出32個官方MLX量化模型,包含4bit、6bit、8bit 和 BF16 等不同精度,可滿足開發者在Mac Studio、Macbook、iPhone等不同蘋果硬件上部署大模型的需求。
7月11日,月之暗面發佈了開源大模型Kimi K2,引發全球關注,上線一周后,國際權威大模型排行榜LMArena宣佈,這一模型接棒DeepSeek,登頂全球開源模型榜單,並在開閉源總榜上排名第五。Kimi K2在多項基準性能測試中取得優異表現,展現出在自主編程、智能體工具調用和數學推理等方面的領先能力,良好的使用體驗也讓Kimi K2在海外技術社區上收穫了大量好評。7月23日,阿里巴巴正式發佈了全新開源代碼模型 Qwen3-Coder,擁有高達4800億的總參數量和350億的激活參數,原生支持256K token的上下文,並可擴展到100萬token,支持358種編程語言。Qwen3-Coder採用了混合專家(MoE)模型架構,配備了96個查詢(Q)注意力頭和8個鍵/值(KV)注意力頭,擁有160個專家,其中8個專家被激活。在預訓練階段,該模型從數據、上下文和合成數據三個角度進行擴展,以提升代碼能力;在后訓練階段,研究團隊通過在真實代碼任務上擴展代碼強化學習(Code RL)訓練,顯著提升了代碼執行成功率。
南京證券研究員李棟表示,各地支持人工智能的政策陸續落地。6月4日,據杭州日報報道,《杭州市加快建設人工智能創新高地實施方案(2025年版)》即將出台,該實施方案提出到2025年,全市投入市場的智算規模要超過50EFLOPS;培育具有國際一流水平的基礎大模型2個,具有行業重大影響力的垂直應用大模型25個以上;力爭全市人工智能核心產業營業收入超3900億元,規模以上人工智能核心產業企業超700家;全市投向人工智能的產業基金組建規模突破1000億元。6月24日,鄭州市人民政府辦公室印發《鄭州市場景驅動人工智能創新發展行動方案(2025—2027年)》,其中提出培育大模型產業生態。深化與DeepSeek等人工智能頭部企業的合作,引入高質量通用型大模型;支持大模型企業深耕細分領域,聚焦智慧醫療、智能工廠、智慧交通、智慧文旅等重點場景,做精做強一批具有行業競爭力的垂直大模型。
李棟認為AI作為新一輪產業趨勢,隨着大模型的不斷迭代、模型性能的不斷提高以及推理成本的不斷下降,有望持續賦能到各行各業,目前海外已經在模型層和垂直應用(AI+教育、AI+醫療等)取得商業化進展,國內AI頂層框架持續落地,強化需求牽引,加快重點行業賦能,並涌現出以DeepSeek、通義千問、豆包、kimi為代表的優質大模型,建議投資者重點關注互聯網巨頭、AIDC、AI電源等環節的投資機會。
風險提示:AI商業化落地不及預期、H20存在斷供風險、國產AI芯片進展不及預期等。
(以上內容僅供參考,不作為投資決策依據。投資有風險,入市需謹慎。)
南京晨報/愛南京記者 許崇靜