熱門資訊> 正文
2025-09-11 22:00
(來源:雷科技頻道)
2025年9月10日,上海的秋風中夾雜着一絲技術革命的熾熱氣息。
就在這一天,Arm將其全新的AI技術領導力峰會——「Arm Unlocked 2025」的亞洲首站設在了這座充滿活力的東方都市。
這不僅是一場簡單的技術交流,更是一次集結了頂尖科技公司、芯片合作伙伴及生態系統領袖的技術發佈。Arm在會上正式發佈了其面向移動終端的新一代CSS平臺——Arm Lumex,為端側AI體驗帶來全面優化與提升,並進一步釋放終端場景的全部潛能。
雷科技此次也受邀來到活動現場,為大家帶來現場、立體和一手報道。
Arm Lumex:名字變了,效率倍增
有的讀者可能會問,Arm Lumex是什麼?
想要了解這個問題,你需要先搞清楚什麼是Arm CSS產品。
Arm CSS,全稱Compute Subsystems(計算子系統),是Arm提供的一種「硬件全家桶」解決方案。
它是將Arm最新的CPU、GPU以及相關的系統IP(如互連總線、內存控制器)預先集成、配置並驗證好,打包成一個完整的高性能平臺。
對於芯片設計公司而言,直接採用CSS方案,就無需從零開始進行復雜的IP集成和驗證工作。這能極大地縮短SoC的開發周期,降低研發風險,幫助合作伙伴更快地將搭載最新技術的產品推向市場。它本質上是一個高性能、高效率的「芯片半成品」。
而這次發佈的Arm Lumex,便是包含新一代Arm C1 Ultra「超大核」與Arm C1 Pro「大核」CPU以及Mali G1-Ultra GPU,並支持SME2可擴展矩陣延伸指令集的全新CSS平臺。
C位登場的,自然是支撐起Lumex的全新Armv9.3 CPU集羣。
根據官方介紹,Lumex CSS平臺支持3nm製程,實現了兩位數百分比的CPU IPC性能提升,其中Arm C1-Ultra超大核相較上代Cortex-X925,單線程峰值性能提升25%、Arm C1-Pro大核,與上一代的 Arm Cortex-A725 CPU 相比,在相同主頻下持續性能提升 16%,在同等性能下能效提高多達12%,在單線程和多線程性能上均實現了一次重要的躍遷。
除此以外,這次Arm還帶來了適用於次旗艦移動設備的Arm C1-Premium核心和適用於可穿戴設備的Arm C1-Nano核心,前者的等面積效率更優,后者更是主打極致能效,廠商們可以根據自身需求靈活調整。
衆所周知,Armv9架構本身就是專為AI和安全而設計的。在過去幾年的演進中,Arm不斷為其增添針對機器學習(ML)等領域的計算能力。
正因如此,這次Armv9.3在AI性能上也得到了大幅度的強化。它通過對底層微架構的深度優化,尤其是對SME2(第二代可伸縮矩陣擴展)指令的硬件級支持,為實際場景中的 AI 驅動型任務帶來了顯著的AI性能提升。
具體來説,就是AI性能提升高達五倍;語音類工作負載延迟降低4.7倍;音頻生成速度提升2.8 倍。
舉個例子,通過Arm、支付寶與vivo的三方合作下,大語言模型 (LLM) 的交互響應時間縮短了多達40%,現場展示的通義2.5B體驗機就能很好地展現出這個效果。
全新的Arm CPU在AI計算能力上的飛躍,讓實時的端側AI推理成為現實,以往需要依賴雲端才能完成的複雜AI推理任務,如今在設備端就能流暢運行。無論是更聰明的離線語音助手,還是能夠實時理解畫面的AI影像系統,都將得益於SME2帶來的算力解放。
現如今,SME2已經廣受業界領先生態夥伴的採用,包括阿里巴巴、支付寶、三星System LSI、騰訊及vivo,力求在本地實現更快、更安全且隨時可用的智能體驗。
作為圖像核心的新一代Mali G1-Ultra GPU,其表現同樣突出:
在各類圖形基準測試中,Mali G1-Ultra較前代產品實現了20%的性能提升,AI推理性能提升最高 20%,同時得益於全新的第二代光線追蹤技術,其光線追蹤性能相較前代提升了兩倍,為《暗區突圍:無限》、《原神》等主流遊戲帶來了全面的性能增強。
此外,Mali G1-Premium與Mali G1-Pro兩款GPU,也為硬件資源受限的設備提供了更出色的性能與能效表現,能在更低的功耗下,為中高端設備提供持久且高效的支持。
Arm的AI觀:旗艦設計為何要「AI優先」?
在Arm Unlocked 2025上海站峰會的主題演講結束后,我們受邀參加了持續半天的技術分享會。
在這次分享會中,Arm終端事業部產品管理副總裁James McNiven和Arm 終端事業部產品管理總監Ronan Naughton為我們更深度地解讀了Arm Lumex的技術價值。
James首先帶我們回顧了行業發展所面對的挑戰,從工藝節點/封裝技術/發佈周期帶來的壓力,到用户關注的遊戲、性能和應用,都和如今的AI技術息息相關。
雖然AI被公認為最具顛覆性的新技術,但想要完全釋放其潛力,尤其是在數十億計的終端設備上實現普惠,正面臨着嚴峻的挑戰。AI對性能、功耗和安全性的極致要求,正在迫使整個半導體行業進行一次從硬件到軟件的系統性重構。
而這,也就是為什麼Arm Lumex平臺會以「AI優先」的原因。
從設計之初,Arm Lumex就將AI和安全置於核心。本次峰會上亮相的全新Armv9.3 CPU和GPU,其設計的根本出發點,就是爲了高效執行AI工作負載。
他特別強調了SME2技術的重要性,讓CPU以遠超以往的效率處理神經網絡運算,是實現高能效端側AI的關鍵,雷科技也在現場體驗到了基於SME2實現的端側語音生成0.3B、端側文字交互2.5B以及實時翻譯/瑜伽指導功能。
你別說,效果都挺驚艷的,特別是這個語音生成,蠻期待這些端側應用落地的一天。
再來看看GPU方面的解析,Ronan表示,與前一代Arm Immortalis-G925 GPU相比,Mali G1-Ultra的光線追蹤性能提升高達兩倍,並在主流圖形基準測試中,性能表現提升20%,全新引入的矩陣乘法單元 (MMUL) FP16 指令,更可加速如語義分割、去噪、深度估計、物體檢測、語音識別和圖像增強等端側關鍵AI工作負載。
然而,強大的硬件只是故事的一半。
有與會者提問:目前AI生態面臨的更大挑戰在於軟件層面,開發者們迫切需要一個簡單、高效的方式來利用底層硬件的AI能力,而不是為每一款芯片都進行復雜的底層優化,Arm在這方面有做出什麼努力嗎?
James答道,Arm推出的KleidiAI,正是爲了解決這「最后一公里」的難題。目前Kleidi適配了從Arm NEON到Armv9.3 SME2的擴展指令集,通過這款軟件包,開發者無需成為硬件專家,也能確保自己的AI應用在Arm平臺上跑得又快又省電,這極大地降低了AI技術的應用門檻。
雷科技在體驗時也問了一下工作人員,「在雲端AI算力如此強大的今天,Arm為何如此堅持大力投入資源,去提升終端設備上的AI處理能力?」
工作人員對此解釋道,他認為端側AI與雲端AI並非取代關係,而是互補共生。將更多的AI計算放在設備端處理,不但能帶來極致的響應速度與體驗,更能保證用户的隱私與安全,而且寄希望於設備永遠在線並連接雲端進行AI計算是不現實的,高能效的端側AI是實現萬物智能的必由之路。
在我看來,整個AI時代的競爭,本質上是生態的競爭。
Arm的機遇在於,憑藉其在半導體行業的核心地位和廣泛的生態系統,他們不但可以提供高性能的IP,更是能夠成為連接硬件創新與軟件應用之間的「橋樑」,讓科技的進步真正惠及每一個人。
説在最后
毫無疑問,AI的需求使得智能終端生態在過去的一年里迎來了新的爆發式增長,人們正在不停地嘗試、開拓新的應用範例、探索新的硬件形態,尋找着能夠為消費者帶來更好體驗的產品——
不管是軟件還是硬件的。
個人認為,相較於以往用「Cortex-A/X/R/M」覆蓋所有領域的做法,Arm如今的思路更為清晰:為不同的垂直市場,打造專屬的品牌和技術平臺。
與Arm Lumex一同浮出水面的,還有面向PC市場的 Niva、面向汽車市場的Zena和麪向物聯網市場的Orbis CSS平臺。這一系列動作,清晰地勾勒出Arm意圖在每一個細分賽道上,都建立起無可撼動的技術領導力和品牌辨識度。
隨着未來的AI生態繼續發展,我們無疑將會看到更多基於Arm CSS平臺打造的新一代智能終端產品,而AI生態的需求也將繼續驅動Arm開發更高性能、更具效率的新產品。
Arm Lumex CSS,正是他們為這個未來交出的第一份,也是最重要的一份答卷。
9月5日-9日,世界最大家電與消費電子展IFA2025在柏林盛大舉辦。
雷科技派出了史上最大規模海外報道團「雷科技IFA25報道團」飛赴柏林,對IFA2025進行現場、立體、一手報道。共輸出40+內容,在雷科技300萬微信粉絲矩陣、1000萬新媒體矩陣傳播,全網閲讀量/播放量預估超500萬。我們對IFA2025的報道,再一次得到了DeepSeek的AI認證「全網最強」。
期待26年1月CES,我們拉斯維加斯再見。