熱門資訊> 正文
2025-10-29 15:23
來源:快科技官方
這幾年,生成式AI浪潮方興未艾,各種應用如雨后春筍,更高級的智能體AI、具身AI也已經嶄露頭角,顯現了無盡的潛力。
但是一個市場領域蓬勃發展時,往往是機遇與挑戰並存。如何更好地抓住AI這一波機會,怎麼玩才能實現收益最大化,從科技巨頭到個人開發者都在思考。
其中,對於小型企業、工作室乃至個人開發者來説,端側AI藴藏着更多可能,而工欲善其事、必先利其器,如何選擇高效、經濟的端側開發平臺,就成了一道令人糾結的選擇題。
所謂端側AI,就是在本地設備上完成相關AI模型部署和推理計算,因為雲側AI雖然算力強大、模型接入方便,但也存在數據隱私泄露、成本高昂、數據延迟等方面的不友好因素,並不是所有AI負載都適合上雲。
而端側AI最大的阻礙就是算力/顯存、存儲空間等方面的掣肘太多,消費級筆記本、臺式機往往太弱,像英特爾推出的桌面AI超算中心產品,專業工作站又太貴,蘋果則是生態過於封閉。
這種情況下,AMD、NVIDIA先后站了出來,AMD率先拿出了代號Strix Halo鋭龍AI MAX+ 395的迷你AI工作站,大約半年后NVIDIA則上市了代號DGX Spark GB10的桌面AI超級計算機,可謂針鋒相對。
事實上,兩家的解決方案本質上是類似的:強大的CPU/GPU算力引擎、大容量的統一內存和共享顯存、迷你的整機造型、友好的開發環境、相對低廉的成本。
但是在硬件設計、性價比、兼容性等多個方面,二者又截然不同。
對於普通的AI開發者來説,該如何選擇呢?
AMD方面基於代號Strix Halo的新一代鋭龍AI Max 300系列處理器,尤其是旗艦型號鋭龍AI Max+ 395,擁有全新的Zen 5 CPU架構、RDNA 3.5 GPU架構,還加入了獨立的算力高達50 TOPS 的NPU AI引擎。
支持最多128GB LPDDR5X-8000統一內存,四通道,帶寬達256GB/s,可分配最多96GB作為專用顯存,以及額外的16GB共享顯存,可高效運行千億參數的大模型,尤其適合MoE專家模型。
如果一臺還不能滿足,Strix Halo甚至支持雙機、四機甚至六機並聯,從而提供最多768GB總內存、576GB的總專用顯存。
六聯智能最近就在中國國際信息通信展覽會上做了一個六機並聯的演示。
軟件生態方面,StrixHalo本身基於X86架構和Windows操作系統生態,對於其原生應用的適配有先天優勢,同時,AMD ROCm開源軟件框架、Ryzen AI software等開發工具逐步完善,可充分調動CPU/GPU/NPU三大引擎,還有各種第三方資源,正在逐漸成為AI時代的樹莓派。
AMD Strix Halo迷你AI工作站目前已經有豐富的產品陸續上市,普遍都是迷你機形態,不佔用更多空間,甚至可以隨身攜帶,包括但不限於Abee、AOKZOE、惠普、聯想、希未、零刻、六聯智能、極摩客、天鋇、銘凡、積核等等。
終端價格也非常友好,普遍低至1.5萬元甚至更低,對於個人開發者和中小企業來説非常友好,相比於動輒數萬甚至數十萬的工作站來説非常親民。
它們可以廣泛應用於個人和企業AI開發者、AI教育與科研、小型企業/單個業務部門/小型工作室、醫療/金融/法律等特定領域專家助手、會議室等邊緣場景、金融/財務/交易研究與決策、數據分析、家庭AI中樞,等等不同場景。
NVIDIA DGX Spark(代號Project Digits)雖然年初就官宣了,但一直拖到第四季度才上市,可謂相當坎坷。
但DGX系列由來已久,最早可以追溯到2016年的DGX-1,黃仁勛親自給了馬斯克一臺,進而催生了OpenAI。
DGX Spark的核心引擎是GB10 SuperChip超級芯片,配備了自研的Grace CPU、Blackwell GPU算力引擎,性能達到千萬億次級別,但是沒有NPU。
同樣支持128GB LPDDR5X-9400統一內存,帶寬更高301GB/s,而且能分享100GB左右作為顯存使用,可運行最高2000億參數的AI大模型,或者最高700億參數的微調模型。
它也支持雙機並聯,從而支持4050億參數大模型。
軟件生態方面最大的依仗自然是NVIDIA CUDA,預裝NVIDIA AI軟件堆棧,支持開箱即用,還能訪問模型、庫、NVIDIA NIM微服務等生態工具。
全球不少大型科技企業、研究機構都已經收到了DGX Spark進行測試、驗證、優化和開發工作,宏碁、華碩、戴爾、技嘉、惠普、聯想、微星等廠商則正在推出各自的OEM產品。
價格相對更貴一些,普遍需要3-4萬元起步,甚至更高。
總體而言,AMD Strix Halo、NVIDIA DGX Spark都為AI開發者提供了優秀的解決方案,堪稱本地端側AI開發的神器,各自都有各自的顯著優勢。
AMD Strix Halo的最大優勢就是更好的兼容性,基於非常成熟的x86硬件、Windows系統。
無需特殊優化,開箱即有大量的開發軟件、應用軟件,不但針對AI負載有越來越好的優化,在日常應用中也無需任何妥協,因此在開發工作之外還是一個優秀的平臺,可以「一機多用」。
相比之下,NVIDIA DGX Spark基於Arm硬件、Linux系統,生態兼容方面存在天然劣勢,在日常應用中可謂舉步維艱,只能是個單純的開發機,當然好的一面就是CUDA生態極為優秀、強大,開發工作非常容易上手,但註定只是個單純的開發機。
同時,AMD Strix Halo迷你AI工作站起步更早,產品發展非常順利,目前已經有大量款式,而且價格普遍非常實惠,最低殺到了1.3萬元左右,對於開發者來説簡直是白菜價。
NVIDIA DGX Spark折騰了將近一年才終於上市,第三方產品還在陸續發佈,而且價格普遍貴得多,至少也得3.4萬元以上,失去了端側AI的成本優勢。
最后在AI推理性能方面,雖然二者都支持128GB統一內存和100GB左右的顯存,但是目前來看,AMD Strix Halo明顯佔據優勢,尤其是憑藉更低的價格,性價比更是遙遙領先。
因為NVIDIA DGX Spark剛剛推出,而且雙方架構截然不同,所以目前的直接對比還很少。
幸好油管博主Bijan Bowen做了一次深入對比,我們就借用他的數據來看看,從網友評論看該博主的測試被稱讚稱為真正獨立客觀,最為誠實,而其他類似測試都像是DGX Spark的廣告。
AMD方面使用的是極摩客EVO-X2,體積只有大約2.76升,最小巧的Strix Halo迷你工作站之一,配備了2.5G網卡、雙USB4等等,價格14999元,非常典型。
這里測試了Llama 3.3 70B、GTP-OSS 20B、Qwen3 0.6B等幾個典型模型庫。
結果顯示,在推理輸出表現上,也就是每秒生成多少個token,雙方其實互有勝負,而且差距都在個位數,可謂旗鼓相當。
但是TTFT,也就是輸出第一個token的時間,AMD Strix Halo取得了三勝一負的好成績,而且領先幅度都非常大, NVIDIA DGX Spark只是在Llama上贏了一次。
在AI發展日新月異的當下,無論是AMD Strix Halo,還是NVIDIA DGX Spark,乃至蘋果的Mac Studio,都可謂生逢其時,完美順應了本地端側、邊緣側AI推理開發與應用的趨勢,提供了堪稱當下最好的解決方案。
但蘋果的生態過於封閉,而英特爾推出的桌面AI超算中心產品基本算是消費級的配置和性能,無法與這三款產品同台競爭。多數小企業和個人開發者能選擇的,也就剩下AMD Strix Halo和NVIDIA DGX Spark兩個了。
不管叫迷你AI工作站,還是桌面AI超級計算機,它們都解決了數據安全、成本控制的難題,開闢了一個全新品類,填補了AI開發的最后一公里空白。
AMD Strix Halo的豐富產品、優秀兼容性、超高性價比,使之可以賦能更多的普通開發者、小型企業和工作室,讓大家都跟上生成式AI的新浪潮,挖掘出獨特的商機,同時作為日常使用也極其強大,AMD要做的就是不斷提供更加強大、便利的開發環境。
NVIDIA DGX Spark有着領導AI的市場地位、更好的CUDA開發生態和基礎,如果能再便宜一些,無疑會有更多的專業用户。
不過還是前面提到的那句話,NVIDIA DGX Spark基於Arm硬件、Linux系統,在日常應用中可謂幾無用武之地,註定只是個單純的開發機。