繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

蘋果芯片,一路狂飆

2025-07-23 08:54

很難説手機何時首次擁有除通話以外的功能,但就遊戲而言,最早出現手機遊戲的可能是1998年的諾基亞6110(照片1),當時附帶了貪吃蛇遊戲(照片2)。

它搭載的是TI MAD2芯片組「5L43H04」,該芯片組搭載了運行頻率為13MHz的「ARM7TDMI」內核。據稱,ARM7TDMI的性能為0.7 DMIPS/MHz,因此在13MHz下運行時,其性能約為9.1 DMIPS。順便提一下,Arduino Uno R3的性能據稱為9.85 DMIPS,因此,如果您認為它們的性能相似,就很容易理解了。

不過當時還沒有應用處理器的概念,5L43H04的主要處理是通信控制,Snake只是附加功能,所以實際上當時比較處理器性能並沒有多大意義。

此后,搭載應用處理器的功能手機開始出現。然而,這一代手機的處理器各不相同(松下使用了基於Uniphier的自有處理器),因此很難找到公平的比較方法。此外,由於本次討論的主題是「iPhone之后的智能手機處理器」,我不會討論iPhone之前的機型。

此外,由於 Android 製造商眾多,列出清單非常困難,所以這次我僅列出了 Google 提供的產品。此外,由於是智能手機,我排除了平板電腦(iPad 和 Nexus 平板電腦)和媒體播放器(iPod Touch)。

順便説一句,我們之所以排除平板電腦,是因為平板電腦的可用功率是智能手機的兩倍多(散熱能力也是兩倍多),因此很難將它們進行比較。這次,我們只比較每核功耗低於 1 到 2W 的智能手機。

2007-2010年:智能手機市場的崛起(表1)

第一代iPhone於2007年6月發佈,隨后,兼容3G手機網絡的iPhone 3G於2008年7月發佈。

iPhone 搭載的是三星製造的基於 ARM11 的 SoC,其額定頻率為 620MHz,但實際運行頻率僅為 412MHz。相比之下,初代 Raspberry Pi 使用的 Broadcom BCM2835 擁有同樣的 ARM11 內核,但運行頻率僅為 700MHz 左右,這意味着初代 iPhone 和 iPhone 3G 的性能僅為初代 Raspberry Pi 的 60% 以下。

不過,2009年蘋果發佈的iPhone 3GS,搭載的是三星的APL0298C05,內置了Cortex-A8;2010年的iPhone 4,搭載的蘋果A4,同樣內置了Cortex-A8(不過運行頻率略高)。

Android陣營稍晚一些,於2010年1月率先發布了「Nexus One」,並於同年11月發佈了「Nexus S」。Nexus One搭載的是單核Cortex-A5處理器的「Snapdragon S1」,性能略遜一籌,而Nexus S則搭載的是Cortex-A8處理器的「Samsung Exynos 3」,性能幾乎與iPhone相當。

2013-2016 年:過渡到 64 位

2011年3月,ARM發佈了64位指令集ARM v8-A 。蘋果是首批支持該指令集的公司之一,並憑藉Apple A7實現了64位支持。

谷歌雖然趕上了搭載驍龍 805 的 Nexus 6,但不可否認的是,他們的反應略顯迟緩。順便提一句,iOS 和 Android 都很快將操作系統本身兼容 64 位,但應用程序的 64 位兼容卻需要一些時間。

順便説一句,在 x86 架構下,32 位和 64 位的指令相同,因此處理性能基本沒有差異。當然,升級到 64 位也有好處,例如主內存超過 4GB,但就對性能的直接影響而言,通用寄存器的數量增加了(因此無需浪費堆棧),這使得速度略有提升(事實上,最初有很多編譯器即使在 64 位下也忠實地輸出了堆棧代碼)。

然而,就 Arm 而言,32 位 (AArch32) 和 64 位 (AArch64) 的指令集本身有所不同,從而可以實現更快的運行速度。話雖如此,性能變化雖然沒有那麼顯著,但也確實實現了一定的加速。然而,要享受這些優勢,不僅操作系統,應用程序也需要兼容 64 位,而這種轉變似乎進展緩慢。

2015-2024:big.LITTLE/DynamiQ 實現

在 Arm,在單個處理器中同時實現高性能和低功耗核心的「big.LITTLE」於 2011 年發佈,但直到 2015 年之后纔在產品中實際實現。

谷歌率先在 Nexus 6P 的驍龍 810 處理器上實現了 big.LITTLE 架構。次年,也就是 2016 年,蘋果也在 A10 Fusion 處理器上實現了 big.LITTLE 架構。

我覺得有意思的是,當時驍龍的競爭對手,以及當時並未列入該表格的三星Exynos和聯發科Helio/Dimensity系列,都推出了8核產品陣容,這是big.LITTLE支持的最高配置。有些產品,比如聯發科的Helio X20至X30,甚至推出了獨特擴展的10核配置(2個超高性能核心+4個高性能核心+4個低功耗核心)的產品陣容,而蘋果則保持了2 big + 4 LITTLE的6核配置。

現實中,考慮到功耗限制,總會存在即使擁有很多大核心,也無法長時間運行的問題,而從結果來看,不能否認蘋果的實現可能取得了更高的有效性能。

2023年起:實施Armv9-A

最新的架構變化是支持Armv9-A。原本Arm指令集,尤其是Arm v8-A,有很多子版本。

  • v8.0-A:基本 64 位指令

  • v8.1-A:添加了原子指令/VHE(虛擬化主機擴展)

  • v8.2-A:增加了 FP16 支持、統計分析、RAS(可靠性、可用性、可維護性)功能和 SVE

  • v8.3-A: 嵌套虛擬化、RCpc(Release Consistent 處理器一致)、指針認證を追加

  • v8.4-A:增強加密指令,增加SHA512/SHA3兼容指令,增加安全EL2和MPAM(內存分區和監控)

  • v8.5-A:添加了隨機數生成指令、分支目標標識符和內存標記。

  • v8.6-A:MatMul 指令、BF6 支持、虛擬化增強、指針驗證增強(增強型 PAC2/FPAC 實現)、高精度計時器

  • v8.7-A:支持 PCIe 熱插拔、原子 64 字節加載/存儲、WFI(等待指令)/WFE(等待事件)

  • 然而,有沒有一款處理器能夠支持這一切呢?就連Arm也沒有這樣的處理器。

或許他們認為這是一個問題,因為2021 年發佈的Armv9-A,或者更確切地説是 Armv9.0-A,是由 Arm v8.5-A + CCS(機密計算架構)+ SVE2 組成的,而 v9.1-A/v9.2-A 是融合了 v8.6-A/v8.7-A 功能的 v9.0-A。

Arm 內核方面,2021 年及之后發佈的「Cortex-X2」、「Cortex-A710」、「Cortex-A510」均兼容 Arm v9-A,而蘋果 2024 年發佈的「A18 Bionic」也終於兼容 Arm v9-A。

不過,就蘋果而言,A10 兼容 Arm v8.1-A,A11 兼容 Arm v8.2-A,A12 兼容 Arm v8.3-A,A14 兼容 Arm v8.4-A,A15 兼容 Arm v8.5-A,A16/A17 兼容 Arm v8.6-A。而 Arm 的 Cortex-X1 則基本兼容 Arm v8.1-A,只添加了 Arm v8.2-A 中的 RAS 和加密指令、v8.3-A 中的 LDAPR 指令以及 v8.4-A 中的點積指令,因此是一個不完整的實現。

Arm v9-A 的優勢除了支持 SVE2 之外,還在於它解決了 v8.5-A 中的分支目標標識符和內存標記等漏洞,但由於 Apple 實際上首先實現了這一點,因此這實際上並不是什麼大缺點。

智能手機 CPU 的速度變得有多快?

那麼,我們已經簡要介紹了蘋果和谷歌五個時代的智能手機以及它們所實現的核心功能,最后讓我們總結一下它們的性能。

我做了一些研究,但 Geekbench 是唯一一個涵蓋所有內容的測試平臺,它包含了 v3、v4、v5 和 v6 的分數。表 1 至表 5 展示了 Geekbench 的結果,這些結果代表了多核分數的代表性值。

另外,表1中各代產品均沒有Geekbench跑分,沒辦法,只能通過核心的DMIPS值(ARM11:1.25 DMIPS/MHz,Cortex-A5:1.57 DMIPS/MHz,Cortex-A8:2.0 DMIPS/MHz,Cortex-A9:2.5 DMIPS/MHz)乘以核心數和工作頻率來計算這一代產品的性能比。

此外,基準測試之間的性能比較也以基準測試結果的幾何平均值來計算,就像前面的計算一樣。

結果如圖1所示,對於蘋果來説,2007年6月的第一代iPhone到2024年9月的iPhone 16 Pro之間的性能比計算為384.9倍,17年零3個月就是384.9倍,所以年增長率大概是40.5%。

另一方面,對於谷歌而言,2010 年 1 月的 Nexus One 與 2025 年 3 月的 Google Pixel 9a 之間的比率約為 76 倍。年增長率約為 32.2%,略顯緩慢。原因之一是,谷歌的 Tensor G4 搭載了 Cortex-X4 核心,但其最高主頻僅為 3.1GHz,增長幅度不大,而主要原因被認為是使用了三星的 4LPP。考慮到競爭對手蘋果 A18 Bionic 的 Everest Core 最高主頻為 4GHz,這被認為是一定程度上抑制性能增長的一個因素。

6月19日,韓國媒體The Bell報道稱,谷歌已將 Tensor G5的製造外包給臺積電(韓語鏈接),但這似乎是不可避免的。如果我們假設Tensor G4運行在4GHz,並且Geekbench跑分也隨着運行頻率的提高而增加,那麼性能增長率將達到每年34.7%。雖然不如蘋果,但仍然是一個合理的性能增長。

在之前的文章中,我們展示了 49 年內 6769 萬次的性能提升,即每年 44.5% 的增長率,但蘋果的 40.5% 與這個數字相當接近。然而,如果查看圖表,就會發現即使是蘋果,其增長速度自 2019 年以來也逐漸放緩。2019 年 9 月的 A13 仿生芯片與 2024 年 9 月的 A18 仿生芯片之間的性能比大約是 2.2 倍。按年率計算,這僅相當於 15.1% 左右的增長。這可能是因為嚴格的功耗和實現面積限制,導致無法隨意增加核心數量或提高工作頻率。

另一方面,他們僅通過改進架構就能將性能每年提高 15%,這也許令人驚歎。

參考鏈接

https://pc.watch.impress.co.jp/docs/topic/feature/2033020.html

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。