熱門資訊> 正文
2026-02-06 15:30
偉創力嵌入式和關鍵電源事業部總裁ChrisButler
對於計劃擴容的數據中心運營商而言,確保電網接入無疑是首要任務。畢竟,無電則無數據中心是行業共識。然而,人工智能(AI)和高性能計算(HPC)對電網帶來的超高需求,正使另一個問題迅速凸顯:電力質量。儘管運行傳統工作負載的數據中心已在很大程度上解決了電力質量問題,但隨着計算性質的變化,AI/HPC應用正帶來全新挑戰。
數據中心依賴持續、不間斷的電力來保障運行時間、保護設備並維持運營效率。確保高電力質量是電力公司和數據中心運營商共同的責任。本文將探討影響電力質量的關鍵因素,以及運營商在AI時代可採取哪些措施來保護其設施、降低財務風險,併成為電網共享體系中的好鄰居。
電力質量特性及其后果
電力質量指的是供應至數據中心電力的可靠性、穩定性與潔淨度。計算密集、時間敏感的AI處理與推理任務尤其易受電壓波動、頻率偏差、諧波、斷電及瞬態(突發)事件等電力異常的影響,其后果可能立竿見影且極為嚴峻。
劣質電力可能會引發一系列問題:
·處理器報錯、內存不穩定及存儲系統故障,進而造成數據訪問中斷與結果損毀
·訓練結果既不可靠也不可復現,延迟大幅攀升和系統超時,最終影響模型與算法的完整性
·節點故障波及跨多服務器運行的大型AI工作負載
·電壓驟降引發系統重置或活動會話丟失
·高密度AI機櫃中電源單元或轉換器過熱
·系統為保護組件而觸發熱降頻甚至熱關斷
·變壓器故障——其停機代價尤為高昂,目前新變壓器的交付周期可達兩至四年,即便對採用冗余系統的運營商亦是重大風險
電網本非因此而建
電網的設計初衷是應對典型的供需周期,平滑峰谷、適應波動。儘管將能源轉化為可用電力並可靠配送的過程本質複雜,電網在多數情況下仍能良好履行這一職責。
然而,全球多數電網基礎設施建於20世紀六七十年代,那個時期的用電需求更易預測與管理。當時主流的白熾燈、交流電機和模擬設備所產生的電力負載呈線性特徵,不會破壞電力質量,且設備消耗的電流與施加的電壓呈正比。
現代數字環境則截然不同。以服務器、LED照明和變頻暖通空調為例,它們產生非線性、尖峰式負載,需要更精細的電力質量管理。與過去規律的日峰和季節性特徵不同,由於AI數據中心、加密貨幣挖礦及「萬物電氣化」趨勢帶來的需求波動,電力尖峰可能隨時發生。
此外,電網自身還需應對太陽能、風能等可再生能源的不可預測性——其波動遠甚於化石燃料或水電。系統因此充斥着更多不確定性,而傳統的公用事業規劃框架並未將這些因素納入考量。
數據中心與共享資源之爭
理解AI時代數據中心的電力消耗,可以這樣此喻:每次開關操作都會擾動能量流動——開、關、開、關。
這本質正是微芯片的工作方式,只是當今先進芯片每秒開關電流數十億次,且在此過程中消耗巨大電能。考慮到單個超大規模數據中心可能部署數百萬GPU、CPU、NPU和TPU,電力公司面臨的挑戰可見一斑。
根源何在? 因為電網是共享資源。電力工程師基於三大技術考量——電力質量、可靠性及供需平衡——來設計與維護電網,服務於從家庭、小型企業到龐大科技園區和大型製造工廠的所有用户。任一用户造成的擾動都會影響全局。
「髒電」:數據中心是元兇嗎?
簡而言之,有時確實是。通常,電壓呈現為平滑周期性振盪的滾動波——即正弦波(圖1中綠線)。上世紀90年代中期確立的關於諧波電流、電壓閃變等因素的穩態負載國際標準,曾為數據中心運營商提供良好指引,部分運營商甚至為自身設施設定了更嚴苛的標準。
但AI模型導致用電量出現大規模驟增,使得數據中心內安置服務器、存儲及網絡設備的「白空間」成為失真源。快速、不均勻的電力脈衝會產生諧波,扭曲電壓波形(藍線與黃線)。
這如同持續向小池塘投入大小不一的石子,漣漪在從岸邊反彈時相互碰撞扭曲。服務器中用於穩壓的高頻開關更增添了額外電氣噪聲。而極端天氣(如熱浪)會進一步放大諧波——當變頻驅動器(VFD)調節供應至冷卻風扇(位於數據中心配電、冷卻系統和發電機所在的「灰空間」)的電力頻率與電壓時。借用一句名言:「我們已經遇到了敵人,那就是我們自己。」
若未經過恰當濾波,這片混沌將回饋至電網本身,不僅干擾數據中心自身供電,更波及電網上的所有用户。電力質量問題可能損壞醫院、工廠、電信網絡等處的敏感設備,變壓器故障甚至可能導致整個區域斷電。
含有大量諧波、電壓失真、瞬變、三相不平衡及其他異常的「髒電」,還會加劇能量損耗,其根源在於發電與輸電效率的同步下降。諧波會導致電氣設備發熱,進而引發連鎖效應,對數據中心的電能使用效率(PUE)產生顯著負面影響:能損攀升、能效下降、額外冷卻需求上升、功耗激增。
圖1.諧波失真
真實案例與次諧波新解
儘管以AI為核心的數據中心仍屬少數,麥肯錫公司預測,到2030年,約70%的新增數據中心容量將用於支持先進AI工作負載。UptimeInstitute調研亦顯示,74%的託管服務提供商已投資基礎設施升級以滿足客户AI需求。AI與HPC應用的需求催生機遇,但也因新挑戰的出現讓運營商按下「暫停鍵」。
例如,某超大規模運營商告知,其數據中心的建設可能導致周邊200英里半徑內的電力擾動。類比而言,若該數據中心位於巴黎,其影響範圍將遠至布魯塞爾和倫敦郊區[圖2]。另一運營商則表示,其今年計劃採購的發電機總量足以支撐芝加哥全市(270萬人口)的用電。
圖2.法國巴黎周邊200英里半徑示意圖
偉創力正與超大規模客户攜手開發解決方案,以應對AI/HPC計算帶來的諸多挑戰。其中一項突破性技術便是電容儲能系統(CESS)。這項新技術能在電力負載突變引發大幅功率瞬變(如電壓或電流浪湧)時,為電力供應提供支撐並維持其穩定性。
測試發現,雖然AI工作負載引發的諧波問題可通過多種方式緩解,但次諧波問題尤為突出——這並非電源系統自身導致,而是負載波形通過電源反射形成。次諧波是頻率低於基頻的振盪,負載脈衝會加劇其產生。儘管聽似無害,次諧波不僅會降低電力質量、引發本地發電機故障,還可能引起DC/DC轉換器不穩定、導致過熱及設備過早損壞——而現有解決方案如有源諧波濾波器、諧波抑制變壓器和UPS系統均無法解決此問題。
FlexCESS能有效抑制次諧波,且不會放大電力和冷卻需求,或縮短運行AI/HPC工作負載的芯片壽命[圖3]。這不僅解決了數據中心內部的電力質量和可靠性問題(如文初所述),更能防止次諧波對電網本身造成負面影響。
圖3.輸入功率諧波分析— 0.1Hz脈衝/佔空比=20%
偉創力還與Comsys合作,利用其有源動態解決方案(ADF系列)監控數據中心供電,每秒數千次補償電氣缺陷,以降低電壓擾動、穩定電網。
淨化電力,方能輕裝前行
運行AI/HPC工作負載的運營商必須找到合適的方式,在不影響其他所有用户電力供應穩定性的前提下開展業務。隨着數據中心負載不斷攀升,電力公司正在更新併網規則,部分甚至要求提交經驗證的負載模型。
在算力激增、數據中心遍佈的當下,「防患於未然」是公認的金科玉律。一般而言,電網是髒電的接收端。若電網基礎設施過時或超載,擾動將回傳至源頭及其他用户,這不僅構成財務與運營風險,更危及企業聲譽。
數據中心運營商淨化電能、履行責任,符合自身根本利益,具體措施包括:
·開展諧波前瞻諮詢:在系統設計階段提前評估諧波可能帶來的影響,前瞻性規避潛在問題,並制定易於擴展升級的敏捷策略
·統籌次諧波治理:不僅關注諧波,更將次諧波納入考量,並採用如FlexCESS等方案予以抑制
·部署智能濾波器:配置可持續監控電流、在檢測到諧波時注入抵消信號的「智能」有源諧波濾波器,阻止諧波注入電網
·應用功率因數校正:使用電容器組或動態補償系統等功率因數校正設備,減少電氣「溢泄」,提升系統能效
·安裝隔離變壓器:通過隔離變壓器將噪聲與諧波限制在數據中心內部
·攜手電力公司:通過智能電網協調,預測並平滑大型AI負載
·嚴守併網標準:遵循IEEE519(美標)、EN50160(歐非中東)等對諧波失真水平設限的併網標準(未達標可能導致經濟處罰),以及涵蓋電磁干擾(EMI)發射與接收的IEC61000系列標準
系統級挑戰,系統級解決
高質量電力供應如同無名英雄——當電力質量良好時一切如常:燈亮了,設備運轉。但自電力質量開始下降那一刻起,問題便接踵而至。它們可能悄然而至,如未被察覺卻導致遠端設備莫名故障的諧波;它們也可能以更明顯的方式現身,如引發即時(有時不可逆)業務中斷的電壓驟降或變壓器熔燬;它們也可能以另一種形式出現——一家知識豐富、積極主動的電力公司,努力在所有利益相關方之間實現平衡。
電力質量是系統級問題,需要系統級解決方案。偉創力與領先芯片公司及數據中心客户緊密合作,針對產品路線圖與架構演進,前瞻性地應對可預見的電力質量挑戰。憑藉涵蓋關鍵電源、嵌入式電源產品及直觸芯片冷卻解決方案的完整產品組合,我們獨到的視角貫穿從電網到芯片的全鏈路,為客户提供寶貴洞察,助力構建複雜問題的全面解決之道。
本文翻譯自偉創力嵌入式和關鍵電源事業部總裁ChristopherButler的文章,於2025年9月22日發表。