21世紀經(jīng)濟報道記者張梓桐上海報道
“百模大戰(zhàn)”的火熱正在使得當前的算力供給面臨著越來越大的能耗挑戰(zhàn)。
(資料圖片僅供參考)
一方面,算力供給帶來巨大的電力消耗。根據(jù)國際能源機構(gòu)(IEA)的數(shù)據(jù)顯示 ,2022年全球數(shù)據(jù)中心用電量為2400~3400億千瓦時,約占全球最終電力需求的1%~1.3%。根據(jù)信通院統(tǒng)計,我國2022年數(shù)據(jù)中心能耗總量1300億千瓦時,同比增長16%,預(yù)計到2030年,能耗總量將達到約3800億千瓦時。
而另一方面,企業(yè)IT基礎(chǔ)設(shè)施投入持續(xù)上升,面臨降本增效壓力。
在算力需求井噴以及國家“雙碳”政策規(guī)劃的雙重壓力下,承載著底層基礎(chǔ)設(shè)施功能的數(shù)據(jù)中心將如何進一步節(jié)能減排成為市場與行業(yè)關(guān)心的核心議題。
“如今數(shù)據(jù)中心節(jié)能降碳正在面臨著制冷系統(tǒng)能耗較高、IT設(shè)備利用率低、海量的算力需求以及硬件設(shè)備的全生命周期管理四重挑戰(zhàn)。”浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥在第二屆外灘大會上接受21世紀經(jīng)濟報道記者采訪時表示,面向AIGC產(chǎn)業(yè)熱潮下的新型數(shù)據(jù)中心基礎(chǔ)設(shè)施建設(shè)需求,數(shù)據(jù)中心建設(shè)和部署模式一方面要持續(xù)提高模塊化、集成化程度。另一方面則要進一步提升服務(wù)器的計算效率。
而小冰CEO李笛則在接受21世紀經(jīng)濟報道記者采訪時指出,當前行業(yè)存在著一定的算力焦慮,但算力是否真的短缺還要取決于公司的商業(yè)模式效果,“如果你能夠通過交付生成式AI滿足了需求,成功消耗了算力,那么算力就實現(xiàn)了高附加值。”
算力能耗挑戰(zhàn)
記者在2023年外灘大會現(xiàn)場了解到,2022年全國數(shù)據(jù)中心總耗電量已經(jīng)達到約2700億千瓦時,占全社會用電量的3.1%,超過2座三峽水電站年發(fā)電量,數(shù)據(jù)中心綠色化轉(zhuǎn)型成為亟待解決的難題。
目前業(yè)內(nèi)普遍認為,從能耗構(gòu)成看,數(shù)據(jù)中心總能耗包括IT設(shè)備能耗和制冷、配電等系統(tǒng)的能耗,其中,制冷系統(tǒng)用電量已與IT設(shè)備相當,占總用電量高達43%。因此,優(yōu)化制冷系統(tǒng)成為數(shù)據(jù)中心提高能源效率的重要環(huán)節(jié)。
而隨著芯片功耗與服務(wù)器功耗持續(xù)上升,全球數(shù)據(jù)中心單機柜功率也快速增長?!拔覀冾A(yù)計到2025年平均功率將達到25kW。高功耗芯片,高密度服務(wù)器及單機柜密度的演進,導致傳統(tǒng)風冷制冷模式在換熱性能及能耗優(yōu)化方面逐步受限?!壁w帥在接受記者采訪時說道。
其次,趙帥指出,當前算力行業(yè)內(nèi)供給的核心是IT設(shè)備,但就其容量而言,IT設(shè)備的利用率通常十分低。
例如,服務(wù)器的利用率往往只有5%到15%,處理器為10%到20%,存儲設(shè)備為20%到40%,網(wǎng)絡(luò)設(shè)備的利用率為60%到80%。然而,當設(shè)備閑置時,其仍會消耗在最大利用率下消耗的大部分功率,一臺標準服務(wù)器即使不工作也要消耗30%到40%的最大功率。
“如何最大程度減少IT設(shè)備空閑,讓閑置的算力跑起來至關(guān)重要。同時,在提供每單位算力的同時減少能源消耗,提升能源轉(zhuǎn)換效率也是實現(xiàn)數(shù)據(jù)中心綠色低碳發(fā)展的關(guān)鍵?!壁w帥說道。
此外,步入AIGC時代,算力需求愈發(fā)呈指數(shù)級增長,AIGC的大模型訓練、實時交互等均需要海量算力的支撐。趙帥表示,大模型的參數(shù)量超過千億,甚至突破萬億級別,預(yù)計智算中心將迎來更快發(fā)展。而高算力往往也伴隨著高能耗,新型數(shù)據(jù)中心基礎(chǔ)設(shè)施建設(shè)需要面向AI大算力需求,在提供高算力的同時,實現(xiàn)節(jié)能降耗。
綠色數(shù)據(jù)中心建設(shè)路徑
有業(yè)內(nèi)人士在現(xiàn)場對記者指出,當前大模型帶來的算力井噴需求預(yù)計在2025年之前都不會看到衰退。而這背后的核心驅(qū)動因素還是人工智能大模型技術(shù)變革式的發(fā)展。
“我們并不認為模型本身是一個應(yīng)用,我們認為大模型是一個基礎(chǔ)設(shè)施。所以,我們現(xiàn)階段為了達到基礎(chǔ)設(shè)施的自主可控,就需要從大模型數(shù)據(jù)的收集、訓練、以及最后調(diào)優(yōu)等環(huán)節(jié)上面全面入手來解決問題?!蔽浵伡瘓F副總裁徐鵬在接受21世紀經(jīng)濟報道記者采訪時指出,人類社會短期可能很容易高估一個技術(shù)帶來的變化,但是長期有可能會低估它帶來的變化。因此,就大模型技術(shù)本身來看,行業(yè)仍然需要持續(xù)而堅定的投入。
而在趙帥看來,在算力攻擊勉勵較大挑戰(zhàn)的背景下,綠色數(shù)據(jù)中心建設(shè)就需要著眼“規(guī)劃設(shè)計、綠色產(chǎn)品選擇、實施部署、智能運維?!彼拇蠓矫?。
在規(guī)劃設(shè)計層面,趙帥表示,首先機房在選址上應(yīng)該盡可能地選擇在能充分利用風、水、空氣等自然冷源,使用太陽能、風能等可再生能源并且擁有地理優(yōu)勢的地區(qū)。
在綠色產(chǎn)品選擇和新技術(shù)的采用上,他表示,可以考慮部件級節(jié)能、整機級節(jié)能再到數(shù)據(jù)中心級節(jié)能產(chǎn)品的引入。“舉個例子來看,不同產(chǎn)品的導入能帶來更大的效益,采用高效的冷卻系統(tǒng),引入液冷系統(tǒng)增加10%的初始投入,而它帶來的電能節(jié)省使其1.5年即可回收成本?!壁w帥說道。
而在面對客戶不同數(shù)據(jù)中心的差異的時候,行業(yè)在選取新建數(shù)據(jù)中心和老舊機房改造方案時又該怎樣抉擇?
對此,趙帥表示,可以提前進行場景規(guī)劃設(shè)計,合理布局,以及盡可能使得資源循環(huán)利用,比如將數(shù)據(jù)中心產(chǎn)生的熱量搜集用于區(qū)域級供熱等;同時實施部署階段,優(yōu)化設(shè)備配置,根據(jù)客戶業(yè)務(wù)需求采用階段性配置,分期擴容,避免過度。
此外,智能化也是數(shù)據(jù)中心發(fā)展的重要趨勢,通過管理系統(tǒng)對數(shù)據(jù)中心的能耗進行智能化的監(jiān)控和管理,優(yōu)化設(shè)備整體性能,將進一步提升數(shù)據(jù)中心的綠色化水平。
趙帥指出,智能運維方面,使用智能監(jiān)控系統(tǒng)可以實時監(jiān)測設(shè)備的運行狀態(tài)和能源消耗情況,及時發(fā)現(xiàn)和解決問題,減少能源浪費。使用智能調(diào)度和優(yōu)化策略,如基于需求的電力分配、智能散熱管理等,可以更高效地管理能源,降低能源消耗。建立能源管理平臺,統(tǒng)一管理數(shù)據(jù)中心的能源利用情況,進行集中監(jiān)控、分析和優(yōu)化,提高整體能源利用效率。
(文章來源:21世紀經(jīng)濟報道)