AI智算中心現(xiàn)狀五問|行業(yè)調研
原創(chuàng)
2024-10-02 20:12 星期三
財聯(lián)社記者 付靜
①供給端緊缺狀況緩解,各類計算卡價格現(xiàn)已貼近銷售商成本線。
②智算需求持續(xù)增長,但需求方趨于理性,供需不完全匹配。
③全國百余個智算中心中,算力閑置并非普遍現(xiàn)象。
④從業(yè)者預計,部分智算中心三四年左右能夠“回本”。
⑤首個高質量算力評估體系發(fā)布,業(yè)內希望用更小算力產生更多的智能。

財聯(lián)社10月2日訊(記者 付靜)大模型參數(shù)規(guī)模持續(xù)增加,對AI算力基礎設施提出更高要求,當下AI智算行業(yè)蓬勃發(fā)展,智算中心建設加速。最新數(shù)據(jù)顯示,截至今年6月,全國在用算力中心機架總規(guī)模超過830萬標準機架,算力規(guī)模達246 EFLOPS(FP32),智算同比增速超過65%。

現(xiàn)階段供應端算卡價格和緊缺程度如何?供給端與需求端是否相匹配?全國百余個智算中心是否都滿負荷運行?建設智算中心何時能回本?人工智能算力如何實現(xiàn)高質量發(fā)展?圍繞五個核心問題,財聯(lián)社記者采訪了多位產業(yè)人士。

據(jù)財聯(lián)社記者梳理,此前AI算力供給端緊缺的局面有所緩解,但供需兩端不完全匹配,導致部分智算中心利用率較低。各地政府、企業(yè)的智算中心規(guī)劃雖屢見不鮮,真正能落地投入使用的數(shù)量或不及預期。有從業(yè)者預計,部分智算中心三四年左右能夠“回本”,與此同時,算力高質量發(fā)展亦受業(yè)內重視。

算卡價貼近銷售商成本線

“算力供應緊張確實是這幾年一個比較普遍的現(xiàn)象,算力能力好、生態(tài)適應性較好的產品,確實是很多人都搶著買。從使用者來講,當然希望智算能力能夠更好地支撐應用。”站在算力服務器供應商角度,浪潮云海首席科學家張東接受財聯(lián)社記者采訪時表示。

張東告訴記者,智算供應緊張存在周期性。

供給端當下狀況如何?上海六尺科技集團董事長、恒潤股份(603985.SH)子公司上海潤六尺科技有限公司總經理張亞洲向財聯(lián)社記者表示, “今年算力市場供應是有的,不像去年缺得很,目前各類計算卡的價格已經貼近銷售商成本線了?,F(xiàn)在行業(yè)內各種項目參與的人多、中介也多,原來做電腦做設備的、ICT通訊行業(yè)的全部‘卷’進來,但其實真正做成、做好的不多?!?/p>

近期,A股部分跨界智算玩家透露出了壓力,如:蓮花控股(600186.SH)旗下蓮花紫星目前已簽署的部分算力服務合同,可能存在收回采購成本實際所需時間超出預期或無法收回的風險,截至今年8月,蓮花紫星仍處于虧損狀態(tài),全年能否盈利存在不確定性;奧雅股份(300949.SZ)全資子公司奧創(chuàng)引擎與供應商潤信供應鏈協(xié)商簽署《算力服務器采購合同補充協(xié)議》,原計劃采購的128臺內嵌英偉達GPU芯片的高性能運算服務器數(shù)量變更為8臺。

據(jù)張亞洲觀察,今年6月-8月,GPU終端價格呈持續(xù)下跌態(tài)勢?!叭ツ甑捻椖拷衲晟习肽甓急幌袅?,今年在進行的項目主要有兩種情況:一是企業(yè)研發(fā)真正需要算力,主要集中在大型互聯(lián)網(wǎng)公司,二是一些地區(qū)拿了補貼、能源指標等配套建設智算中心?!?/p>

據(jù)了解,9月市場才出現(xiàn)了一波“掃貨”現(xiàn)象,“主要是受淡旺季和國際環(huán)境影響,但其實市場現(xiàn)貨資源并不多?!?/p>

記者亦從一位業(yè)內人士處獲悉,“之前4090的價格從一萬三千多漲到一萬六七千了”,不過據(jù)稱漲價主要由于《黑神話:悟空》對該款顯卡需求較強。

另外張亞洲稱,市場還存在算力供給零散的現(xiàn)象:部分供給方“可能只有5臺、10臺服務器,大一些的是64臺、100多臺,大批量的基本很少。這種供應商可能會承接一些實驗室、學校的散單需求?!?/p>

供需兩端不完全匹配

幾位從業(yè)者告訴財聯(lián)社記者,供給緊缺緩解并不意味著智算需求不及預期。張亞洲稱,智算需求呈增長態(tài)勢,且不斷有新的需求產生,不過當下需求方已趨于理性。

深圳人工智能產業(yè)協(xié)會執(zhí)行會長范叢明在接受財聯(lián)社記者采訪時談到了不同類型需求方的現(xiàn)狀:頭部企業(yè)、科研高校算力資源充足,而當下產業(yè)垂直大模型正在大量研發(fā),中小微企業(yè)算力緊張的情況存在。

值得注意的是,智算中心建設如火如荼,相關招投標項目逐月遞增。

此前數(shù)智前線報道,據(jù)不完全統(tǒng)計,僅今年前7個月,圍繞土建基礎設施和IT基礎架構等方方面面的建設內容,智算中心相關項目中標公告已發(fā)布超140個,其中至少24個項目中標金額超億元;7月國內公布的相關中標項目超40個。

中國信息通信研究院云計算與大數(shù)據(jù)研究所總工程師郭亮在剛剛落下帷幕的“2024中國算力大會”期間接受財聯(lián)社記者采訪時表示,“現(xiàn)在全國建了很多智算中心,據(jù)不完全統(tǒng)計,應有200個以上,但其中有90%的算力在1000P以下,意味著這部分算力中心對大模型訓練來說作用有限,以后的使用效率存疑。”

“算力需求是很大,只不過現(xiàn)有類型無法滿足用戶需求。無論是適配方面還是性價比角度,都達不到客戶的預期?!盜DC中國分析師杜昀龍對財聯(lián)社記者表示。

張亞洲也認為,目前存在算力供應端和需求端不完全匹配的狀況,“B端需求方一般都會找自己熟悉的單位。一個項目可能有幾十個人過來詢價,實際上只有跟項目方合作關系良好或者綜合實力比較受認可才可能成交,并不一定是以最低價成交?!?/p>

算力閑置是否普遍?

財聯(lián)社記者注意到,現(xiàn)階段算力設備是否滿負荷運行成為市場關注的焦點。

“現(xiàn)在很多算力已經得到了消化,但行業(yè)內確實存在小部分算力閑置的情況,比如說市場上可能有千臺機器的供應量,但可能有幾百臺機器在閑置。”張亞洲告訴財聯(lián)社記者。

據(jù)郭亮觀察,算力閑置并非是普遍現(xiàn)象,“我們團隊支撐了很多省市的相關工作。近期來看,據(jù)我們了解,寧夏算力中心的利用率還是很高的?!?/p>

現(xiàn)在比較普遍的是在網(wǎng)上賣內蒙古、西藏、新疆的算力,進行分時租賃,價格便宜,這就會導致建在廣東等地的智算中心利用率較低。” 范叢明告訴記者。

談及寧夏智算中心,郭亮分析,當?shù)卣w電價現(xiàn)在雖無補貼,但仍有優(yōu)勢;當?shù)刂撬阒行牡乃懔σ?guī)模較大,對于大模型訓練比較有用?!傲硗鈱τ谥撬銇碚f,網(wǎng)絡傳輸?shù)男阅芤鬀]那么強,數(shù)據(jù)完全可以通過線下的方式進行,這對我國中西部的智算中心來說是個比較好的應用場景?!?/p>

“從前期建設的算力消化程度看,頭部企業(yè)應該在80%,科研高校應該是30%-40%左右,市場化建設的算力消化程度應該在一半左右。”范叢明對記者表示。

據(jù)范叢明觀察,字節(jié)、騰訊、華為、百度等頭部企業(yè)“不停訓練大模型,數(shù)據(jù)量越大,算力需求越大,幾乎不存在算力閑置情況”;科研高校算力“建得大、用得少”,閑置相對較多;中小企業(yè)算力閑置則相對較普遍。由于定位不清、位置偏遠、價格過高,前期建設的算力消化程度是不夠的。”

杜昀龍認為,算力是否閑置主要看幾個方面:上層軟件對算力的調動、硬件之間的互聯(lián)方式、硬件設施與應用場景的適配、用戶部署成本。

9月初,騰訊云副總裁沙開波在接受財聯(lián)社記者采訪時也談到了智算中心即便具備了硬件資源,但仍缺乏配套軟件能力,缺乏實際的終端客戶或應用場景等現(xiàn)象。

張亞洲稱,算力出現(xiàn)閑置,背后原因較為復雜,與各類智算卡的性能、項目方的運營、網(wǎng)絡產品技術服務能力等均有關,而業(yè)內的核心關注點在于應用端是否有實際產出。

建智算中心幾年能回本?

算力閑置導致部分智算中心成本過高,是業(yè)內普遍關注的問題之一。

對此,范叢明認為,智算中心供應價太貴,用戶用不起,就導致智算中心計算的連續(xù)性不夠,成本過高。

談及智算中心運營問題,郭亮在“2024中國算力大會”期間對財聯(lián)社記者表示,“近期大家在各種場合會經??吹剿懔φ{度平臺的信息,但建了之后效果怎么樣?據(jù)了解,有些地方花了上千萬投資建了平臺,因為設計理念、功能特色等問題,實際上并沒有很好地利用起來。目前全國還沒有符合大家需求的平臺出現(xiàn),而這對我國智算中心的整體運營特別重要。”

他進一步表示,“對于智算來說,即使是政府投資也需要回報,更何況是企業(yè)?,F(xiàn)在業(yè)界確實是群雄紛爭的局面,但還沒有一統(tǒng)天下的角色出現(xiàn),當然我們也在努力,本次算力大會發(fā)布的中國算力服務平臺(河南)就是我們推出的一個解決方案?!?/p>

(財聯(lián)社記者攝于2024中國算力大會現(xiàn)場)

關于智算中心如何平衡成本和性能,范叢明告訴財聯(lián)社記者,“算力投資回收期一般是五年左右,因為算力市場變化太快,還要加上電費、運營等其他成本。如果能找到頭部大廠使用,我覺得回本時間大概在三四年左右?!?/p>

杜昀龍則認為,智算中心的運營方應制定長期規(guī)劃,降低最終用戶的使用成本,培養(yǎng)使用習慣,后期恢復標價;重點培養(yǎng)應用案例,逐漸擴大覆蓋行業(yè)。

由“量”轉“質”何解?

客觀來看,中國算力發(fā)展依然任重道遠。

2024中國算力大會發(fā)布的《中國算力發(fā)展報告(2024年)》顯示,截至去年底,全球智算市場同比增長130%以上,而中國智算市場同比增長超過60%。

財聯(lián)社記者注意到,算力建設熱潮之下,有從業(yè)者在上述大會上分享了諸多“冷思考”,并將目光聚焦高質量算力。

浪潮信息(000977.SZ)聯(lián)合信通院發(fā)布的業(yè)界首個高質量算力評估體系《人工智能算力高質量發(fā)展評估體系報告》表示,高質量算力是基于最新人工智能理論,采用先進人工智能的計算架構,與算法、數(shù)據(jù)深度結合的高水平計算能力。

財聯(lián)社記者從浪潮信息方面獲悉,當前算力集群實測性能和理論性能差距過大問題明顯,部分算力實際性能不足理論性能的10%。公開數(shù)據(jù)顯示,傳統(tǒng)模式下的智算中心GPU利用率平均數(shù)值低于30%。

張東認為,對于算力的關注不能僅僅關注芯片,“很多地方買算力,點名芯片的品牌,構建一個多大規(guī)模的算力中心,實際上看芯片指標沒有意義,大家還是要從系統(tǒng)角度,綜合考慮最后怎樣滿足應用需要?!?/p>

郭亮也表示,“目前,我們在芯片這一層選擇不多。但計算和網(wǎng)絡融合方面是一個熱點。目的是把一臺AI服務器,從現(xiàn)在的8卡擴展到32卡、512卡,這對智算集群的能力,包括集群的部署、上線、運維都有益處?!?/p>

財聯(lián)社記者多方采訪獲悉,大規(guī)模智算落地絕非簡單的規(guī)模數(shù)量堆疊,其復雜程度呈指數(shù)級增加,對智算建設運營者的技術實力、資源優(yōu)勢、產業(yè)協(xié)同能力有著很高的要求。

至于智算中心如何由“量”轉“質”,郭亮稱,“建設智算中心需要‘適度超前’,結合當?shù)貙嶋H需求做整體的分析和預判?!?/p>

收藏
100.52W
我要評論
歡迎您發(fā)表有價值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論
要聞
股市
關聯(lián)話題
1.09W 人關注
7486 人關注