①一體機(jī)成為大模型商業(yè)化探索過程中一大熱門趨勢,大模型廠商、ICT服務(wù)商及ISV服務(wù)商均已布局。 ②目前公開招投標(biāo)的AI項(xiàng)目中,硬件和服務(wù)占總金額90%以上,浪潮信息一體機(jī)將硬件與面向大模型的解決方案做了整體打包。 ③業(yè)內(nèi)關(guān)注模型微調(diào)、推理,微調(diào)重要性凸顯。
財(cái)聯(lián)社9月30日訊(記者 付靜)當(dāng)前中國10億參數(shù)規(guī)模以上大模型數(shù)量已超100個(gè),技術(shù)雖蓬勃發(fā)展而實(shí)際落地程度仍待提升。近日于鄭州召開的2024中國算力大會上,財(cái)聯(lián)社記者觀察到,大模型應(yīng)用落地仍受到產(chǎn)業(yè)鏈關(guān)注,一體機(jī)則成為大模型商業(yè)化探索過程中一大熱門趨勢,算力硬件廠商浪潮信息(000977.SZ)亦在此次大會上推出元腦企智EPAI(Enterprise Platform of AI)一體機(jī),提供“算力+平臺+服務(wù)”的大模型解決方案。
浪潮信息產(chǎn)品方案開發(fā)部總經(jīng)理魏健在接受財(cái)聯(lián)社在內(nèi)媒體采訪時(shí)表示,“應(yīng)用現(xiàn)狀跟市場趨勢存在鴻溝,怎么讓企業(yè),特別是傳統(tǒng)企業(yè)把大模型應(yīng)用快速落地,基于這樣一個(gè)背景,我們做了大模型一體機(jī)。”
此前工信部賽迪研究院數(shù)據(jù)顯示,2023年我國AI企業(yè)新增368家,生成式AI的企業(yè)采用率已達(dá)15%,其中制造業(yè)、零售業(yè)、電信行業(yè)、醫(yī)療健康四大行業(yè)采用率分別為5%、13%、10%和7%;預(yù)計(jì)2035年生成式AI有望為全球貢獻(xiàn)近90萬億元經(jīng)濟(jì)價(jià)值,其中我國將突破30萬億元,占比超四成。
同時(shí)魏健在采訪中提及一組數(shù)據(jù):AI市場公開招投標(biāo)的項(xiàng)目中,去年全年、今年上半年硬件方面占比分別約60%、61%,軟件方面占比分別約11%、5%,今年上半年服務(wù)方面占比從去年的17%升至30%以上。“相當(dāng)于說是硬件和服務(wù)占了項(xiàng)目總金額的90%以上?!?/p>
魏健稱,此次浪潮信息發(fā)布的一體機(jī)主要面向制造、金融等行業(yè)客戶、傳統(tǒng)ISV和SI三類用戶。以SI為例,“多模管理也好、多元算力管理也好,還需要有對大模型專門的調(diào)優(yōu)能力,我們可以把服務(wù)集成到一體機(jī)產(chǎn)品里?!?/p>
據(jù)悉,元腦企智EPAI一體機(jī)基于為大模型應(yīng)用場景設(shè)計(jì)的元腦服務(wù)器,預(yù)置元腦企智EPAI企業(yè)大模型開發(fā)平臺,支持8顆NVIDIA最新Hopper架構(gòu)GPU全互聯(lián)在內(nèi)的多元算力,預(yù)置Yuan2.0、Baichuan2、ChatGLM3、Qwen1.5、GLM4、Llama3等7個(gè)基礎(chǔ)大模型,旨在解決數(shù)據(jù)處理、模型微調(diào)、RAG搭建、模型部署、應(yīng)用上線和系統(tǒng)運(yùn)維等問題。
財(cái)聯(lián)社記者注意到,元腦企智EPAI一體機(jī)涵蓋五種產(chǎn)品規(guī)格,主要面向推理、訓(xùn)推一體化、整機(jī)柜集群化交付等場景。
(受訪者供圖)
“推理算力是一個(gè)很重要的增長方向,尤其是邊緣端推理。無論車路協(xié)同、智慧園區(qū)還是高速收費(fèi)站等,邊緣領(lǐng)域的推理應(yīng)用關(guān)注不同的產(chǎn)品形態(tài)?!蔽航∠蜇?cái)聯(lián)社記者表示。
“大模型其實(shí)從預(yù)訓(xùn)練、微調(diào)到推理有大概三個(gè)階段,現(xiàn)在業(yè)內(nèi)的關(guān)注點(diǎn)已經(jīng)走到了微調(diào)跟推理,并且微調(diào)的重要性越來越凸顯了?!崩顺毙畔I應(yīng)用架構(gòu)師Owen ZHU在采訪中表示。
Owen ZHU稱,此次發(fā)布的一體機(jī)亦集成了部分當(dāng)下與算力相匹配、在業(yè)內(nèi)較為可用易用的微調(diào)技術(shù)。他舉例稱,“一個(gè)10B參數(shù)的模型可能需要200-300G的顯存才能做微調(diào),可能一臺機(jī)器就已經(jīng)開始有點(diǎn)‘勉強(qiáng)’了,更何況我們現(xiàn)在用的都是30B、40B的模型,至少需要三四臺機(jī)器,門檻也有點(diǎn)過高了。現(xiàn)在一些高效微調(diào)技術(shù)能做到用10G甚至不到10G的顯存把10B參數(shù)的模型微調(diào)跑起來。也就是說,一些新技術(shù)的應(yīng)用能夠降低算力門檻?!?/p>
而站在成本角度,魏健告訴財(cái)聯(lián)社記者,浪潮信息大模型一體機(jī)新品單臺價(jià)格在二三十萬到兩百萬之間,“如果用戶有50萬左右的硬件設(shè)備初期投入,就可以進(jìn)行至少10億到300億參數(shù)規(guī)模的模型訓(xùn)練,且在單機(jī)設(shè)備上用到更好的算力?!?/p>
同時(shí)她表示,浪潮信息對用戶的報(bào)價(jià)為一體機(jī)整體報(bào)價(jià),但“如果把一體機(jī)拆開來看,硬件可能占80%,軟件占20%。我們是一個(gè)產(chǎn)品公司,做這個(gè)商業(yè)模式,更多還是為了激發(fā)整個(gè)行業(yè)生態(tài)的應(yīng)用?!?/p>
“一體機(jī)的生意邏輯是對的,是否受客戶認(rèn)可比較關(guān)鍵?!币晃籄I算力從業(yè)者告訴財(cái)聯(lián)社記者。
財(cái)聯(lián)社記者問及當(dāng)前用戶對于大模型一體機(jī)的接受意愿,魏健表示,“我了解到接受意愿還是挺強(qiáng)烈的,(一體機(jī))和一些傳統(tǒng)硬件用戶的使用習(xí)慣還是蠻匹配的。我們在過去三、四個(gè)月里做了近百家的POC測試,有意愿去做應(yīng)用定制開發(fā)、讓我們整理數(shù)據(jù)等等的用戶其實(shí)能占到30%?!?/p>
值得關(guān)注的是,大模型一體機(jī)在業(yè)內(nèi)熱度較高,智譜AI、商湯科技、中軟國際等主流AI大模型廠商、ICT服務(wù)商及ISV服務(wù)商均已推出一體機(jī)相關(guān)產(chǎn)品。
Owen ZHU稱,“大家都在叫一體機(jī),但其實(shí)內(nèi)涵差距是比較大的??赡芪覀冏铋_始聽到一體機(jī)的概念時(shí)是在講訓(xùn)推一體,而現(xiàn)在我們在講的是把硬件跟面向大模型的解決方案整體打包的方案,是一個(gè)大模型的開發(fā)平臺。”
“大模型廠商有的實(shí)際上跟我們是合作伙伴關(guān)系,但是我們的一體機(jī)跟他們有差異。大模型廠商在軟件、算法能力方面很強(qiáng),我們更強(qiáng)調(diào)算力的調(diào)度管理、算法的調(diào)度,跟不同模型做適配,包括對模型參數(shù)也做了很多研究,其實(shí)還是為了更好地發(fā)揮硬件性能優(yōu)勢?!蔽航「嬖V財(cái)聯(lián)社記者。