“百模大戰(zhàn)”正酣!同質(zhì)化或構(gòu)成“硬傷”? 需從應(yīng)用入手反哺大模型|直擊外灘大會(huì)
原創(chuàng)
2023-09-08 13:39 星期五
財(cái)聯(lián)社記者 黃心怡
①大模型作為創(chuàng)業(yè)公司來(lái)講,一定要慎重,這個(gè)豪賭是很大的;
②AI應(yīng)用的生態(tài)需要更加繁榮,這樣才能反過(guò)來(lái)推動(dòng)模型的發(fā)展。

《科創(chuàng)板日?qǐng)?bào)》9月8日訊(記者 黃心怡) 今年以來(lái)AI熱度持續(xù)攀升,近半年內(nèi)全球近百家公司、機(jī)構(gòu)相繼發(fā)布大語(yǔ)言模型相關(guān)產(chǎn)品。國(guó)內(nèi)也正面臨著“百模大戰(zhàn)”,有數(shù)據(jù)顯示,全國(guó)有至少130家公司研究大模型產(chǎn)品,其中做通用大模型的有78家。

在外灘大會(huì)期間,《科創(chuàng)板日?qǐng)?bào)》記者對(duì)話了小冰公司CEO李笛,螞蟻集團(tuán)副總裁、螞蟻基礎(chǔ)大模型負(fù)責(zé)人徐鵬,就大模型的落地前景和挑戰(zhàn)進(jìn)行了探討。

現(xiàn)在行業(yè)里面最大的問(wèn)題其實(shí)是太雷同了?!崩畹褜?duì)于大模型風(fēng)潮直言,“大家都沿著同一條路徑往前走,沒(méi)有多樣性,這和創(chuàng)新精神是違背的。創(chuàng)新其實(shí)不是追趕,而是有新的方法,去實(shí)現(xiàn)自己的優(yōu)勢(shì)?!?/p>

李笛還強(qiáng)調(diào),大模型創(chuàng)業(yè)需要慎重?!拔矣X(jué)得大模型作為創(chuàng)業(yè)公司來(lái)講,一定要慎重。如果創(chuàng)新是在一個(gè)維度的線性發(fā)展,那么只要追就可以了。但現(xiàn)在還不知道技術(shù)范式是不是這個(gè)方向。一旦最后的方向跟現(xiàn)在的方向有夾角,那么你跟得越快,創(chuàng)業(yè)公司就會(huì)走得越偏。當(dāng)然,如果原本是一個(gè)擁有非常強(qiáng)業(yè)務(wù)的公司,想嘗試用大模型去改變?cè)瓉?lái)的業(yè)務(wù),那么是沒(méi)有任何問(wèn)題的。但假如你就是吃大模型這碗飯,那這個(gè)豪賭是很大的。因?yàn)闆](méi)有人能確定,OpenAI也不能確定,風(fēng)險(xiǎn)很高?!?/p>

對(duì)于大模型同質(zhì)化的問(wèn)題,徐鵬也認(rèn)為,“現(xiàn)在很多吃大模型這碗飯的,大家做的都是偏雷同的,真正對(duì)于擴(kuò)性本身的發(fā)展并不能帶來(lái)多大的推動(dòng)作用?!?/p>

不過(guò),徐鵬補(bǔ)充說(shuō)道,雷同從另一個(gè)角度看,也是源于中國(guó)還處于追趕的階段,首先要及格,之后才有機(jī)會(huì)發(fā)展的更好。

“比如說(shuō)百度、騰訊、阿里等等,都要做到跟GPT類似的水平。相信在這之后會(huì)有很多創(chuàng)新的點(diǎn),可以做不一樣的東西。只是現(xiàn)階段還處在追齊GPT能力的階段?!?/p>

金沙江創(chuàng)投主管合伙人張予彤在大會(huì)上指出,當(dāng)前生成式人工智能創(chuàng)業(yè)與投資爆發(fā),今年上半年投資額已超過(guò)去年全年水平。頭部25家生成式AI已吸收170億美金的融資,估值雖有泡沫,但泡沫中也有顛覆性的機(jī)會(huì)。生成式AI投資將圍繞那些具備護(hù)城河的AI原生應(yīng)用展開(kāi)。

徐鵬表示,AI應(yīng)用的生態(tài)需要更加繁榮,這樣才能反過(guò)來(lái)推動(dòng)模型的發(fā)展?,F(xiàn)在至少看起來(lái)應(yīng)用生態(tài)還不夠繁榮,應(yīng)用的場(chǎng)景上面還沒(méi)有那么豐富。

”還是要從應(yīng)用入手,應(yīng)用可以做出來(lái)非常多不一樣的東西?!毙禊i說(shuō),“如今國(guó)內(nèi)外的開(kāi)源模型,給大家?guī)?lái)了創(chuàng)新上的便利,不用從頭開(kāi)始浪費(fèi)大量的財(cái)力去訓(xùn)練基礎(chǔ)模型。所以,如果大家都把力量放在大模型應(yīng)用的創(chuàng)新上面,會(huì)反過(guò)來(lái)看到大模型在什么地方做得不到位,哪里還有很大的提升空間,反過(guò)來(lái)能促進(jìn)大模型技術(shù)的發(fā)展?!?/p>

數(shù)據(jù),是決定大模型性能的三大要素之一。用來(lái)訓(xùn)練模型的數(shù)據(jù),將直接決定模型的質(zhì)量。李笛判斷,中文語(yǔ)料所存在的挑戰(zhàn)沒(méi)有想象中那么大?!?strong>中文的語(yǔ)料要好好地清洗,還是可以的。但把語(yǔ)料真正挖清楚、清洗得足夠好,這是苦力活。

徐鵬也認(rèn)同語(yǔ)料清洗確實(shí)是一個(gè)苦力活?!岸艺l(shuí)都逃不開(kāi),但是中文本身的數(shù)據(jù)量級(jí)應(yīng)該是夠的。“

展望大模型的未來(lái),徐鵬稱,短期內(nèi)容易高估技術(shù)帶來(lái)的變化,而長(zhǎng)期可能會(huì)低估其產(chǎn)生的效應(yīng),要冷靜地看待長(zhǎng)期帶來(lái)的價(jià)值。

“當(dāng)這樣的大潮起來(lái)之時(shí),要非常認(rèn)真地看清它,到底帶來(lái)的東西是什么,能力邊界到底在哪里。既不能盲目做太多不切實(shí)際的幻想,但又不能離開(kāi)這個(gè)幻想。因?yàn)橹挥谢孟氩庞袆?dòng)力,才有更多的人愿意做一些看上去不靠譜的事情。我們應(yīng)有一定的機(jī)制支持人們長(zhǎng)期在這個(gè)方向做進(jìn)一步的投入,然后找到核心應(yīng)用場(chǎng)景、真正能夠帶來(lái)變化的東西。然后就可以反哺到人工智能的發(fā)展。“

收藏
152.03W
我要評(píng)論
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
要聞
股市
關(guān)聯(lián)話題
8293 人關(guān)注
4.24W 人關(guān)注