①我們身處何種時代?唯一不變的是變化本身 ②擁抱通用人工智能技術(shù)革命時代 ③百花齊放:大模型的場景與應(yīng)用 ④大模型的成本與價值 ⑤對策與路徑:如何實(shí)現(xiàn)大模型更好落地
財(cái)聯(lián)社12月26日訊(編輯 李夢琪 王澤坤)我們顯然已經(jīng)進(jìn)入一個前所未有的技術(shù)加速度發(fā)展的創(chuàng)新時代。2023年以來,以ChatGPT為代表的大模型、人工智能等新技術(shù)突破為各行各業(yè)發(fā)展帶來新的前景。電商、醫(yī)療、教育等行業(yè)頭部企業(yè)都在積極探索AI+賦能產(chǎn)業(yè)發(fā)展的新路徑。
在這樣的時代背景下,大模型的場景與應(yīng)用是否真正如大家看到的那般,呈現(xiàn)百花齊放的格局與生態(tài)?我們推進(jìn)大模型應(yīng)用過程中,需要承擔(dān)哪些成本?又將能夠?yàn)槠髽I(yè)生產(chǎn)發(fā)展帶來怎樣的價值?以及大模型如何實(shí)現(xiàn)更好落地?
聚焦上述問題,復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、博士生導(dǎo)師,上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華在“2023復(fù)旦管院科創(chuàng)周”之復(fù)旦科創(chuàng)先鋒年度論壇上以《走向千行百業(yè)的大模型》為主題分享了對大模型產(chǎn)業(yè)應(yīng)用的見解,他認(rèn)為生成式語言模型已經(jīng)逐步向多模態(tài)、具身化快速發(fā)展,這一系列的發(fā)展趨勢形成合力,將會為人們帶來一場前所未有的 “通用人工智能技術(shù)革命”。
今天,我們系統(tǒng)地整理了肖仰華的演講內(nèi)容,用萬字長文解讀其對大模型的前沿分析,以下為分享內(nèi)容:
一、我們身處何種時代?唯一不變的是變化本身
我們所有的行業(yè)從業(yè)人員,自ChatGPT去年11月底上線以來,這一年是夢幻般的一年,這一年里,我們看到ChatGPT在不到2個月的時間里突破了1億的月活,而此之前最快的TikTok實(shí)現(xiàn)1億月活的用戶為9個月,我們似乎一覺醒來就會見證了一些新的技術(shù)到來,我們IT研發(fā)人員,這一年每天早晨一開始都是一個新的開始,每天早晨最擔(dān)心的第一件事兒是不是又發(fā)生了什么新的技術(shù)變革,我們這個飯碗還能不能端得穩(wěn),很多新技術(shù)的名詞層出不窮,我們還沒有弄明白一個新概念是怎么回事兒,另外一個更新的技術(shù)又冒出來了,我們似乎處于前所未有的技術(shù)加速發(fā)展的時代,唯一不變的是變化本身。
這樣一個快速變化的技術(shù)世界帶來的是這個世界日益復(fù)雜。
以一輛整車為例,有將近2萬到3萬個零部件,每一個零部件需要經(jīng)歷數(shù)萬個零件組合而成的生產(chǎn)線,這樣的加工流程可能有700多道程序。所以我們整個人類社會日益變成了人、機(jī)、物融合的復(fù)雜系統(tǒng),這個系統(tǒng)的復(fù)雜性可以說是前所未有。實(shí)際上我們整個人類現(xiàn)代文明早就經(jīng)歷了早期的嬰童階段,而進(jìn)入當(dāng)下高度復(fù)雜的成熟階段,“復(fù)雜”往往是“成熟”另外一個同義詞。
快速發(fā)展的世界、日益復(fù)雜的世界帶來的是人類很多社會系統(tǒng)不確定性增加。我們看到所謂的“黑天鵝事件”“灰犀牛事件”高頻發(fā)生。我們又看到,當(dāng)下老齡化的趨勢加重,各種自然災(zāi)害頻發(fā),國際經(jīng)濟(jì)的競爭形勢也在加劇,氣候、病毒等各種因素疊加在一起,給整個世界的發(fā)展帶來了巨大的不確定性。
在上世紀(jì)90年代,社會學(xué)家和經(jīng)濟(jì)學(xué)家已經(jīng)在警告我們,技術(shù)發(fā)展有可能帶來整個社會發(fā)展的失速,而帶來所謂的失控風(fēng)險。可以說當(dāng)下我們?nèi)祟愖畲蟮膯栴}、命題是如何應(yīng)對日益失控的風(fēng)險,但是我們?nèi)俗鳛橐环N生物智能,我們每一個人的認(rèn)知能力是有限的,我們在座每一個人差不多10億個神經(jīng)元,1萬億左右神經(jīng)突觸參數(shù),而且今天的人類并不比1000年前的人類聰明多少。我經(jīng)常開個玩笑,如果大家真的穿越到古代1000年前的宮廷里,生存1個小時都是很困難的。這說明我們并不比古人聰明多少。這些事實(shí)說明我們?nèi)祟惖恼J(rèn)知受限于生物智能的本質(zhì),其能力是有限的,而我們有限的認(rèn)知能力難以認(rèn)知當(dāng)下快速變化、日益復(fù)雜、日益不確定性的世界,這是當(dāng)下人類最大的問題。我們一定要把認(rèn)知能力讓渡給機(jī)器,讓機(jī)器也一定程度上具備人的認(rèn)知能力,進(jìn)而開展人機(jī)協(xié)作的認(rèn)知,才有可能認(rèn)知日益加速變化、日益復(fù)雜的世界。
我們一旦把認(rèn)知能力賦予了機(jī)器,機(jī)器的認(rèn)知能力是可以隨著世界復(fù)雜性的增長而增長。我們看到現(xiàn)在機(jī)器智能,只要喂給它的數(shù)據(jù)越來越多,只要供養(yǎng)它的算力越來越多,它的智能仍然在持續(xù)增長,唯有機(jī)器形成認(rèn)知世界的能力,它才有可能跟世界復(fù)雜性的增長同步。所以,未來的認(rèn)知模式一定是人機(jī)協(xié)作的認(rèn)知模式。
當(dāng)下很多技術(shù)的出現(xiàn),某種程度上是時代發(fā)展的必然,是時代發(fā)展到今天對技術(shù)所提出的必然要求,我們必須發(fā)展人機(jī)協(xié)作的認(rèn)知,人機(jī)協(xié)作的認(rèn)知結(jié)果就是大家熟知的ChatGPT這一類的大模型,大模型可以認(rèn)為是機(jī)器認(rèn)知這個世界的一個技術(shù)成果。
我們看到的大模型,嚴(yán)格來講是大規(guī)模的生成式語言模型,它已經(jīng)能夠在絕大部分人類所擅長的認(rèn)知任務(wù)中,比如說自然語言處理、理解,超過人類的水平,甚至達(dá)到的專家的水平,可以說生成式大模型出現(xiàn)具有時代發(fā)展的歷史必然性,它是機(jī)器發(fā)展認(rèn)知智能的必然趨勢。
二、擁抱通用人工智能技術(shù)革命時代
而這樣一個趨勢在快速的發(fā)展中,我們看到不單單是機(jī)器人理解我們千行百業(yè)的文本,它又進(jìn)一步快速向多模態(tài)發(fā)展,可以理解圖像,理解我們現(xiàn)場的照片,并且做出非常精妙的回答,甚至可以像剛才說的機(jī)器人,它可以操控機(jī)械臂,完成一些只有人類才可以完成的復(fù)雜規(guī)劃任務(wù)。也就是說生成式語言模型已經(jīng)逐步向多模態(tài)、具身化快速發(fā)展,這一系列的發(fā)展趨勢形成合力,帶來的是一場前所未有的技術(shù)革命。我們把這場技術(shù)革命稱為“通用人工智能技術(shù)革命”,因?yàn)樗呀?jīng)讓一些機(jī)器具備了一般人的認(rèn)知能力,具備了開放世界的理解能力,而且這種通用人工智能技術(shù)革命絕不是傳統(tǒng)意義上的某一次技術(shù)革命所能比擬的。
我們所熟知的蒸汽革命、電氣革命,本質(zhì)上都是人類智能本身的產(chǎn)物,唯獨(dú)這一次的通用人工智能技術(shù)革命,革的是智能本身的命。大家想想看,人類社會生活、學(xué)習(xí)、工作中哪一個活動不需要使用我們的智力呢?但凡將來用到我們?nèi)祟愔橇Φ乃谢顒?,都有望被通用人工智能重新塑造??梢哉f通用人工智能將會滲透整個社會生產(chǎn)、生活中的每一個角落,將會滲透進(jìn)社會的每一根毛細(xì)血管,所以它對人類社會影響將是廣泛且深遠(yuǎn)的。所以我一直把通用技術(shù)革命視作是一場元革命,它不是某一次技術(shù)革命的地位所能比擬的。
這么一場技術(shù)革命,對于我們各行各業(yè)會產(chǎn)生什么樣的影響?各個行業(yè)為什么從戰(zhàn)略上如此高度重視這場技術(shù)革命?我們先來看認(rèn)識層面上一些思考。
所謂的千行百業(yè),大家所從事的行業(yè),本質(zhì)上都是某一個垂直行業(yè)。我們以前做人工智能,做了很多年各行各業(yè)的智能化解決方案,但是我們發(fā)現(xiàn)一直以來效果不好,直到后來ChatGPT出現(xiàn),我們再去跟很多行業(yè)專家去聊,我們才發(fā)現(xiàn)通用人工智能、通用大模型的到來,實(shí)際上恰恰是發(fā)展領(lǐng)域智能不可或缺的。
我們知道通用大模型是通過通用語料煉制出來的,它看了很多互聯(lián)網(wǎng)上各種學(xué)科知識,可以說它是一個通才。一個垂直領(lǐng)域智能化為什么需要通識能力?你跟醫(yī)生聊的時候,你發(fā)現(xiàn)一個醫(yī)生80%的情況會排除你是健康的情況,可能10個病人只有8個是健康的,只有2個是需要醫(yī)生干預(yù)的,也就是說它想了解什么是疾病,恰恰先要理解什么是健康。推而廣之,你不理解美怎么可能理解丑呢?所以你想理解某一個領(lǐng)域內(nèi)概念,恰恰要先了解領(lǐng)域外的概念。
所以我們這一波行業(yè)智能化解決方案,恰恰是先走通通用認(rèn)知能力,因?yàn)槲覀冎挥薪⑵鹜ㄗR能力才有可能發(fā)展專業(yè)認(rèn)知能力,通識是專識的基礎(chǔ)。
我們?nèi)祟惖慕逃彩沁@樣,我們先經(jīng)歷了K12的基礎(chǔ)教育,主要是完成通識教育,然后是大學(xué)的專業(yè)教育。所以沒有通識能力是不可能有垂直行業(yè)的領(lǐng)域認(rèn)知能力的。
我們這一波大模型本質(zhì)上帶來了什么新的能力?首先是帶來開放世界的理解能力。比如說這里有一個藥品說明書,顯示了各個年齡層次服用藥劑的方法,可是一般老百姓去問藥的時候,通常說“我今年23歲了,男性,我應(yīng)該怎么使用這個藥”。以前的人工智能技術(shù)很難理解這類開放性表達(dá),但是今天有了通用大模型能力,可以準(zhǔn)確理解23歲是成年男性,可以匹配文檔中相應(yīng)的劑量來做出準(zhǔn)確回答,本質(zhì)上這是通用人工智能的開放理解能力給我們帶來的效果。
現(xiàn)在的大模型又有著非常強(qiáng)大的組合創(chuàng)新能力,所謂的舉一反三,學(xué)會了解決A任務(wù)、B任務(wù)的能力,就可以泛化出解決A+B任務(wù)的能力。我們以前人工智能解決方案非常痛苦,要教機(jī)器A任務(wù)的能力、B任務(wù)的能力,可是實(shí)際的用戶往往給的真實(shí)任務(wù)是A+B任務(wù),我們的方案就不行了,但是今天大模型可以準(zhǔn)確泛化出新的組合任務(wù)的能力,這是大模型給我們帶來的新價值。大
模型的評估評價能力,第一次達(dá)到人類的專家水平。我們以前很多評價任務(wù)一定要交給人類去做,比如說習(xí)語翻譯,這是一個非常專業(yè)的成語翻譯任務(wù),通常需要找一個英語專業(yè)四級同學(xué)來標(biāo)注翻譯的好壞。今天使用超級大模型,比如說GPT4,我們只要能夠?qū)懗鲞@個任務(wù)的評價標(biāo)準(zhǔn),以及一步一步評價的過程,大模型就能夠像人類專家一樣來做非常專業(yè)工作的評估和評價。所以基本上我們很多專評估評價業(yè)工作都可以交給大模型。
大模型的復(fù)雜任務(wù)的規(guī)劃能力,使得很多知識工作自動化得以可能。舉個管科同學(xué)經(jīng)常要做的數(shù)據(jù)分析的案例。比如,我要大模型幫我做個調(diào)研,對比分析上海和北京近十年來每年8月份的平均氣溫,并形成統(tǒng)計(jì)結(jié)論,并且做假設(shè)檢驗(yàn)。這樣一個活如果讓在座的研究生同學(xué)去做,可能要找數(shù)據(jù),找軟件,做分析,做統(tǒng)計(jì),做假設(shè)檢驗(yàn)分析,最后形成結(jié)論,我估計(jì)要花半天時間。但是今天我們借助大模型強(qiáng)大的規(guī)劃能力,只需要一秒鐘時間,就把你手工干的所有活全部自動化干完。這是好事兒也是壞事兒,好事兒意味著你只要能夠熟練使用大模型就不用花這么多時間手工工作,壞事兒是你的常規(guī)數(shù)據(jù)分析工作有可能被機(jī)器所替代。隨之而來的,是在AGI大量應(yīng)用的未來,我們相對于機(jī)器的獨(dú)特價值是什么將會是我們需要日益深入思考的問題。
大模型另外一個非常重要的機(jī)遇在于它給我們提供了跨領(lǐng)域、跨專業(yè)知識,尤其是跨系統(tǒng)邊界的知識。大模型是巨大的知識容器,尤其擅長在一些跨學(xué)科邊界處的知識,可能是人類所不具備的。
最近有一個新聞,他說一個小女孩兒得了個怪病,看了人類近14個??漆t(yī)生都搞不定,最后問ChatGPT,ChatGPT做出了正確診斷。我傾向認(rèn)為這個新聞是真實(shí)的,因?yàn)榇竽P蛯W(xué)會了各個學(xué)科的知識,而且它在各個學(xué)科的知識專業(yè)水平比普通人顯著高出一截,我們每一個??漆t(yī)生往往在自己的專科是一座知識的高峰,但是你很難在所有的??贫际且蛔R的高峰,大模型全域認(rèn)知水平線顯著提升之后,就能夠認(rèn)知兩個病種之間的盲區(qū),這是人類歷史上第一次有機(jī)會做到這件事,而我們每一個人類是難以做到這一點(diǎn)的,我們能夠擅長某一個領(lǐng)域已經(jīng)非常不容易了,但是今天大模型很可能在很多系統(tǒng)邊界處有著非常強(qiáng)大的認(rèn)知能力。
管科的同學(xué)肯定都聽說過管理上難題有一些難度,我們一旦聽到跨部門、跨層級、跨專業(yè),有一個“跨”字基本上意味著難題所在,我們每一個人的認(rèn)知只能擅長自己各自的小領(lǐng)域,而不同的部門、不同學(xué)科之間認(rèn)知往往是一個巨大的盲區(qū),這恰恰是大模型未來給我們帶來的重大機(jī)遇。大模型所能認(rèn)知的跨學(xué)科知識,其很多內(nèi)容可能是人類從未探索或觸及的,所以大模型給我們帶來的機(jī)會有可能是前所未有的。
回到我們的千行百業(yè),正是因?yàn)榇竽P途邆溥@些能力,我傾向于認(rèn)為大模型這一次對于行業(yè)發(fā)展來講,對于to B行業(yè)發(fā)展來講,是一次全新的智能引擎升級。這就像一輛車,我們車發(fā)展了幾百年,這個車還是一個殼子、四個輪子,這個車到底變革的是什么?變的是它的引擎,從開始的馬力,到后來的蒸汽,再到后來的油氣,再到現(xiàn)在的電動,所以引擎一直在驅(qū)動車的變革。
我們的信息化服務(wù)、數(shù)字化、智能化也發(fā)展了幾十年,從傳統(tǒng)的小模型發(fā)展,比如基于少數(shù)參與的回歸、分類模型、預(yù)測,這些小模型的表達(dá)能力有限,難以表達(dá)復(fù)雜的現(xiàn)實(shí)世界。再到過去的知識工程,用專家知識來解決問題,但是專家知識一旦遇到開放問題就難以勝任,所以傳統(tǒng)的引擎多多少少有缺陷,我們今天把它革新為新的大模型引擎,用整個大模型驅(qū)動to B的數(shù)字化和信息化過程當(dāng)中,一定要重視幾個問題:
1. 大模型是一次引擎的升級,所以它一定要做到和現(xiàn)有流程的無縫融合;
2. 大模型仍然還需要和行業(yè)的從業(yè)人員進(jìn)行有效的協(xié)作;
3. 要往大模型里注入千行百業(yè)的知識,才有可能解決大模型的所謂根本問題,叫“幻覺問題”。
我想強(qiáng)調(diào)的是toB行業(yè)應(yīng)用本質(zhì)是一類復(fù)雜、嚴(yán)肅的決策任務(wù),我們所熟知的ChatGPT最成功的應(yīng)用目前是聊天,但是這個聊天不是一個嚴(yán)肅應(yīng)用的場景,你不會因?yàn)樗奶斐鲥e就認(rèn)為它聊得不好。,說嚴(yán)肅應(yīng)用場景像醫(yī)療決策、投資決策,這些都屬于復(fù)雜決策,需要有專業(yè)的知識,更要有復(fù)雜的決策能力,比如說投資決策,一定要有宏觀態(tài)勢的研判能力,還要有綜合任務(wù)拆解能力、復(fù)雜約束的取舍能力(有那么多的約束要考慮)、未知事物的預(yù)見能力、不確定性場景的推斷能力等等,這都是我們做決策的時候所要具備的能力。從這些條件、要求來看現(xiàn)在的大模型,仍然還是有漫長的路要走。
在這個過程中,大模型想在千行百業(yè)創(chuàng)造價值,首要解決的問題是它所謂的“幻覺問題”,也就是一本正經(jīng)的胡說八道,如果大家問它復(fù)旦的校訓(xùn),它一本正經(jīng)的給你回答,但是你仔細(xì)一看這個出處是編造出來的,而且大模型這種一本正經(jīng)的文風(fēng),實(shí)際上使得我們從中識別錯誤異常困難。這是為什么很多嚴(yán)肅的場合大家不敢用大模型的一個很重要的原因。比如說醫(yī)療行業(yè),醫(yī)療寫病例或者什么,如果它一本正經(jīng)給你寫了一段病歷,結(jié)果有一個小數(shù)點(diǎn)的錯誤都可能是致命的。所以這是大模型往行業(yè)里應(yīng)用的時候必須要解決的問題。
大模型往往還缺乏領(lǐng)域的忠實(shí)度,因?yàn)樗呀?jīng)在通用領(lǐng)域?qū)W到了很多通用知識。但是我們往行業(yè)去用的時候一定是希望大模型能夠根據(jù)行業(yè)的規(guī)范與知識去回答問題。但是它往往對于你行業(yè)所給的這些知識,缺乏必要的忠實(shí)度,而傾向于用它所學(xué)到的一些通識知識來回答問題。這是所謂的缺乏忠實(shí)度給我們帶來的問題。
三、百花齊放:大模型的場景與應(yīng)用
回到今天,當(dāng)我們?nèi)タ创竽P屯袠I(yè)去用的時候,我們一定會去想我們?nèi)绾卧谛袠I(yè)創(chuàng)造大模型的價值,也就是說場景和應(yīng)用的問題。事實(shí)上很多人都在思考類似問題,經(jīng)常有人問我們中國的大模型應(yīng)該怎么去發(fā)展。事實(shí)上,我的一個基本的觀點(diǎn)認(rèn)為大模型的這個賽道是百花齊放,我們沒有必要都專注在通用大模型,雖然通用大模型很重要,我們還可以發(fā)展很多行業(yè)大模型,甚至可以發(fā)展很多垂直的場景化的大模型,還有很多科學(xué)大模型。這個賽道足夠?qū)拸V,我們每一個企業(yè)都可以發(fā)現(xiàn)你屬于自己獨(dú)特優(yōu)勢的競爭機(jī)會。
尤其我想強(qiáng)調(diào)場景化大模型的重要性。大家有沒有發(fā)現(xiàn)人類有一種工作崗位,只需要通識能力再加上簡單的崗位培訓(xùn)就可以勝任的,比如說客服、HR,你聽說過HR的工作崗位一定要招一個博士學(xué)歷的嗎?你聽說過客服一定要招博士學(xué)位的嗎?很少,但凡不需要博士學(xué)位的崗位都有一個特點(diǎn),那就是通識能力加上簡單的工作崗位培訓(xùn)似乎就可以勝任,這一類崗位我把它稱之為“場景”,所有的行業(yè)都需要有HR,所有的行業(yè)可能都存在客服,再比如程序員、圖書管理員,這些行業(yè)有可能是大模型優(yōu)先代替的行業(yè),為什么?因?yàn)榇竽P陀型ㄗR能力,你再給它簡單的崗位培訓(xùn),就足以勝任相應(yīng)的工作。
這些場景有什么特點(diǎn)?你會發(fā)現(xiàn)這些場景多是所謂的窗口性工作,很多崗位追求服務(wù)的標(biāo)準(zhǔn)與規(guī)范,不喜歡創(chuàng)新,必須按部就班,越是這種工作崗位將來越容易被大模型代替。所以你會看到這些場景商業(yè)機(jī)會巨大,我們不一定需要卷通用大模型賽道,我希望中國企業(yè)在這些細(xì)分賽道與場景進(jìn)行積極布局。
還有一類是可以競爭的是專業(yè)大模型,我們經(jīng)常說如果我們做一個化工行業(yè)的大模型,必須要讓大模型首先理解什么是化學(xué)分子表達(dá)式,否則怎樣才能真正理解化學(xué)這個行業(yè)呢?所以像化學(xué)分子結(jié)構(gòu)這種專業(yè)大模型,還有比如說基因大模型、代碼這些大模型,將來都是我們可以積極作為的新賽道。
大模型應(yīng)用賽道有一個非常重要的產(chǎn)品形態(tài)是場景化的認(rèn)知智能體,剛才黃總說的機(jī)器人就可以認(rèn)為是一個智能體。當(dāng)我們說智能體的時候,強(qiáng)調(diào)的是實(shí)體機(jī)器人或者具備一定環(huán)境自適應(yīng)的自治能力,它能夠根據(jù)環(huán)境的反饋?zhàn)鞒鱿鄳?yīng)的動作來適應(yīng)這個環(huán)境,所以我們把這種稱之為具備環(huán)境自適應(yīng)能力的“自治智能體”。
智能體并不是今天才有的概念,其實(shí)很早就有了,從人工智能早期誕生開始就有了,但是我們早期的智能體僅限于跟物理環(huán)境做一些簡單的交互,但是今天最大的機(jī)會在哪?大模型可以作為智能體的大腦,有了大腦后就可以跟環(huán)境做復(fù)雜交互。未來的機(jī)器絕不簡單單只是跟環(huán)境做一些物理的交互。它可以跟環(huán)境做非常復(fù)雜的認(rèn)知交互,而成為“認(rèn)知”智能體。我們將來會有各種各樣的認(rèn)知智能體。比如說代替你個人,有著跟你一樣的言行和思維方式的智能體,它就可以代替你在網(wǎng)上聊天、閱讀新聞等等。
我們將來會看到各種各樣的認(rèn)知智能體的出現(xiàn)。比如說我們研發(fā)了一個叫Travel Agent,跟他講我過兩天要到加州,它就會給你去調(diào)用互聯(lián)網(wǎng)各種各樣的工具,比如說谷歌地圖、計(jì)算器、機(jī)票APP、酒店APP,給你制定一個會考慮各種各樣約束(比如你肯定不希望同一個景點(diǎn)玩兩次),并且充分考慮你的個人偏好的Travel Agent。這類Agent將來會在日常的生活中大量普及,這種大模型賦能千行百業(yè),一個非常重要的產(chǎn)品形態(tài)就是各種各樣場景化的Travel Agent。
你可以試圖想一下,你現(xiàn)在干的所有工作,將來都會變成若干個Agent,比如說行政助理定會議室,將來會演變成行政助理Agent,我們?nèi)肆Y源面試工作可以做HR Agent,我到網(wǎng)上查文獻(xiàn)可以做文獻(xiàn)檢索Agent。未來我們身邊會有各種各樣的Agent,來完成各類自動化服務(wù)。對于to B企業(yè),我們企業(yè)現(xiàn)在可能已經(jīng)有自己的信息門戶,但是你們現(xiàn)在的信息門戶僅僅是一個信息集散地,它的交互方式還不夠智能,我們往往迷失在信息迷宮中找不到所要的信息、能夠解決特定問題的應(yīng)用或服務(wù)。未來的企業(yè)信息門戶一定是智能化的Agent形式,它能根據(jù)用戶的意圖和企業(yè)現(xiàn)有信息系統(tǒng)進(jìn)行打交道,并且能夠跨越不同的系統(tǒng)來幫你完成你想做的任務(wù)。
我最近正在組織同學(xué)幫我們復(fù)旦信息化做一個復(fù)旦信息門戶Agent,我們每一個同學(xué)將來想干的任何事情,比如說我現(xiàn)在想放松一下,打一小時球,它可以自動去找各個校區(qū)哪里的體育館、羽毛球館還可以訂,推薦給你。而,現(xiàn)在,你若要完成干的這樣的事情,必須主動去是需要查找各種APP,甚至你都不知道APP在哪,也往往很難制定準(zhǔn)確的關(guān)鍵字你也不知道怎么去查找。而Agent技術(shù),有望緩解當(dāng)下的這些尷尬。,將來它可以幫你干這個事情,這些將來都是會發(fā)生的事兒。
從應(yīng)用和場景的角度來講,大家一定要注重我國當(dāng)下正在發(fā)生的一個非常重大的事件,就是數(shù)字經(jīng)濟(jì)的發(fā)展,我們國家正在推動數(shù)據(jù)要素的市場化。數(shù)據(jù)從靜態(tài)的變成流通的,變成可交易的,這個時候會創(chuàng)造非常多新的機(jī)會。在這個過程當(dāng)中,大家會發(fā)現(xiàn)我們目前的數(shù)據(jù)要素資產(chǎn)化過程并不流暢,因?yàn)槲覀內(nèi)狈χ悄芑侄?,?shù)據(jù)治理仍然是困難重重。但實(shí)際上,大模型已經(jīng)一定程度上具備了智能化的數(shù)據(jù)治理能力,可以利用大模型來推動數(shù)據(jù)的智能自動化的治理。比如我這里給了一個例子,給了它四行數(shù)據(jù),然后問大模型這個數(shù)據(jù)有什么問題,大模型已經(jīng)準(zhǔn)確識別出了這個數(shù)據(jù)里存在的問題,比如說張三是小明的父親,他出生年齡是1978年,小明出生年齡是1980年,父親是不可能只比孩子大兩歲的,以前我們數(shù)據(jù)中存在一些錯誤,我們?nèi)斯と懸?guī)則很難覆蓋各種各樣的情況,今天用大模型基本上可以做到這一點(diǎn)。
四、大模型的成本與價值
所以大模型有可能成為今天數(shù)據(jù)要素釋放價值的一個非常重要的一個工具。但是我們推動大模型往各行業(yè)用的時候,必須要去考慮一個成本和價值的問題。
首先,大模型降低了我們的成本。以前要想實(shí)現(xiàn)智能化,要去標(biāo)數(shù)據(jù),要去定義特征,這都需要成本。但是大模型它本質(zhì)上是zero-shot learner,它不需要或者只需要很少量標(biāo)注數(shù)據(jù),就能學(xué)到解決問題的能力。所以我們傳統(tǒng)的這些特征工程樣本標(biāo)注的代價就節(jié)約了。
但是我們一定要注重大模型本身的煉制和使用成本。首先是煉制成本,像GPT4這種規(guī)模的大模型一次訓(xùn)練需要6300萬美金。非但煉制成本不容忽視,大模型的使用成本更加值得關(guān)注,尤其是千行百業(yè)應(yīng)用大模型時,其應(yīng)用成本十分突出。比如說一家公司每天要做100萬篇互聯(lián)網(wǎng)文檔內(nèi)容分析,如果用大模型,比如GPT4的API,一天下來大概要花26萬人民幣。而且大模型還有一個大家難以接受的成本,就是其生成過程需要時間,它把10026萬篇處理一遍的完整生成過程需要15天時間,也就是處理這些文檔的速度遠(yuǎn)遠(yuǎn)跟不上產(chǎn)生文檔的速度,所以這個時間成本是現(xiàn)實(shí)應(yīng)用難以接受的。
我想告訴大家的是,到今天各行各業(yè)擁抱大模型的時候,一定要注重它的成本問題,如何降低成本?首先是大小模型協(xié)同,我們并不需要在是任何場景都使用大模型,很多情形下時間我們用大模型的使用是殺雞用牛刀,其實(shí)小模型仍然有其用武之地,并沒有因此而失效,我們?yōu)槭裁床荒茉诤唵蔚那闆r下用使用傳統(tǒng)的小模型從而降低成本呢?只有在非必要的場合下用大模型呢?甚至我甚至提出一個原則叫“非必要不直接使用大模型”,否則這個成本怎么降低呢?
大家注意到GPT4-Turbo版本頒布發(fā)布的時候,成本降了三分之二,我們認(rèn)為背后也是用了大小模型協(xié)同,而且大小模型協(xié)同絕不單單是出于成本的考慮,也是出于效果的考慮。小模型在可控、可理解等方面是有大模型不可比擬優(yōu)勢的。大模型不可控,它學(xué)到了什么我們不知道,,所以這都是它很大的一個問題??梢哉f,未來商業(yè)價值取決于我們能不能把擅長通識能力的大模型和擅長專業(yè)能力的小模型協(xié)同,才有可能真正的創(chuàng)造我們的商業(yè)價值。
在這里面尤其要注重傳統(tǒng)知識庫的積累,知識圖譜的積累仍然十分重要,知識仍然是緩解大模型的幻覺,降低大模型的應(yīng)用成本的,這是非常重要的這個思路。我們實(shí)際上在大模型的應(yīng)用的各個階段,在大模型的提示階段、生成階段和評估階段,都要把先驗(yàn)知識用好,我們才能夠讓大模型廉價的、高效率的為我們服務(wù)。尤其還要注重大模型的小型化,真正在一線服務(wù)大家的往往是經(jīng)過壓縮的小模型,而不是真正意義上的大模型。還要注重時效性,馬斯克的大模型之所以受到關(guān)注,是因?yàn)樗虢鉀Q時效性問題。
五、對策與路徑:如何實(shí)現(xiàn)大模型更好落地
到底計(jì)算機(jī)要做那么什么事情才可以怎樣才能促進(jìn)大模型更好地落地?
第一,我們要把大模型整個煉制過程變成科學(xué),現(xiàn)在大模型的煉制非常像傳統(tǒng)的煉金術(shù)煉丹,把所有的數(shù)據(jù)準(zhǔn)備好往服務(wù)器一丟,祈禱它出好的效果,實(shí)際上整個過程是不透明的,我們要想把它變成透明、科學(xué)的,仍然需要努力,其中很重要的努力是對語料做精準(zhǔn)的刻畫,我們到底用什么樣的語料能夠練出什么樣的能力,我們要建立起其之間的因果關(guān)系,這樣才有可能真正把大模型從煉金術(shù)發(fā)展變成科學(xué),這個過程中跨學(xué)科研究尤為重要。大模型的能力發(fā)展跟人類的認(rèn)知發(fā)展理論存在著高度可映射的關(guān)系,人類認(rèn)知發(fā)展什么時候發(fā)展出了注意力,什么時候發(fā)展出了信念,什么時候發(fā)展出了欲望,人類認(rèn)知過程的大模型很多術(shù)語被大量地應(yīng)用在的在大模型訓(xùn)練中去使用。這種跨學(xué)科的研究視角對于推動大模型訓(xùn)練工藝變成科學(xué)嚴(yán)謹(jǐn)?shù)倪^程可能非常重要。
做行業(yè)大模型的時候,尤其要注重?cái)?shù)據(jù)的選擇,不能盲目配比數(shù)據(jù)。到底把什么數(shù)據(jù)配給大模型,它才能夠具備金融從業(yè)人員的專業(yè)認(rèn)知水平,其實(shí)這個是非常有意思的問題,事實(shí)上你把一些金融行業(yè)的基礎(chǔ)數(shù)據(jù)讓它去訓(xùn)練是不夠的,你把一些非常細(xì)節(jié)的數(shù)據(jù)(比如每時每刻的股票交易價格)讓它去訓(xùn)練也是不必要的行的。我們可以多反思一下一個普通人是如何成長為金融專業(yè)人員的,它是因?yàn)閷W(xué)到了什么知識才能夠成為金融從業(yè)人員的?我們可以通過回答類似的問題對大模型行業(yè)訓(xùn)練過程進(jìn)行指引。
大模型的煉制過程跟我們調(diào)教一個行業(yè)專家的過程已經(jīng)高度相似,整個過程中我們尤其要注重高質(zhì)量指令數(shù)據(jù)的收集,高質(zhì)量指令數(shù)據(jù)可以釋放底座大模型的價值,反之如果指令數(shù)據(jù)集質(zhì)量差,會傷害底座大模型的能力。所以行業(yè)大模型最終很大程度上取決于指令數(shù)據(jù)的質(zhì)量。
整個過程中我們還需要進(jìn)一步提升大模型的多模態(tài)認(rèn)知能力,比如說上傳一張票據(jù),問里面包含雞蛋的菜品一共有多少價格,像這種多模態(tài)認(rèn)知能力在行業(yè)應(yīng)用中非常有價值,比如大家拍一張亂七八糟網(wǎng)線的接頭照片,問哪里出了問題,像這樣的能力將來大模型一定程度上可以具備。這都是要去提升它的這個多模態(tài)認(rèn)知能力。
你要讓它成為金融專家,就必須要有金融行業(yè)的評測,你需要發(fā)展面向知識的評測,要去測試這個大模型是否掌握的金融知識,更需要發(fā)展面向能力的評測。,注意有知識的不代表有能力,我們有太多高分低能的大模型。所以我們不單單要測評它是不是掌握了知識,還要去測評他是不是像人一樣能夠具備解決實(shí)際問題的能力。還需要去測評他是不是有足夠的智商,需要測評是不是有足夠的情商。你跟很多大模型講,“我去藥店買藥了”,現(xiàn)在很多大模型的回復(fù)是“祝你購物愉快”,這種情商很多人難以接受,但是如果你問GPT4你會發(fā)現(xiàn)還是不錯的。所以情商、智商評測也很重要。
一個大模型的行業(yè)落地路徑跟行業(yè)專家的演進(jìn)路徑何其相像,一個醫(yī)生成為一個行業(yè)專家,首先要完成通識教育,現(xiàn)在的通用大模型就是幫我們完成通識階段的教育,然后要進(jìn)入醫(yī)學(xué)院學(xué)習(xí)專業(yè)知識,這是專業(yè)大模型干的事兒,再進(jìn)一步使用各種各樣的工具,這就是讓大模型變成Agent,然后能夠在實(shí)踐中獲得反饋,這就是他變成實(shí)習(xí)醫(yī)生了,再然后經(jīng)過實(shí)踐的反饋,獲得行業(yè)的洞察,形成敏銳的行業(yè)直覺,變成真正意義上的專家。所以大模型在千行百業(yè)的應(yīng)用道路上本質(zhì)就是利用大模型實(shí)現(xiàn)專家水平的認(rèn)知智能的過程。
最后總結(jié)一下。我們推動大模型往行業(yè)千行百業(yè)應(yīng)用的過程中,一定要合理定位、正確認(rèn)識、場景多元、積極開辟新賽道,注重大模型的成本和價值,促進(jìn)大模型和千行百業(yè)的深度融合,大模型絕不應(yīng)該只停留在煉金術(shù)階段,我們要推動它變成科學(xué),大模型必須跟行業(yè)深度融合才有可能真正的可持續(xù)發(fā)展。