①蘋果計(jì)劃在12月份推出新一批AI功能,包括將ChatGPT服務(wù)集成到Siri中,以及推出更強(qiáng)大的圖像生成工具,何時(shí)能夠在中國(guó)市場(chǎng)使用還尚未確定。 ②國(guó)內(nèi)安卓陣營(yíng)廠商也接連發(fā)布了端側(cè)AI和操作系統(tǒng)方面的一系列升級(jí)。業(yè)內(nèi)人士表示,在AI方面國(guó)內(nèi)“并沒有落后多少”。
《科創(chuàng)板日?qǐng)?bào)》10月29日訊(記者 黃心怡)今日,蘋果智能(Apple Intelligence)終于在海外上線。蘋果計(jì)劃在12月份推出新一批AI功能,包括將ChatGPT服務(wù)集成到Siri中,以及推出更強(qiáng)大的圖像生成工具。不過(guò),Apple Intelligence何時(shí)能夠在中國(guó)市場(chǎng)使用還尚未確定。
近日來(lái),國(guó)內(nèi)安卓陣營(yíng)廠商也接連發(fā)布了端側(cè)AI和操作系統(tǒng)方面的一系列升級(jí),各種AI智能體、AI OS的概念鋪天蓋地襲來(lái)。
可以說(shuō),蘋果智能尚未落地中國(guó)市場(chǎng)的窗口期,正促使國(guó)產(chǎn)手機(jī)廠商進(jìn)一步以AI賣點(diǎn)來(lái)加碼旗艦機(jī)型的競(jìng)爭(zhēng)。各家手機(jī)廠商都明確要做系統(tǒng)級(jí)AI,要做AI OS、做好AI智能體。
IDC中國(guó)研究經(jīng)理郭天翔對(duì)《科創(chuàng)板日?qǐng)?bào)》表示,安卓陣營(yíng)和蘋果在AI方面的思路類似,都是注重端側(cè)模型、智能體的概念。“在AI方面國(guó)內(nèi)并沒有落后多少?!?/p>
▌智能體能否干掉APP?
作為 iPhone 的語(yǔ)音助手, Siri 可以通過(guò)語(yǔ)音指令進(jìn)行簡(jiǎn)單操作。但由于過(guò)去的回答主要基于搜索引擎,智能程度非常有限,并沒有能取代手機(jī)的APP交互模式。隨著大模型的發(fā)展,以Siri為代表的手機(jī)助手有望變得更有智商,從語(yǔ)音助手升級(jí)為AI智能體。比如想要預(yù)定酒店行程,不需要再打開APP,而是直接與AI智能體對(duì)話來(lái)完成。
談及智能體是否會(huì)取代APP,榮耀CEO趙明認(rèn)為,大概率是往這個(gè)方向發(fā)展,但是相當(dāng)長(zhǎng)的時(shí)間內(nèi),APP和智能體肯定是一個(gè)長(zhǎng)期共存的方式?!斑@涉及到一個(gè)使用習(xí)慣的問(wèn)題,還有各種意想不到的體驗(yàn)障礙的問(wèn)題,所以一定是相當(dāng)長(zhǎng)的時(shí)間內(nèi)并存,或者長(zhǎng)期可能并存?!?/p>
作為智能體交互模式的第一步,AI識(shí)屏已開始在國(guó)內(nèi)安卓手機(jī)上落地。最新發(fā)布的OPPO Find X8上線了一鍵問(wèn)屏功能,能智能解析屏幕信息,并根據(jù)內(nèi)容與用戶互動(dòng),提供相應(yīng)的解答和操作。
“舉個(gè)例子,平時(shí)拍攝的景點(diǎn)照片,直接一鍵讓AI識(shí)別并回答這是哪、背后有什么故事??瓷先ズ芎?jiǎn)單,但背后涉及到全國(guó)3A級(jí)以上16000個(gè)景點(diǎn),差不多百萬(wàn)級(jí)的數(shù)據(jù)來(lái)做專項(xiàng)訓(xùn)練。“OPPO AI中心產(chǎn)品總監(jiān)張峻表示。
榮耀則發(fā)布搭載智能體的AI操作系統(tǒng)MagicOS 9.0。趙明介紹,現(xiàn)在智能體可以模擬人來(lái)點(diǎn)擊屏幕、閱讀理解屏幕,進(jìn)行慢思考、找到關(guān)鍵的信息,然后進(jìn)行相應(yīng)的操作。目前可分為“自動(dòng)駕駛”的智能體以及與應(yīng)用交互的智能體兩大類。
“自動(dòng)駕駛的智能體,無(wú)需第三方的介入,首先對(duì)用戶意圖進(jìn)行分析理解。比如說(shuō)幫我點(diǎn)杯喝的,智能體能理解意圖背后的這些信息和邏輯,對(duì)意圖場(chǎng)景進(jìn)行分解之后,變成可執(zhí)行的指令,最終實(shí)現(xiàn)了點(diǎn)咖啡的操作。另一種則需要應(yīng)用方進(jìn)行協(xié)同。比如,榮耀跟中國(guó)移動(dòng)的靈犀大模型。在查詢手機(jī)話費(fèi)的余額、充50塊錢話費(fèi)的過(guò)程當(dāng)中,調(diào)用了靈犀的型進(jìn)行接管。上述兩種智能體未來(lái)一定是并存的,會(huì)有需要生態(tài)介入的部分,也有一些操作可以自動(dòng)進(jìn)行?!?/p>
對(duì)于未來(lái)AI交互在手機(jī)上的發(fā)展,多名業(yè)內(nèi)人士認(rèn)為,符合直覺、最直接的方式,會(huì)最終占據(jù)主流。
郭天翔表示,識(shí)屏交互屬于AI手機(jī)一種新的交互方式,更便于用戶的使用,降低學(xué)習(xí)成本。從目前看,未來(lái)AI交互還是會(huì)以最直接最簡(jiǎn)單的方式為主,從人的本能出發(fā)。
OPPO首席產(chǎn)品官劉作虎也認(rèn)為,符合直覺是最基本的AI理念。
“我每周都會(huì)開AI專項(xiàng)會(huì),一直灌輸一個(gè)概念:不管是什么,首先是符合直覺。我們看到很多可能炫技的東西,看似很簡(jiǎn)單,其實(shí)背后的技術(shù)要求很高。就像一鍵問(wèn)屏,怎么識(shí)別用戶的意圖、識(shí)別屏幕,里面涉及很多的分流技術(shù)。但技術(shù)最終都要回到用戶做產(chǎn)品。比如使用導(dǎo)航時(shí),打開就有地址,直接一按就到目的地,AI時(shí)代就是直覺更加高效,這是最基本的AI理念。”
▌端側(cè)模型:難點(diǎn)在體驗(yàn)和性能的平衡
大模型要裝入手機(jī),在前景無(wú)限的同時(shí),挑戰(zhàn)并存。手機(jī)上有限的算力決定了端側(cè)模型不能過(guò)大,但小參數(shù)的模型在能力上又受到局限。
郭天翔表示,現(xiàn)在端側(cè)模型已經(jīng)不再過(guò)于強(qiáng)調(diào)模型參數(shù)的大小,而是追求使用體驗(yàn)、占用內(nèi)存以及功耗之間的平衡。
劉作虎坦言,端側(cè)模型對(duì)性能要求很高,不管是性能還是內(nèi)存的要求都非常高。所以如何持續(xù)優(yōu)化架構(gòu)、高能效發(fā)揮芯片潛能,仍是很漫長(zhǎng)的路。
“目前還有很多事情可以做。比如對(duì)平臺(tái)的散熱,可能大家會(huì)覺得很簡(jiǎn)單,其實(shí)很難。還有怎么做好底層內(nèi)存的調(diào)用等等。說(shuō)實(shí)話,AI在手機(jī)行業(yè)還是剛剛開始,接下來(lái)大家會(huì)看到非常多的AI變化。”
張峻透露, OPPO即將推出新的端側(cè)架構(gòu)AI LoRA,來(lái)降低內(nèi)存等資源的占用。
“端側(cè)AI最大的瓶頸是手機(jī)計(jì)算資源的使用。比如同時(shí)在手機(jī)上實(shí)現(xiàn)三個(gè)功能的端側(cè)化,正常而言要占用三個(gè)相應(yīng)的資源。假使把模型比做火車頭,上了三個(gè)模型就意味著需要三個(gè)火車頭再加車廂。而LoRA架構(gòu)采用了基模型+應(yīng)用模型的模式。只需要一個(gè)基模型,即只有一個(gè)火車頭。后面的應(yīng)用模型,相當(dāng)于三個(gè)車廂,像左輪手槍一樣,可以輪換。當(dāng)需要什么模型,就上什么車廂,這樣的內(nèi)存峰值占用,可以節(jié)約75%?!?/p>
▌AI手機(jī)后時(shí)代:智能體將取代更多人工操作
對(duì)于大模型的發(fā)展,業(yè)內(nèi)普遍保持短期審慎、長(zhǎng)期樂觀的態(tài)度。在端側(cè)的落地亦如是。
劉作虎分析,AI時(shí)代的變化非???。“過(guò)去對(duì)手機(jī)操作系統(tǒng),我們是按半年、一年來(lái)做規(guī)劃。而AI時(shí)代,一定不是這樣。誰(shuí)能知道一年后,AI是什么樣子。AI產(chǎn)品甚至不是每三個(gè)月規(guī)劃,應(yīng)該每個(gè)月去規(guī)劃。模型變化太快,技術(shù)超出想象速度。坦白講,我自己都有很大的緊迫性?!?/p>
劉作虎強(qiáng)調(diào),在AI時(shí)代做產(chǎn)品就是要快跑?!澳阋欢ㄒヅ埽艿靡?,不然要落后,要緊跟技術(shù)的變化。
近日,中國(guó)信息通信研究院發(fā)布了全球首份《終端智能化分級(jí)研究報(bào)告》,將終端智能化水平分為五個(gè)等級(jí)L1-L5,智能化等級(jí)越高,終端自主參與度越高,人的參與度越低。L1級(jí)和L2級(jí)具備一定智能化,可以完成單類型任務(wù)。L3級(jí)和L4級(jí)逐步從感知識(shí)別復(fù)雜意圖到識(shí)別潛在意圖。L5級(jí)具備全面智能化,能夠自主規(guī)劃完成全類型任務(wù)。
趙明表示,當(dāng)前終端智能化水平處于L3的水平,要通往下一個(gè)L4、L5的階段,所需的時(shí)間會(huì)更長(zhǎng)一點(diǎn),需要更多的積累。
“今天我們可以實(shí)現(xiàn)用戶理解類別達(dá)到950項(xiàng)。未來(lái),一定能夠涵蓋手機(jī)諸多的運(yùn)行,把現(xiàn)有在傳統(tǒng)手機(jī)上需要更多人干預(yù)的地方,逐步都消除掉。現(xiàn)在,一句話撥打手機(jī)電話沒問(wèn)題,微信視頻也可以了,點(diǎn)咖啡也能做到。再往下一步,要實(shí)現(xiàn)更多、更模糊的指令,以及更復(fù)雜的關(guān)系之間的理解?!?/p>