參會(huì)者在2024互聯(lián)網(wǎng)岳麓峰會(huì)現(xiàn)場與AI數(shù)字人“小麓”互動(dòng)。
新華社記者 陳澤國攝
在江蘇省無錫市百度智能云千帆大模型(無錫)創(chuàng)新中心,工作人員在展示視覺追蹤機(jī)械臂控制技術(shù)。
陸啟輝攝(人民視覺)
“可以給我設(shè)計(jì)一個(gè)北京一日游計(jì)劃嗎?”近日,2024世界智能網(wǎng)聯(lián)汽車大會(huì)現(xiàn)場,在極狐阿爾法S5上體驗(yàn)北汽AI智能體的李先生,感覺自己有了一名隨叫隨到的“出行顧問”,“只需一句語音指令,AI智能體就能自動(dòng)規(guī)劃好路線,方便極了”。
近年來,AI(人工智能)大模型技術(shù)的涌現(xiàn),掀起新一代AI研究熱潮,而今,AI智能體(AI Agent)正成為行業(yè)新熱點(diǎn)。從智能汽車中的語音助手到網(wǎng)絡(luò)直播間的數(shù)字人主播,AI智能體正以其獨(dú)特的自主性和交互性,深度改造應(yīng)用生態(tài),持續(xù)構(gòu)建智慧生活新圖景。
重塑人與機(jī)器的互動(dòng)方式
顧名思義,AI智能體就是具備AI能力的一個(gè)智能實(shí)體,其可能是硬件裝置,也可能是軟件系統(tǒng)。它能夠感知環(huán)境、進(jìn)行決策,并依托AI能力執(zhí)行動(dòng)作,最終實(shí)現(xiàn)特定的目標(biāo)任務(wù)。
“通俗來講,AI智能體就像一個(gè)有智商、有情商、能理解、會(huì)幫忙的‘小助手’。”北京通用人工智能研究院先進(jìn)技術(shù)中心副主任陳浩表示,這個(gè)“小助手”不僅能理解人類的語言,還能通過學(xué)習(xí)和分析數(shù)據(jù)來不斷提高自己在特定領(lǐng)域的技能水平。
為何AI智能體能成為行業(yè)關(guān)注的熱點(diǎn)?其與大模型技術(shù)的關(guān)系是怎樣的?
字節(jié)跳動(dòng)豆包大模型相關(guān)負(fù)責(zé)人接受本報(bào)采訪時(shí)表示,AI智能體是基于大模型技術(shù)出現(xiàn)的,AI智能體“有手有腳”,可以自己干活、自己執(zhí)行,而大模型就是它的“大腦”。
但AI智能體是更“立體化”的智能系統(tǒng),除了提供大模型廣泛使用的語言交流服務(wù),AI智能體還能根據(jù)上下文進(jìn)行智能推理和情感分析,并模仿人類行為進(jìn)行相應(yīng)的操作。
比如,下達(dá)“幫我做一道菜”這項(xiàng)任務(wù)指令,“大模型廚師”只能輸出一份食譜并指出需要哪些食材;“AI智能體廚師”則不僅能提供食譜,還會(huì)根據(jù)指令人的口味偏好和營養(yǎng)需求,選擇最合適的食材自動(dòng)下單購買,甚至能夠監(jiān)控烹飪過程,確保食物的質(zhì)量和口感。
“傳統(tǒng)的人機(jī)對話往往受限于固定的模式和預(yù)設(shè)的規(guī)則,難以實(shí)現(xiàn)真正自然的交流。”百度集團(tuán)資深副總裁梁志祥指出,依托大模型在理解、生成、邏輯、記憶方面的四大能力,AI智能體已經(jīng)能夠模擬出更加貼近人類真實(shí)對話的方式,這使得“人機(jī)交互”變得如同“人人對話”一樣流暢自然。
事實(shí)上,獲益于大模型的通用性和可擴(kuò)展性,AI智能體的使用門檻得以大幅降低。無論是大型企業(yè)還是中小企業(yè),甚至是個(gè)人開發(fā)者,無需新硬件或大量額外的訓(xùn)練數(shù)據(jù),都能快速搭建起自己的AI智能體應(yīng)用。
前不久,百度“文小言”大模型App推出“一句話創(chuàng)建智能體”的新功能。每個(gè)人可以根據(jù)需求創(chuàng)建專屬于自己的AI智能體,其性格、音色、身份設(shè)定都取決于用戶的個(gè)性化選擇。創(chuàng)建者可與“專屬智能體”進(jìn)行視頻對話、英語口語練習(xí),還可以模擬求職面試等。據(jù)相關(guān)統(tǒng)計(jì),百度文心智能體平臺已吸引了10萬家企業(yè)、60萬名開發(fā)者,覆蓋了上百個(gè)應(yīng)用場景。
“未來,如果用戶使用及生成自己的AI智能體都更加便捷,這將真正釋放AI智能體的價(jià)值。”梁志祥說,“下一步,我們將把AI智能體精準(zhǔn)、高效地分發(fā)給更多的用戶,讓每個(gè)人都能成為AI智能體的‘開發(fā)者’。”
應(yīng)用場景持續(xù)拓寬
當(dāng)前,一系列AI智能體技術(shù)正在蓬勃發(fā)展,應(yīng)用場景持續(xù)拓展。
“一年半以前,北汽極狐就開始著手研究AI智能體,主要應(yīng)用于研發(fā)效率提升、標(biāo)準(zhǔn)化語言編譯以及用戶服務(wù)等多個(gè)方面。”北汽研究總院智能網(wǎng)聯(lián)中心主任馮碩介紹,AI賦能的駕駛艙告別了機(jī)械式、固定指令式“人機(jī)問答”的舊模式,可實(shí)現(xiàn)靈活性、定制化的“智能交互”,例如,AI智能體會(huì)根據(jù)駕乘人的工作習(xí)慣安排日程表,捕捉駕乘人的喜好、情緒推薦音樂、電影等。
當(dāng)識別出駕乘人過度疲勞時(shí),AI智能體會(huì)迅速生成包括預(yù)訂車位、調(diào)節(jié)車內(nèi)環(huán)境、設(shè)定休息時(shí)長等在內(nèi)的服務(wù)方案,為用戶提供更加安全的智能駕駛體驗(yàn)。“未來,AI智能體還有望搭載‘一句話訂外賣’等功能,更方便駕乘人使用。”馮碩說。
與此同時(shí),AI智能體技術(shù)也在快速發(fā)展并逐步落地到各種小型終端設(shè)備中。
“豆包豆包,寺中這個(gè)羅漢是誰?”“這是摩訶迦葉,釋迦牟尼的十大弟子之一……”自媒體運(yùn)營者小范回憶道,在國慶假期參觀浙江臺州國清寺時(shí),他與耳機(jī)Ola Friend之間常有這樣的問答。
據(jù)了解,Ola Friend是字節(jié)跳動(dòng)旗下豆包大模型發(fā)布的首款A(yù)I智能體耳機(jī),除了常規(guī)的聲樂播放功能,還能在信息查詢、旅游出行等場景為用戶提供即時(shí)幫助。
豆包大模型相關(guān)負(fù)責(zé)人介紹稱,Ola Friend可隨時(shí)化身為用戶的“私人導(dǎo)游”,并且用戶還能根據(jù)興趣點(diǎn)進(jìn)行“追問”,如逛畫展時(shí),用戶可以就某件具體的展品讓Ola Friend幫自己介紹,再延伸追問該展品創(chuàng)作者的藝術(shù)風(fēng)格、其他代表作品等,在一問一答中獲取更多知識。
今年以來,越來越多的手機(jī)廠商也紛紛加入AI智能體布局。vivo近期發(fā)布了名為PhoneGPT的手機(jī)智能體,能夠基于用戶意圖準(zhǔn)確操作手機(jī)應(yīng)用以完成任務(wù),如打電話、發(fā)短信、訂餐廳等,極大提升用戶體驗(yàn);華為將智慧助手小藝升級為系統(tǒng)級智能體,不僅問答能力再進(jìn)階,而且具備更強(qiáng)的感知推理能力;OPPO則推出了“1+N”智能體生態(tài)戰(zhàn)略,由AI超級智能體和AI Pro開發(fā)平臺組成,旨在提供更符合用戶偏好的個(gè)性化服務(wù)模式。
在商業(yè)服務(wù)場景中,AI智能體正與消費(fèi)者進(jìn)行深度互動(dòng)。
百度電商數(shù)字人直播平臺“慧播星”5分鐘就能生成一個(gè)帶貨智能體,不僅可以24小時(shí)在線,且整個(gè)直播間實(shí)現(xiàn)了完全智能化、無人化。數(shù)字人主播和數(shù)字人副播各司其職,及時(shí)回答消費(fèi)者提問,展示和講解商品時(shí)配合流暢自然,對來不及口頭回復(fù)的問題,還有AI助理進(jìn)行文字回復(fù)。
“因?yàn)橛辛藬?shù)字人直播智能體技術(shù),電商直播行業(yè)的成本高、時(shí)間受限、質(zhì)量不穩(wěn)定等難題得到有效緩解。”梁志祥稱,截至目前,“慧播星”已累計(jì)幫助數(shù)萬家商家實(shí)現(xiàn)收益增長,平均帶來62%的商品交易總額的提升。
當(dāng)前,AI智能體還在其他諸多場景中得到應(yīng)用,如編程、內(nèi)容創(chuàng)作、工業(yè)制造等,展現(xiàn)出強(qiáng)大的應(yīng)用潛力和市場價(jià)值。
帶給未來生活更多可能
不少業(yè)內(nèi)人士認(rèn)為,AI智能體將是未來趨勢所在。
騰訊發(fā)布《2024數(shù)字科技前沿應(yīng)用趨勢報(bào)告》認(rèn)為,大模型將走向多模態(tài),AI智能體有望成為下一代平臺。國際管理咨詢公司埃森哲在《技術(shù)展望2024》報(bào)告中稱,96%的企業(yè)高管認(rèn)為AI智能體將在未來3年內(nèi)為其所在企業(yè)帶來重大發(fā)展機(jī)遇。
業(yè)內(nèi)人士表示,在可預(yù)見的未來,AI智能體將幫助多個(gè)行業(yè)構(gòu)建起以“人+AI數(shù)字員工”為核心的智能化運(yùn)營新常態(tài)。例如,在醫(yī)療領(lǐng)域,AI智能體可以協(xié)助醫(yī)生進(jìn)行診斷、治療和健康管理;在交通領(lǐng)域,AI智能體可以通過分析數(shù)據(jù)和實(shí)時(shí)路況,為交通管理和規(guī)劃提供科學(xué)依據(jù);在教育領(lǐng)域,AI智能體可以提供智能輔導(dǎo)和自適應(yīng)學(xué)習(xí)系統(tǒng),幫助學(xué)生更好掌握知識。
專家指出,隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的不斷進(jìn)步,AI智能體的特性和學(xué)習(xí)能力還將變得愈發(fā)強(qiáng)大,未來將更好地適應(yīng)復(fù)雜多變的現(xiàn)實(shí)世界,為社會(huì)發(fā)展帶來更多可能。
盡管AI智能體技術(shù)為未來生活帶來了更多可能,但目前其仍然處于起步階段——已出現(xiàn)的AI智能體僅能完成較為簡單、固定的工作,且應(yīng)用功能同質(zhì)化嚴(yán)重。
有觀點(diǎn)指出,AI智能體的發(fā)展瓶頸之一在于目前的大模型缺乏足夠的推理能力,無法在沒有人工介入的情況下真正解決復(fù)雜的問題。大模型技術(shù)本身就因算法等因素存在不可預(yù)測的先天缺陷,容易為AI智能體帶來一系列安全隱患。
除了技術(shù)風(fēng)險(xiǎn),AI智能體也面臨倫理和隱私等問題。業(yè)內(nèi)人士表示,AI智能體在提供服務(wù)的過程中會(huì)收集大量數(shù)據(jù),有可能導(dǎo)致個(gè)人隱私信息的泄露,比如AI智能體可能會(huì)根據(jù)用戶的購物習(xí)慣推斷出他們的某些私人愛好。這種“窺探”行為,無疑是對用戶隱私的侵犯。
專家認(rèn)為,目前需盡快根據(jù)智能體的功能用途、使用時(shí)限進(jìn)行分類管理,尤其對高風(fēng)險(xiǎn)智能體的開發(fā)生產(chǎn)及應(yīng)用部署進(jìn)行持續(xù)監(jiān)管,并及時(shí)制定相關(guān)法律法規(guī),改進(jìn)現(xiàn)有互聯(lián)網(wǎng)標(biāo)準(zhǔn),從而更好地預(yù)防智能體引發(fā)的各種風(fēng)險(xiǎn)。