習(xí)近平總書記強(qiáng)調(diào),扎實(shí)推動科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新深度融合,要瞄準(zhǔn)未來科技和產(chǎn)業(yè)發(fā)展制高點(diǎn),加快新一代信息技術(shù)、人工智能、量子科技、生物科技、新能源、新材料等領(lǐng)域科技創(chuàng)新,培育發(fā)展新興產(chǎn)業(yè)和未來產(chǎn)業(yè)。作為人工智能發(fā)展的重要方向和驅(qū)動力,生成式人工智能已展現(xiàn)出對經(jīng)濟(jì)社會發(fā)展的強(qiáng)勁推動力,我們需積極推動其在各領(lǐng)域的落地應(yīng)用,并對其帶來的一系列問題和現(xiàn)實(shí)挑戰(zhàn)加以審慎應(yīng)對,推動負(fù)責(zé)任的生成式人工智能發(fā)展。
激發(fā)生成式人工智能的創(chuàng)新活力與應(yīng)用潛力
曾大軍
習(xí)近平總書記強(qiáng)調(diào),“科技創(chuàng)新是發(fā)展新質(zhì)生產(chǎn)力的核心要素”,“要以科技創(chuàng)新推動產(chǎn)業(yè)創(chuàng)新,特別是以顛覆性技術(shù)和前沿技術(shù)催生新產(chǎn)業(yè)、新模式、新動能,發(fā)展新質(zhì)生產(chǎn)力”。利用前沿科技培育和推動新質(zhì)生產(chǎn)力發(fā)展,是建設(shè)現(xiàn)代化產(chǎn)業(yè)體系、推進(jìn)高質(zhì)量發(fā)展、提升國際競爭力的重要內(nèi)容和必然要求。
生成式人工智能是發(fā)展新質(zhì)生產(chǎn)力的重要驅(qū)動力。以大模型為代表的生成式人工智能技術(shù),通過在技術(shù)上集成多年積累的深度學(xué)習(xí)模型與訓(xùn)練算法,依靠大算力,充分利用海量多模態(tài)數(shù)據(jù),實(shí)現(xiàn)了從特定任務(wù)處理到跨領(lǐng)域通用的人工智能系統(tǒng)能力的飛躍,在語言理解、圖像識別、語音識別、內(nèi)容創(chuàng)作等多個(gè)領(lǐng)域展現(xiàn)了強(qiáng)大的能力和廣闊的應(yīng)用前景。大模型具有豐富的常識,擁有強(qiáng)大的通用任務(wù)解決能力、較好的工具使用能力、卓越的人機(jī)交互能力以及出色的指令遵循能力,這些優(yōu)勢使大模型能夠顯著提升應(yīng)用效率,輔助產(chǎn)業(yè)實(shí)現(xiàn)數(shù)智化轉(zhuǎn)型,從而帶來巨大的經(jīng)濟(jì)效益。
近兩年我國生成式人工智能取得了顯著進(jìn)展,技術(shù)路徑基本探明,應(yīng)用路徑逐漸明確,產(chǎn)業(yè)化應(yīng)用落地廣泛。目前國產(chǎn)大模型數(shù)量已達(dá)數(shù)百個(gè),涵蓋金融、醫(yī)療、教育等多個(gè)行業(yè),成為賦能千行百業(yè)的新抓手和支撐產(chǎn)業(yè)創(chuàng)新的新支柱。生成式人工智能的發(fā)展與應(yīng)用趨勢日益明朗。
生成式人工智能不僅是一種新技術(shù),更代表著生產(chǎn)應(yīng)用的新范式,能夠催生新產(chǎn)業(yè)和新業(yè)態(tài)。大模型的學(xué)習(xí)模式類似人類大腦的處理機(jī)制,基于一個(gè)通用底座,通過學(xué)習(xí)不同的數(shù)據(jù),能夠形成多樣化的能力,而無須針對特定任務(wù)開發(fā)定制算法。通過自然的人機(jī)交互,用戶可直接通過對話生成應(yīng)用程序,用戶就是程序員,數(shù)據(jù)和場景本身就是軟件應(yīng)用。這一突破改變了軟件開發(fā)范式,使軟件開發(fā)由代碼驅(qū)動向語言描述驅(qū)動轉(zhuǎn)變,在需求分析、代碼編寫、測試、部署等軟件開發(fā)的各個(gè)流程,都顯著降低了技術(shù)門檻、提高了開發(fā)效率。這種新范式同時(shí)也給軟件系統(tǒng)的建設(shè)和應(yīng)用帶來了新模式,使各行業(yè)的體系變革和生態(tài)發(fā)展都有了新邏輯和新路徑,促使新的產(chǎn)品、服務(wù)和商業(yè)模式不斷涌現(xiàn)。新興產(chǎn)業(yè)的形成和發(fā)展,將引領(lǐng)產(chǎn)業(yè)變革,成為新質(zhì)生產(chǎn)力培育和發(fā)展的主陣地。
生成式人工智能能夠推動傳統(tǒng)產(chǎn)業(yè)深度轉(zhuǎn)型升級,為實(shí)體經(jīng)濟(jì)發(fā)展注入新動能。通過將大模型應(yīng)用于各個(gè)領(lǐng)域,可實(shí)現(xiàn)各行業(yè)的降本增效,提升產(chǎn)業(yè)自動化水平,助力企業(yè)的智能化升級,促使實(shí)體經(jīng)濟(jì)再上新臺階。在工業(yè)制造領(lǐng)域,生成式人工智能可輔助實(shí)現(xiàn)研發(fā)設(shè)計(jì)的自動化,為生產(chǎn)制造提供智能化的解決方案,通過預(yù)測需求、制定生產(chǎn)計(jì)劃助力經(jīng)營管理,并提供故障預(yù)測、健康管理等運(yùn)維服務(wù)。在教育領(lǐng)域,可為師生提供智慧教育產(chǎn)品,實(shí)現(xiàn)個(gè)性化的因材施教。在醫(yī)療領(lǐng)域,可輔助診斷,成為醫(yī)生的診療助理和患者的健康助手。在金融領(lǐng)域,可為金融機(jī)構(gòu)提供智能客服、智能風(fēng)控、智慧營銷等服務(wù),為客戶提升服務(wù)體驗(yàn)。據(jù)有關(guān)預(yù)測,2035年生成式人工智能有望為全球貢獻(xiàn)近90萬億元的經(jīng)濟(jì)價(jià)值,其中我國將突破30萬億元,且對我國經(jīng)濟(jì)的賦能效應(yīng)顯著優(yōu)于美國等其他經(jīng)濟(jì)體。生成式人工智能與實(shí)體經(jīng)濟(jì)的深度融合,將打造“人工智能+”千行百業(yè)的產(chǎn)業(yè)新格局,形成現(xiàn)代化、智能化的產(chǎn)業(yè)體系,促進(jìn)由傳統(tǒng)生產(chǎn)力向新質(zhì)生產(chǎn)力的轉(zhuǎn)型。
生成式人工智能帶來的安全風(fēng)險(xiǎn)和治理挑戰(zhàn)不容忽視。由于大模型自身結(jié)構(gòu)和生成機(jī)制存在漏洞,有被惡意攻擊的風(fēng)險(xiǎn),同時(shí)大模型自身的知識表達(dá)和學(xué)習(xí)模式還存在缺陷,經(jīng)常出現(xiàn)常識性錯誤、杜撰內(nèi)容等“幻覺”。
為此,應(yīng)建立針對大模型全生命周期的安全監(jiān)管與治理體系,從數(shù)據(jù)安全、模型安全、內(nèi)容安全、倫理安全等多個(gè)角度,保障大模型研發(fā)和應(yīng)用安全可信。一方面,需制定技術(shù)標(biāo)準(zhǔn),強(qiáng)化過程控制。建立嚴(yán)格的數(shù)據(jù)采集、存儲和處理規(guī)范,確保數(shù)據(jù)來源合法可靠,同時(shí)保障數(shù)據(jù)隱私。對大模型進(jìn)行安全攻擊檢測,提升其對惡意攻擊的抵抗能力,并及時(shí)發(fā)現(xiàn)和修復(fù)安全漏洞。另一方面,系統(tǒng)推進(jìn)大模型監(jiān)管體系建設(shè),制定和完善相關(guān)法律法規(guī)。強(qiáng)化內(nèi)容審核和過濾機(jī)制,識別并過濾生成的虛假信息、惡意內(nèi)容和違法信息。明確倫理規(guī)范,建立倫理審查機(jī)制,確保人工智能發(fā)展遵循人類道德和價(jià)值觀。通過建立全流程的安全保障體系,降低生成式人工智能的安全風(fēng)險(xiǎn),推動技術(shù)的安全、可持續(xù)發(fā)展。
同時(shí),為充分發(fā)揮大模型的帶動作用,必須確保大模型的健康合理應(yīng)用。然而,當(dāng)前在大模型應(yīng)用上仍存在一定誤區(qū)。一是將生成式人工智能“工具化”,僅將其視為生成文案的辦公工具。這種應(yīng)用方式大大限制了生成式人工智能的潛力。大模型不僅可以用于文案生成,還能夠在數(shù)據(jù)分析、決策支持、輔助管理等多個(gè)重要環(huán)節(jié)發(fā)揮作用,其應(yīng)用價(jià)值遠(yuǎn)超辦公自動化。二是將生成式人工智能“神化”,誤將其視作萬能助手。雖然大模型具備強(qiáng)大的通用能力,但在專業(yè)領(lǐng)域的賦能往往依賴專業(yè)知識,通用大模型難以滿足需求,只有與根據(jù)專業(yè)領(lǐng)域的知識和需求定制專用模型相結(jié)合,才能實(shí)現(xiàn)更為精準(zhǔn)和有效的支持。
樹立立體思維,保障應(yīng)用健康發(fā)展。著力促進(jìn)各類大模型之間、人與機(jī)器之間的靈活配合與協(xié)同進(jìn)化,充分激發(fā)大模型的創(chuàng)新活力與應(yīng)用潛力,最大化釋放大模型的應(yīng)用價(jià)值。
一是形成各類大模型各司其職、共同發(fā)展的創(chuàng)新生態(tài)。大模型可分為三類:底座大模型、領(lǐng)域大模型和任務(wù)大模型。底座大模型通過在大規(guī)模無標(biāo)注數(shù)據(jù)上進(jìn)行訓(xùn)練,學(xué)習(xí)人類常識,能夠形成舉一反三的強(qiáng)大泛化能力,具有基礎(chǔ)的通用功能,相當(dāng)于完成了人類的通識教育。底座大模型可看作智能時(shí)代的基礎(chǔ)設(shè)施,方便更多開發(fā)者在其基礎(chǔ)上做進(jìn)一步開發(fā),從而促進(jìn)大模型的普及和應(yīng)用,加速構(gòu)建更加活躍多元的技術(shù)生態(tài)系統(tǒng)。相比通用的底座大模型,領(lǐng)域大模型和任務(wù)大模型則更為專用。領(lǐng)域大模型專注于特定行業(yè)或領(lǐng)域的知識,通常基于領(lǐng)域相關(guān)專業(yè)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練或微調(diào),相當(dāng)于完成了專業(yè)教育,成為領(lǐng)域“專家”。任務(wù)大模型針對具體任務(wù)進(jìn)行微調(diào)和優(yōu)化,以提升其在具體任務(wù)上的效果。應(yīng)引導(dǎo)各類模型共同發(fā)展,培育多元化的創(chuàng)新生態(tài)。在實(shí)際應(yīng)用中,應(yīng)根據(jù)場景選擇相應(yīng)的模型,充分發(fā)揮各類模型的優(yōu)勢,從而更好地滿足多樣化需求,實(shí)現(xiàn)最佳的應(yīng)用效果。
二是形成大模型通專結(jié)合、高效協(xié)同的創(chuàng)新體系。通用大模型與專業(yè)大模型各有優(yōu)勢,它們之間的關(guān)系應(yīng)辯證看待。通用大模型作為跨領(lǐng)域的通用平臺,能夠提供廣泛適用的解決方案,滿足不同用戶的基本需求,具有適用范圍廣、靈活性強(qiáng)等優(yōu)勢。在依賴常識的通用場景,如主要面向公眾的消費(fèi)型業(yè)務(wù)和虛擬互聯(lián)網(wǎng)應(yīng)用等,能夠發(fā)揮不可替代的作用。專用大模型專注于特定領(lǐng)域,通過深耕行業(yè)的專業(yè)知識,發(fā)揮領(lǐng)域縱深優(yōu)勢,提供針對特定業(yè)務(wù)場景的高質(zhì)量解決方案,具有專業(yè)精度高、定制性強(qiáng)等特點(diǎn)。在實(shí)體經(jīng)濟(jì)、工業(yè)應(yīng)用等更依賴專業(yè)知識的場景中,能夠提供更加精準(zhǔn)有效的支持。因此,應(yīng)鼓勵兩類模型協(xié)同發(fā)展,支持互聯(lián)網(wǎng)頭部企業(yè)研發(fā)通用大模型,增強(qiáng)大模型的綜合能力,同時(shí)支持各行業(yè)發(fā)揮行業(yè)優(yōu)勢,在通用大模型的基礎(chǔ)上深耕專用模型,形成通專協(xié)同的創(chuàng)新體系。在實(shí)際應(yīng)用中,通過實(shí)現(xiàn)兩類模型的協(xié)同合作,使其充分發(fā)揮各自的優(yōu)勢,提高整體應(yīng)用效果。
三是形成人機(jī)融合、混合增強(qiáng)的創(chuàng)新機(jī)制。大模型自然流暢的人機(jī)交互能力,顛覆了傳統(tǒng)的人機(jī)交互范式,大幅提高了人機(jī)協(xié)同的效率和靈活性。為實(shí)現(xiàn)基于大模型的人機(jī)高效協(xié)同,需從業(yè)務(wù)體系層面進(jìn)行系統(tǒng)性的重構(gòu)。首先應(yīng)明確界定大模型、人類和專家各自的職責(zé)范圍,統(tǒng)籌發(fā)揮各自的優(yōu)勢。大模型在系統(tǒng)設(shè)計(jì)中應(yīng)擔(dān)任自動化任務(wù)者的核心角色,充分發(fā)揮其能夠快速處理大量信息、高效執(zhí)行重復(fù)性任務(wù)的優(yōu)勢,顯著提升系統(tǒng)的整體運(yùn)行效率;人類應(yīng)發(fā)揮創(chuàng)造力強(qiáng)、決策能力強(qiáng)的優(yōu)勢,對系統(tǒng)起到整體設(shè)計(jì)和引導(dǎo)的作用;對于需要深入理解和判斷的任務(wù),例如復(fù)雜情境中的任務(wù)或非標(biāo)準(zhǔn)問題,需由經(jīng)驗(yàn)豐富的專家團(tuán)隊(duì)來主導(dǎo),確保決策的科學(xué)性和有效性。其次應(yīng)面向?qū)嶋H需求,設(shè)計(jì)人機(jī)協(xié)同工作流,建立有效的人機(jī)溝通機(jī)制和協(xié)作策略,確保人機(jī)能夠高效合作。通過形成人機(jī)協(xié)同的創(chuàng)新機(jī)制,不斷優(yōu)化資源配置,提升系統(tǒng)的靈活性,實(shí)現(xiàn)更高效的系統(tǒng)性能,用人機(jī)融合新機(jī)制促進(jìn)新質(zhì)生產(chǎn)力的發(fā)展。
(作者系中國科學(xué)院科技基礎(chǔ)能力局副局長、自動化研究所副所長)
推動負(fù)責(zé)任的人工智能發(fā)展
胡明艷
當(dāng)前,生成式人工智能作為人工智能技術(shù)發(fā)展的最新進(jìn)展,依托大量豐富的數(shù)據(jù)和預(yù)訓(xùn)練的深度學(xué)習(xí)算法,比以往的人工智能具有更加強(qiáng)大、泛化的自然語言理解能力和內(nèi)容生成能力,能夠應(yīng)對不同場景的使用并為多個(gè)行業(yè)提供應(yīng)用支撐。
由于生成式人工智能的強(qiáng)大性能和通用性,針對不同領(lǐng)域、場景的定制化生成式人工智能將具有廣闊的市場需求,相關(guān)產(chǎn)業(yè)發(fā)展前景廣闊,因而有望成為智能化世界的基礎(chǔ)設(shè)施,推動智能產(chǎn)業(yè)的發(fā)展。通過與相關(guān)產(chǎn)業(yè)融合,生成式人工智能將以智能賦能產(chǎn)業(yè),深挖行業(yè)潛力、拓寬發(fā)展空間,推動產(chǎn)業(yè)智能化發(fā)展、引導(dǎo)傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級,從而作為底層技術(shù)賦能千行百業(yè)。同時(shí),生成式人工智能還將改變甚至塑造出新的生活習(xí)慣和消費(fèi)方式。生成式人工智能使信息檢索更加高效便捷,使商品信息、商家差異更加透明,這將導(dǎo)致企業(yè)更加注重產(chǎn)品質(zhì)量與行業(yè)規(guī)范,倒逼產(chǎn)業(yè)升級。生成式人工智能在編輯、編程、翻譯等方面也將減少繁雜的基礎(chǔ)工作,給人們帶來更多的休閑時(shí)間,間接創(chuàng)造新的消費(fèi)需求和市場。另外,生成式人工智能將推動科研范式的變革。生成式人工智能在文獻(xiàn)數(shù)據(jù)獲取、結(jié)果分析等方面的應(yīng)用將助推科學(xué)研究的知識模型快速生成和優(yōu)化迭代,其在結(jié)構(gòu)預(yù)測上的卓越性能可能會在藥物研發(fā)、新材料研究上引發(fā)根本性變革。
但是,科學(xué)技術(shù)是一把“雙刃劍”,生成式人工智能在帶來諸多機(jī)遇的同時(shí)也會帶來許多隱患。由于生成過程的復(fù)雜性,生成式人工智能的算法超越了工程師和用戶的理解范疇,產(chǎn)生“算法黑箱”。而且人工智能呈現(xiàn)出的對文本、圖像的掌握只是基于要素之間的相關(guān)性,并不真正了解對象的本質(zhì)和因果聯(lián)系,其生成的內(nèi)容可能是在“一本正經(jīng)地胡說八道”。若生成式人工智能產(chǎn)生的虛假信息被濫用,會給網(wǎng)絡(luò)安全和國家安全帶來嚴(yán)重后果。同時(shí),生成式人工智能所依賴的算法設(shè)計(jì)和數(shù)據(jù)輸入都蘊(yùn)含了設(shè)計(jì)者的價(jià)值偏好,其輸出內(nèi)容也附著了價(jià)值觀念甚至歧視偏見,也會存在被誘導(dǎo)輸出虛假內(nèi)容和有害信息的風(fēng)險(xiǎn),引發(fā)算法歧視、學(xué)術(shù)不端等倫理風(fēng)險(xiǎn)。此外,數(shù)據(jù)來源和生成物可能引發(fā)知識產(chǎn)權(quán)糾紛。生成式人工智能的研發(fā)需要極大體量的數(shù)據(jù)進(jìn)行訓(xùn)練,這讓其數(shù)據(jù)來源的版權(quán)合法性難以得到保證,其生成物的版權(quán)分配也難以界定。大數(shù)據(jù)是生成式人工智能實(shí)現(xiàn)突破的重要基礎(chǔ),但是過度挖掘數(shù)據(jù)又將侵犯用戶個(gè)人隱私,給用戶帶來困擾。
對于生成式人工智能這一新生事物,我們應(yīng)對其持鼓勵與包容的態(tài)度,但不能任其無序發(fā)展,必須推動負(fù)責(zé)任的人工智能發(fā)展。一是以技術(shù)規(guī)范技術(shù)。通過強(qiáng)化數(shù)據(jù)安全、隱私保護(hù)等技術(shù)的研發(fā),加強(qiáng)對人工智能算法與模型的可溯源研究和審查評估研究,運(yùn)用技術(shù)手段反制和鑒別人工智能所生成的內(nèi)容。同時(shí),積極探索生成式人工智能的問責(zé)機(jī)制與行為規(guī)范,努力打造安全可信的人工智能。二是以政策法規(guī)保障技術(shù)健康有序發(fā)展。及時(shí)規(guī)范相關(guān)技術(shù)與產(chǎn)品的合理準(zhǔn)入范圍和應(yīng)用邊界,營造良好的發(fā)展環(huán)境。2023年,我國發(fā)布了《生成式人工智能服務(wù)管理暫行辦法》,提出了包容審慎和分級分類監(jiān)管等辦法,為生成式人工智能在各領(lǐng)域的應(yīng)用指明了健康規(guī)范的發(fā)展方向。2024年,我國又發(fā)布了《生成式人工智能服務(wù)安全基本要求》,進(jìn)一步規(guī)定了生成式人工智能服務(wù)在安全方面的基本要求。這些政策法規(guī)有助于保障人工智能發(fā)展與安全并重、促進(jìn)創(chuàng)新與依法治理相結(jié)合,必須切實(shí)推進(jìn)實(shí)施。三是以倫理規(guī)范貫穿技術(shù)研發(fā)全過程??萍紓惱硎情_展科學(xué)研究、技術(shù)開發(fā)等科技活動需要遵循的價(jià)值理念和行為規(guī)范,是促進(jìn)科技事業(yè)健康發(fā)展的重要保障。生成式人工智能技術(shù)的發(fā)展需要遵循倫理先行、敏捷治理的要求,將科技倫理貫穿其科研開發(fā)應(yīng)用全過程,加強(qiáng)倫理風(fēng)險(xiǎn)預(yù)警與跟蹤研判,及時(shí)動態(tài)調(diào)整治理方式和倫理規(guī)范,以實(shí)現(xiàn)負(fù)責(zé)任的創(chuàng)新。
生成式人工智能的技術(shù)局限和倫理風(fēng)險(xiǎn)
吳文峻
自ChatGPT面世以來,生成式人工智能成為人工智能領(lǐng)域發(fā)展的熱點(diǎn)。生成式人工智能技術(shù)的基本形態(tài),是采用海量數(shù)據(jù)來訓(xùn)練人工智能大模型,使其學(xué)會人類的語言文本和圖像視頻的統(tǒng)計(jì)模式后,能夠在用戶給出提示指令后,自動地生成所需的數(shù)字內(nèi)容。與傳統(tǒng)人工智能局限于分類、識別等特定功能相比,生成式人工智能更關(guān)注創(chuàng)造性內(nèi)容的生成,展現(xiàn)出前所未有的文字對話、文檔撰稿、代碼編寫、圖片創(chuàng)意、語音合成和視頻生成等多樣性的能力。
生成式人工智能技術(shù)綜合了60多年來人工智能的研究成果,特別是最近10年來深度學(xué)習(xí)的技術(shù)突破。首先,能夠從海量的語料數(shù)據(jù)中學(xué)習(xí)人類知識,熟記文本、語音、圖像、視頻等內(nèi)在規(guī)律與統(tǒng)計(jì)模式,自動生成用戶所需的新文本、圖片、聲音和視頻。其次,實(shí)現(xiàn)了大模型的基于大量數(shù)據(jù)的訓(xùn)練學(xué)習(xí)通用特征與在特定任務(wù)上進(jìn)行微調(diào)以優(yōu)化性能的學(xué)習(xí)模式,并能夠接受人類反饋進(jìn)一步強(qiáng)化學(xué)習(xí)。不但可以記憶通用的人類知識,還可以持續(xù)學(xué)習(xí)專業(yè)的知識與技能,并在人類的獎勵指導(dǎo)下,輸出符合人類道德和法律約束的內(nèi)容。最后,具備多模態(tài)數(shù)據(jù)的融合機(jī)制,動態(tài)融合文本、語音、圖像、視頻等數(shù)據(jù),不僅能夠生成更為豐富多樣的數(shù)字內(nèi)容,而且通過語音、手勢、面部表情等的識別,支撐實(shí)現(xiàn)AI像人一樣與人類交流互動??傊墒饺斯ぶ悄芤呀?jīng)展現(xiàn)出了多模態(tài)、通用化的認(rèn)知和交互智能,表現(xiàn)出“由專到通”的強(qiáng)大能力,在自動化文檔生成、自動化編程、智能客戶服務(wù)、供應(yīng)鏈管理、產(chǎn)品研發(fā)、智慧教育和智慧醫(yī)療等多個(gè)領(lǐng)域展現(xiàn)出極大優(yōu)勢,因而成為諸多領(lǐng)域的熱門應(yīng)用。
雖然這兩三年來生成式人工智能展現(xiàn)出了前所未有的認(rèn)知和多模態(tài)交互能力,但是其內(nèi)在局限日益凸顯,如何繼續(xù)深入推進(jìn)生成式人工智能技術(shù)發(fā)展,使之能夠真正廣泛落地應(yīng)用,成為人們關(guān)注的焦點(diǎn)。
首先,生成式人工智能所依賴的大模型在精準(zhǔn)的認(rèn)知理解和邏輯推理方面存在明顯局限。一方面,由于大模型的幻覺現(xiàn)象問題,容易輸出事實(shí)性錯誤的內(nèi)容。另一方面,大模型的內(nèi)容生成本質(zhì)上屬于概率統(tǒng)計(jì)性的詞匯預(yù)測,所以它無法像人類一樣完成長鏈條的動態(tài)邏輯推理。這兩個(gè)方面的問題意味著很難將生成式人工智能直接嵌入實(shí)際業(yè)務(wù)。因此,如何面向落地場景的需要,消除生成式人工智能的認(rèn)知幻覺,提升或彌補(bǔ)其邏輯推理能力就成為其進(jìn)一步發(fā)展的關(guān)鍵問題。
其次,生成式人工智能面臨著規(guī)模提升效益瓶頸。在大模型研發(fā)中,模型的性能提升和模型參數(shù)規(guī)模之間滿足冪律關(guān)系,即模型規(guī)模越大,輸入的訓(xùn)練數(shù)據(jù)越多,模型預(yù)測能力就越強(qiáng)。因此,不少企業(yè)認(rèn)為只要繼續(xù)擴(kuò)大模型規(guī)模,就能夠在不遠(yuǎn)的將來實(shí)現(xiàn)通用人工智能。但是,一方面,近5年來大模型的參數(shù)規(guī)模呈現(xiàn)指數(shù)級增強(qiáng)趨勢,對智能算力的需求與日俱增,最大模型GPT-4的參數(shù)規(guī)模已經(jīng)到了萬億級別,需要上萬張GPU卡的集群進(jìn)行數(shù)月的模型訓(xùn)練和參數(shù)調(diào)優(yōu)。而一些企業(yè)還在擴(kuò)大GPU集群規(guī)模,正在投資建設(shè)10萬張GPU卡,乃至百萬張GPU卡的規(guī)模。構(gòu)建和運(yùn)行如此大規(guī)模的智算集群,需要克服集群供電和散熱等能耗難題。另一方面,高質(zhì)量和高密度數(shù)據(jù)語料庫也將成為制約模型規(guī)模繼續(xù)擴(kuò)大的因素。眾所周知,大模型的性能提升需要大量的高質(zhì)量訓(xùn)練語料,目前語料庫主要來自互聯(lián)網(wǎng)公共領(lǐng)域數(shù)據(jù)的匯集。有報(bào)告指出,預(yù)計(jì)到2028年大模型訓(xùn)練將耗盡所有互聯(lián)網(wǎng)公共數(shù)據(jù)資源,大模型增長不可避免地遭遇數(shù)據(jù)危機(jī)。為此,需要面向垂直領(lǐng)域,深度挖掘私域數(shù)據(jù),擴(kuò)大高質(zhì)量數(shù)據(jù)共享,以支撐大模型更好適應(yīng)垂直領(lǐng)域的需求。
由此可見,如果生成式人工智能企圖單純以擴(kuò)大模型規(guī)模來實(shí)現(xiàn)絕對通用的智能模型,無論是在技術(shù)上還是在經(jīng)濟(jì)成本上,都不是可持續(xù)的技術(shù)路線。需要面向垂直領(lǐng)域的業(yè)務(wù)邏輯和落地場景,有針對性地在業(yè)務(wù)流程中發(fā)揮大模型的長處,彌補(bǔ)其不足,以通專結(jié)合的技術(shù)路線,實(shí)現(xiàn)大模型在產(chǎn)業(yè)上的廣泛落地與價(jià)值賦能。具體地說,就是瞄準(zhǔn)領(lǐng)域的重點(diǎn)和難點(diǎn)需求,構(gòu)造各種各樣的專業(yè)小模型,與基座大模型相結(jié)合,打造領(lǐng)域適配的專業(yè)智能體,實(shí)現(xiàn)生成式人工智能對現(xiàn)有系統(tǒng)的賦能與升級。
生成式人工智能的發(fā)展使得相關(guān)的倫理安全風(fēng)險(xiǎn)日益突出,大模型認(rèn)知能力的涌現(xiàn)和內(nèi)在缺陷給人工智能的社會治理帶來了更多挑戰(zhàn)。首先,基于大模型的生成式人工智能系統(tǒng)缺乏可靠的安全護(hù)欄,很容易因受到攻擊而輸出敏感信息或是價(jià)值觀錯誤的內(nèi)容。由于大模型的“算法黑箱”特征,其功能與行為的可解釋性和透明性都是需要深入研究的難點(diǎn)問題。其次,生成式人工智能廣泛應(yīng)用帶來的各類衍生風(fēng)險(xiǎn)層出不窮,最突出的是深度合成內(nèi)容的治理問題。大模型生成的各類數(shù)字內(nèi)容與人類創(chuàng)造的內(nèi)容相比,很多時(shí)候已經(jīng)到了真假難辨的程度,給網(wǎng)絡(luò)詐騙和虛假內(nèi)容傳播等提供了新的技術(shù)手段。為此,急需系統(tǒng)地推行內(nèi)容標(biāo)識、水印驗(yàn)證等,建立可行的AI內(nèi)容溯源管理平臺,以確保健康的數(shù)字生態(tài)環(huán)境。最后,生成式人工智能研發(fā)與應(yīng)用的敏捷治理將走向系統(tǒng)化和法治化。目前國內(nèi)外都在積極制定生成式人工智能的法律法規(guī)制度,希望既有效地防范這一新興技術(shù)帶來的各類潛在和現(xiàn)實(shí)風(fēng)險(xiǎn),又能夠促進(jìn)和規(guī)范這一技術(shù)的健康發(fā)展。為此,分級化的敏捷治理成為當(dāng)前研究的熱點(diǎn),通過設(shè)置訓(xùn)練算力閾值,把治理的重點(diǎn)放在超大規(guī)模神經(jīng)網(wǎng)絡(luò)模型的研發(fā)和服務(wù)上,而對海量中小規(guī)模模型的研發(fā)活動采取簡便的敏捷治理模式,從而實(shí)現(xiàn)新技術(shù)發(fā)展進(jìn)步和有效治理的平衡。
(作者系北京航空航天大學(xué)人工智能學(xué)院教授)