人工智能的現(xiàn)狀:局部有精彩,整體很無奈
對照“人類智能”的概念和規(guī)律,可以更好地認識人工智能研究的現(xiàn)狀,也可以更好地找到解決這些問題、實現(xiàn)突破和創(chuàng)新的辦法。
迄今,人工智能存在三種不同的研究路徑:1943年發(fā)端的模擬人類大腦皮層生物神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的人工神經(jīng)網(wǎng)絡(luò)研究(稱為結(jié)構(gòu)主義研究路徑)(McCulloch and Pitts, 2021; Rosenblatt, 1958; Hopfield, 1982; Rumelhart and McClelland, 1986),1956年興起的模擬人類邏輯思維功能的物理符號系統(tǒng)/專家系統(tǒng)研究(稱為功能主義研究路徑)(Newell, 1980; Turing, 1963; Newell and Simon, 1963; Nilsson, 1982),1990年加盟的模擬智能生物行為的感知動作系統(tǒng)研究(稱為行為主義研究路徑)(Brooks, 1991; 1990),形成了人工智能研究的三個學術(shù)信仰各異故一直分道揚鑣的學派。
到目前為止,三大學派各自都取得了不少精彩的局部進展。其中,結(jié)構(gòu)主義的人工神經(jīng)網(wǎng)絡(luò)研究取得的典型成果,包括:比人類識別得更為精準的模式識別(人臉識別、語音識別、圖像識別等)系統(tǒng),具有很強學習能力的各種深層神經(jīng)
網(wǎng)絡(luò)學習系統(tǒng)Deep Learning,自然語言處理的GPT系列等。功能主義的專家系統(tǒng)研究取得的典型成果,包括:戰(zhàn)勝國際象棋世界冠軍卡斯帕羅夫的Deep Blue系統(tǒng),擊敗兩位全美問題搶答冠軍的Watson系統(tǒng),擊敗李世石和柯潔等61位國際圍棋頂尖高手的基于深度學習的AlphaGo系統(tǒng)等。行為主義的感知動作系統(tǒng)研究取得的典型成果,包括:自然語言人機對話的機器人Sophia,能在復雜環(huán)境中奔跑行進和跳躍翻滾的波斯頓Dynamic機器人系列,能夠主持文娛晚會、在醫(yī)院陪護照料病人的服務(wù)機器人等。
這些精彩的人工智能進展,加上一些人工智能科幻小說和科幻電影的渲染,使人們對人工智能取得的進展大為訝異,甚至感到驚駭和恐懼,認為人工智能機器的能力實在太厲害了,似乎很快就要達到超越人類能力的“奇點”并開始淘汰人類了。然而從全局的情況看,人工智能的研究其實面臨著十分嚴峻的挑戰(zhàn)和非常深刻的危機。具體的表現(xiàn)如下。
第一,由于人工智能三大學派“各自為戰(zhàn)”互不相容,因此,它們的所有進展都是個案性、局部性和碎片性的應(yīng)用,難以移植,缺乏通用性,就連一些人們甚感驚嘆的效果表現(xiàn)也只是自然語言(圖形圖像也可以被理解為一種自然語言)處理領(lǐng)域的專用系統(tǒng),而不是通用系統(tǒng),更遑論統(tǒng)一的理論了。顯然,這對人工智能的普遍應(yīng)用和可持續(xù)發(fā)展十分不利。
第二,由于堅持應(yīng)用“分而治之”和“純粹形式化”的研究方法,完全閹割了信息、知識和智能的內(nèi)涵(它們的價值因素和內(nèi)容因素),使得人工智能系統(tǒng)的智能成為了一種“空心的智能”“純形式的智能”,而非真正意義上的可以被理解的智能。它們的結(jié)果不可解釋,因而也不可信賴。正是因為存在這種缺陷,人們戲稱“人工智能不智能”。
第三,更為嚴重的問題是,長期以來,人工智能研究形成了三大學派“各自為戰(zhàn)”的格局,無法形成合力,使人工智能的整體理論研究始終沒有取得明顯的進展,而且這一狀況至今沒能得到解決。雖然在20世紀與21世紀之交出現(xiàn)了一批試圖建立通用人工智能理論的巨著(Nilsson,2006;羅素、諾維格,2006),但都沒有取得預期的成功。事實上,“整體被肢解,內(nèi)涵被閹割”成為了世界人工智能研究所遭受的最大傷痛。
因此,總的來說,人工智能研究的現(xiàn)狀是:局部有精彩,整體很無奈。
系統(tǒng)學原理表明:有機系統(tǒng)的整體不等于它所有的部分之簡單和,或者說,所有部分的簡單和,不可能構(gòu)成相應(yīng)的有機整體。顯然,整體的作用也遠遠大于各個部分作用之和。這就表明,如果繼續(xù)沿著三大學派“各自為戰(zhàn)”的研究路徑走下去,那么,無論它們將來各自取得怎樣豐富多彩的個案性、局部性、淺層性應(yīng)用成果,都不可能指望通過這些成果的“簡單和”就使“局部精彩”轉(zhuǎn)化為“整體精彩”,換言之,不可能指望通過這些成果的“簡單和”實現(xiàn)人工智能基礎(chǔ)理論的重大突破。
至此,不能不對ChatGPT和GPT-4的表現(xiàn)略加評述。許多人都對GPT系列作出了非常正面的評價,認為沿著這個方向發(fā)展下去,具有自主意識而且全面超越人類能力的通用人工智能出現(xiàn)就指日可待。更有甚者,有些人開始宣稱:GPT系列已經(jīng)通過了圖靈測試,人類要接受這些“有意識”“有生命”的強大的“新物種”,要學會與它們共處。
這是莫大的誤解。如上所說,無論是GPT系列,還是其他人工智能系統(tǒng),它們所利用的信息全都是形式化的“空心信息”。直覺告訴我們,沒有價值沒有內(nèi)容的純形式化的信息是無法理解的(除非這些信息是已知的舊信息)。然而,人工智能系統(tǒng)又不能不去理解它們,于是只能采取“統(tǒng)計方法”。他們設(shè)想,只要擁有足夠大(統(tǒng)計方法要求必須滿足樣本的遍歷性)的同類樣本,利用超高速的計算機就可以在這個超大樣本庫里搜索到與當前面對的“問話樣本(關(guān)鍵詞組)”最相關(guān)(統(tǒng)計相關(guān)性最大)的樣本作為“答案”。因此,GPT系列必須擁有超大規(guī)模的預訓練樣本庫,必須擁有超高速的計算系統(tǒng),才能及時找到與“問話(關(guān)鍵詞組)”統(tǒng)計相關(guān)性最大的“答案”,才能使問話者感到系統(tǒng)的回答是足夠合理的,系統(tǒng)是有智能的。
問題就在這里發(fā)生了:就算GPT系統(tǒng)找到了與“問話(關(guān)鍵詞組)”統(tǒng)計相關(guān)性最大的“答案”,絲毫也不表示系統(tǒng)就“理解了答案”,因為它只是按照統(tǒng)計相關(guān)性的大小來挑選“答案”,并不真正理解這個答案是什么意思。這在某種程度上就像人們訓練鸚鵡說話的情形。主人訓練鸚鵡:當有客人進來的時候就高喊“歡迎光臨”。這種預訓練是可以成功的:當鸚鵡看到客人(在形態(tài)上與家人不同的人)進來的時候,它就會高聲喊出:“歡迎光臨!”但這并不能說鸚鵡理解它喊出的是什么意思。
所以,GPT系統(tǒng)能夠與人們交談,而且有問必答,對答如流,但其實它并不知道其中含義。即GPT系統(tǒng)只具有統(tǒng)計相關(guān)性的計算能力,而沒有對概念的理解能力,當然也就沒有解釋能力,因此,它不可信賴。
有人爭辯說:GPT系統(tǒng)通過了圖靈測試,難道還不能證明它有智能嗎?是的,通過了圖靈測試也不見得真有智能。其實,圖靈測試本身存在許多問題。只看表面的效果,不問過程的實質(zhì),是圖靈測試的最大問題之一。因此,除了在游戲類領(lǐng)域之外,在那些需要對結(jié)果“較真兒”的大部分實際領(lǐng)域,圖靈測試方法不可應(yīng)用。
由于現(xiàn)有人工智能的研究堅持了“純形式化”的方法,閹割了信息、知識、智能的內(nèi)涵,因此走上了“通過統(tǒng)計方法來實現(xiàn)認知”的道路。然而,“統(tǒng)計方法”本身卻不是一個高明的認知方法,不是一種高等的認知途徑,因為這種認知方法和道路不可能達到“理解”的目的。而“理解”則是“智能”的必要前提。
實際上,人類實現(xiàn)認知的方式主要有三大類型,依次是:(1)嬰幼兒時期的“強記認知”方式;(2)青少年時期的“從眾認知”方式;(3)成年人時期的“理解認知”方式。它們代表了人類認知方式的進步與成長歷程。
具體來說,“強記認知”也稱為“盲從認知”,這是嬰幼兒時期的認知方式,也是人類的最初級認知方式。嬰幼兒的活動范圍局限于家庭,父母長者天然地成為嬰幼兒認知的絕對權(quán)威。因此,父母長者說什么,他們就記住什么,基本上是死記硬背,幾乎沒有理解的成分。強記是一種最初級的認知方式,但是,對一張白紙般的嬰幼兒來說卻是一種不可或缺的認知方式。計算機的灌輸,就是“強記認知”的技術(shù)版。
“從眾認知”是青少年時期的認知方式,相較于“強記認知”進了一步。青少年的活動范圍突破了家庭限制,走進了社會和學校,“公眾(包括媒體、書本、教師等社會知識傳播主體)”成為了青少年認知的權(quán)威。因此,它的準則是“多者為真”:只要是多數(shù)人認可的,即使自己不理解也會被認可、被接受。統(tǒng)計技術(shù),就是“從眾認知”方式的學術(shù)版。統(tǒng)計,對于處理隨機事件來說是一個科學的方法;可是作為一種認知方式卻只算是一種“二流”的方式。
顯然,最高級的認知方式是理解認知:無論什么問題,只有自己理解了,才會被接受,才會被認可。在這里,所謂“理解”了某個事物,就是既懂得了這個事物的外部“形態(tài)”,尤其懂得了這個事物對于自己所追求的“目標”而言究竟是有利還是有害、利害幾何,因而懂得這個事物的內(nèi)涵。所以,在理解的基礎(chǔ)上去做決策,決策會更明智合理、有智能水平。這是成年人特別是接受了高等教育的成年人的自主認知方式。
由此可見,現(xiàn)有人工智能理論和系統(tǒng)的認知方式只是基于形式信息和形式知識的“從眾認知”,也就是統(tǒng)計認知,它們“認可”的結(jié)論“很可能是對的(但也可能是錯的)”,但卻沒有“理解”的保障:統(tǒng)計的結(jié)果“最好”,不等于現(xiàn)實的“最好”。這就是為什么人們總在不斷追究和質(zhì)疑現(xiàn)有人工智能的“理解能力”、“可解釋性”和“可信賴性”的原因。
對照前文分析的“人類智能”的基本概念和基本原理可以看到,當今“局部有精彩,整體很無奈”的人工智能研究現(xiàn)狀與“人類智能”的原型榜樣之間確實存在巨大的差異。于是,人們便不能不嚴肅地思考:為什么人工智能的研究存在這么嚴重的問題?這些問題的根源是什么?人工智能基礎(chǔ)理論的重大突破與創(chuàng)新,究竟路在何方?
人工智能現(xiàn)狀的根源:學科范式“張冠李戴”
作為學科的源頭而且影響學科全局的學科研究范式(科學觀和方法論)在人工智能的研究中發(fā)生了偏差。在《科學革命的結(jié)構(gòu)》一書中,庫恩把“范式”主要理解為世界觀和行為方式(庫恩,1980)。在科學研究領(lǐng)域,世界觀就是科學觀,行為方式就是科學研究的方法論??茖W觀在宏觀上闡明“這個學科的本質(zhì)是什么”;方法論在宏觀上闡明“應(yīng)當怎樣研究這個學科”。于是,作為科學觀和方法論有機整體的范式,就在宏觀上規(guī)范了這個學科應(yīng)當遵循的研究方式。
盡管庫恩也曾經(jīng)把“范式”解釋為模式、模型、典范、范例、案例等,同時,“范式”這一詞語也常常被用來表達更為具體的“工作方式”,如實驗的范式、計算的范式、編程的范式等,但是更為嚴謹?shù)睦斫飧嬖V我們,學科“范式”更為準確的理解應(yīng)當是“學科的科學觀和方法論的統(tǒng)稱”。這是因為,具體的模式、模型、典范、范例、案例,具體的編程范式、計算范式、實驗范式等,只能描述和表征一些具體的局部的工作程式,它們都不足以成為“學科是否要革命”的最高判據(jù),只有學科的科學觀和方法論才具備這種表征能力。
事實上,科學研究的活動存在井然有序的層次體系,從低到高依次是:(1)研究的具體問題、與問題相關(guān)的數(shù)據(jù)、研究問題所需要的目的要求等屬于“研究的原始資源層次”;(2)開展研究活動所需要的編程語言、算法工具、算力工具、測量工具、記錄工具等屬于“研究的工具層次”;(3)支持研究活動的學科理論、分析方法、研究模型等屬于“研究的理論層次”;(4)在全局上和整體上引領(lǐng)和規(guī)范研究活動的科學觀和方法論屬于“研究的指導思想層次”。
可見,一個學科的科學觀和方法論是指導、引領(lǐng)和規(guī)范這個學科的整體研究活動的最高力量,是“看不見”然而又時時刻刻、實實在在發(fā)揮著指導作用的“指揮棒”。因此,只有科學觀和方法論才能成為“學科是否要發(fā)生革命”的關(guān)鍵判據(jù)。
這樣,就可以用一個表達式來定義學科的范式:
P=Int(V,M)
其中,P代表學科的范式,V代表與學科性質(zhì)相符的科學觀,M代表學科應(yīng)當遵循的方法論,Int代表科學觀與方法論的整體作用。
為了
追根尋源查明造成人工智能現(xiàn)狀的根本原因,最重要的是要站在學科研究的制高點——“范式”的高度上深入考察學科發(fā)展的情況,以便從中找到問題的根源,并從根源上解決問題。這是一切原創(chuàng)性科學研究所不能回避的原則。
表1用直觀清晰的列表方式,描述了學科的“范式”在學科的科學研究活動(包括學科的自下而上摸索和自上而下建構(gòu))體系中所處的地位和作用。
表1說明,學科的發(fā)展一般都要經(jīng)歷前后相繼的兩個基本階段,即首先是自下而上摸索范式的初級階段,接著是自上而下貫徹范式有序建構(gòu)的高級階段。這兩個階段是辯證統(tǒng)一的,既不可或缺,也不可顛倒。
初級階段的任務(wù)是要摸索:(1)這個學科的本質(zhì)是什么;(2)應(yīng)當怎樣來研究和發(fā)展這個學科。顯然,前者就是關(guān)于這個學科的科學觀,后者就是研究這個學科所需要遵循的方法論。如上所述,科學觀和方法論的統(tǒng)稱就是范式??梢?,初級階段的任務(wù)就是要明確學科的范式,也就是明確學科的定義。而一旦明確了學科的定義,就具備了必要的條件可以轉(zhuǎn)入學科研究與發(fā)展的高級階段,即學科的有序建構(gòu)階段。
需要特別指出的是,自下而上的摸索階段是最為困難的工作階段,需要經(jīng)過特別漫長的試探、摸索、失敗、停頓、反思、再摸索、局部成功、局部的檢驗、盲人摸象式的爭論、逐步總結(jié)等痛苦的過程,因此往往經(jīng)歷很長(大約是世紀級)的時間。
高級階段的任務(wù)是要自上而下地完成:(1)根據(jù)自下而上摸索總結(jié)出來的范式(學科的定義)來落實學科的定位(建立學科框架,包括構(gòu)筑學科全局模型和確立學科研究路徑);(2)基于學科的定義和定位確立學科的精確定格(闡明學科的規(guī)格,包括學科內(nèi)涵結(jié)構(gòu)的規(guī)格和學科數(shù)理基礎(chǔ)的規(guī)格);(3)根據(jù)學科的定義、定位和定格,實現(xiàn)學科內(nèi)容的完整定論(形成學科的理論,包括學科的基本概念和基本原理),完成學科理論的整體建構(gòu)。
可見,學科的建構(gòu)就是要由宏觀的定義(范式),到整體的定位(框架),再到精準的定格(規(guī)格),最后到內(nèi)容的定論(理論),一步一步地走向具體、走向落實。于是,作為學科宏觀定義的范式,是整個學科研究與發(fā)展的源頭和根本,影響著整個學科建構(gòu)的全程。
由此可以作出明確的判斷:造成人工智能理論現(xiàn)狀的根本原因,必定是作為學科的源頭而且影響學科全局的學科研究范式(科學觀和方法論)發(fā)生了偏差,而不會僅僅是某些中低層次(如資源層次、工具層次、理論層次)的缺陷??傊?,“整體很無奈”的根源必定在范式,這就是結(jié)論。
人工智能研究所實際遵循的范式,并不是信息學科的范式,而是傳統(tǒng)物質(zhì)學科的范式。人工智能是開放、復雜、高級的信息系統(tǒng),是信息科學的高級篇章。表2所列出的信息技術(shù)演進歷史有力地證實了這個判斷。
信息學科的定義也支持了這個判斷。這個定義指出:信息學科的研究對象是信息及其生態(tài)過程,研究內(nèi)容是信息的性質(zhì)及其信息生態(tài)規(guī)律,研究方法是信息生態(tài)方法論,研究目標是擴展“作為人類全部信息功能有機整體”的智能功能。
可見,擴展信息獲取、信息傳遞、信息處理、信息執(zhí)行等信息功能以及這些信息的復合功能只是信息科學的初等研究目標;擴展人類的智能功能才是信息科學的長遠研究目標。
按照學科范式的定義,具有不同研究對象的各個學科大類,都應(yīng)當擁有自己的科學觀和方法論,遵循自己的研究范式。既然人工智能是信息學科的高級篇章,人工智能學科的研究與發(fā)展就應(yīng)當遵循信息學科的范式。
然而一個令人驚訝的發(fā)現(xiàn)卻是(鐘義信,2021a):數(shù)十年來,人工智能研究所實際遵循的范式,并不是信息學科的范式,而是傳統(tǒng)物質(zhì)學科的范式(見表3)。
表3說明,現(xiàn)行人工智能的研究范式犯了“張冠李戴”的大忌:它實際所遵循的科學觀基本是“物質(zhì)學科范式的科學觀”,而它所遵循的方法論是完全的“物質(zhì)學科范式的機械還原方法論”。