認知技術的變革及前景展望_原創(chuàng)精品

【摘要】人腦是語言的大腦，語言是記載知識的工具，可以說，語言使人類的歷史得以留存。人類認識可以劃分為物理對象、主觀意識和客觀知識三個世界，認知領域、物理領域和信息領域密切相關又存在著一定的差異。計算機互聯(lián)網絡是信息時代的第一次革命，自然語言處理是人工智能的核心技術；人工智能促進了認知科學與技術的發(fā)展，認知技術是互聯(lián)網信息時代的第二次革命，將改變我們的工作和生活方式。

【關鍵詞】語言人腦認知領域物理領域信息領域人工智能

【中圖分類號】R318/TP18 【文獻標識碼】A

【DOI】10.16619/j.cnki.rmltxsqy.2023.11.003

【作者簡介】江銘虎，清華大學心理學與認知科學研究中心教授，清華大學人文學院計算語言學教授、博導，曾任德國海德堡大學交叉學科計算中心客座教授。研究方向為語言認知與計算。主要著作有《語言信息處理》、《語言的ERP腦電認知》（主編）、《語言、腦進化與認知》（主編）、《自然語言處理》（主編）等。

引言

人腦與語言共同經過了漫長的進化，人腦進化為語言的大腦。動物沒有語言，因而沒有歷史。人類擁有語言，語言可以描述記載人類所積累的智慧結晶——知識，知識的積累帶來邏輯、思維和文化的進化，最終形成了文明智慧的人類社會，人工智能（artificial intelligence, AI）也由此誕生并迅速發(fā)展。

語言是一種形、音、義結合的詞匯和語法體系，是人類溝通交流的一種方式（江銘虎，2022）。語言雖變化無窮，但其語法類型有限，是可以歸類、分析、統(tǒng)計和學習的，因而可以通過計算機的訓練學習實現(xiàn)語言的自動理解與產生。蔡曙山指出，人類的心智與認知產生于腦的進化與分工，奠基于語言，發(fā)展于邏輯與思維，積淀為文化，構建了社會（蔡曙山，2021；蔡曙山、江銘虎，2016）。

認知科學和AI之間存在著密切的關系，認知是指人類的思維和知覺過程，包括知覺、記憶、思考和語言等方面。人腦雖然天生就存在著若干成型的特定功能腦區(qū)，但要充分挖掘出人腦中所蘊藏的巨大潛力、開發(fā)出更多的腦部功能，后天的學習和思維訓練是不可或缺的，其中語言就需要后天的訓練和學習。如果不了解大腦的運作和認知機制，就無法對人類的語言認知規(guī)律有深入的理解（江銘虎，2016）。AI研究中的許多概念和算法都借鑒了認知心理學的研究成果。例如，類腦計算模型在自然語言處理（natural language processing, NLP）和計算機視覺等領域都是在模擬人類的語言和視覺系統(tǒng)。反之，AI也對認知科學的發(fā)展產生了積極的影響。例如，AI的深度學習算法為認知神經科學的研究提供了新思路。

語言是記載知識的工具，語言使人類的歷史得以留存

人腦與語言共同經過了漫長的進化。從人類進化的角度來看，語言的發(fā)展是當今人類最獨特、最顯著的特征。王士元指出，沒有人類發(fā)達的大腦，就不可能有我們變化無窮的語言；同時，沒有語言來幫助我們組織思想以及累積幾百年的科學成果，我們也不可能了解大腦這個極為繁復精密的器官。顯然，大腦和語言息息相關、相互演化，語言與大腦是共同進化的（王士元，2011；2008）。就哺乳動物的大腦而言，人腦相對身體的比例是最大的，且是連接最復雜的，人腦的體積和復雜性在進化的過程中不斷增加，使得一些舊有的功能得以改進，一些新的功能（如語言、創(chuàng)造工具）得以涌現(xiàn)，這種現(xiàn)象豐富了人類的行為和認知技能，并且決定了他們在物種競爭中的優(yōu)勢地位。

大腦器官如此復雜，人類智力的進化并不是剎那間發(fā)生的，其中語言的使用和發(fā)展起了決定性作用。表1展示了人類祖先進化的大致時間段與腦容量的關系。大約50萬年前，口語出現(xiàn)，人腦中操作口語的機能以及語音和對應的語義開始進化，神經系統(tǒng)自然而然地聯(lián)為一體，人腦表面積開始增加（江銘虎、王琳，2013；江銘虎，2019）。諾姆·喬姆斯基（Noam Chomsky）認為，語言出現(xiàn)于20萬～6萬年前，大致是13萬年前，即經歷了大約5,000～6,000代人的進化時間（Chomsky, 2008; 2014）。人類對語言的適應使其變得如此復雜又如此有效。一旦符號交流在早期的原始人類社會中變得稍微復雜，它獨特的代表功能和開放的靈活性意味著它可以被用于無數(shù)的目的，并產生同樣強大的再生結果?，F(xiàn)存語言的多層結構和我們易于使用的語言，都只能被解釋為二次選擇的結果，這種二次選擇是由首次引入符號過程的社會功能所產生的。特倫斯·迪肯（Terrence Deacon）認為這可能有助于解釋為什么符號交流是像猿類這樣腦容量大、壽命長的生態(tài)物種才能進化出來的（Deacon, 1997）。因此，無論計算能力如何提高，大腦的絕對大小都可能在語言進化中扮演了一個重要的角色。多爾·希爾頓（Dor Shilton）等指出，人類進化的兩個重疊階段包括：在語言出現(xiàn)之前，涉及原始人類生活方式的最初發(fā)展階段，即狩獵和覓食、工具制造和異體養(yǎng)育；在語言出現(xiàn)之后，涉及情感和認知可塑性進一步提高的階段，這是通過語言來指導想象力的結果（Shilton et al., 2020）。

人腦是語言的大腦。語言是人類獨有的，其特點是能夠生成和處理具有層次結構的句法序列，這與非人類靈長類動物有所不同。語言的復雜性遠遠超過任何現(xiàn)存靈長類物種交流系統(tǒng)的復雜性，其工作機制遠比人們所想象的要復雜得多，而且語言功能的發(fā)展也建立在感知覺、運動等基本生理功能的基礎上。它的獨特之處不僅在于其結構的復雜性，還在于其與核心認知能力密不可分。交流是語言演化的重要動力，合作是語言演化的基礎。語言的古老源頭是初期的共享意圖，有了共享意圖，就有了合作。人類語言是我們的天性（即生物學和基因）和我們的后天培養(yǎng)（學習經驗和環(huán)境）之間持續(xù)而根深蒂固的相互依存關系的作用結果。語言依賴于我們與其他物種共享的許多機制，自然選擇改善人類的某些技能，其中腦容量的增加、發(fā)音聲道的進化、交流意圖的社會需求、復雜序列的學習能力等因素，所有的這些技能綜合起來使人類的語言成為可能。因此，發(fā)展好語言功能需要以豐富的感知覺、運動經驗為基礎。同時，參與語言處理的這些腦區(qū)并不是獨立工作的，而是相互組織起來，形成了用于處理語言的神經網絡。符號化的系統(tǒng)性表明，大腦內符號關聯(lián)的表示應分布在不同的腦區(qū)，而相似的詞匯共享神經共性。相關腦區(qū)組織成不同的信息處理網絡，來處理不同方面的語言信息，某一腦區(qū)既接受來自多個其他腦區(qū)的神經信號，也向多個腦區(qū)發(fā)送信號。信號的傳遞不是一次性完成的，也不是單向的，而是在不同腦區(qū)之間多次往返、多向交互的。語言與范圍廣泛的人腦神經集成在一起，并且不斷地相互作用共同進化。

馬丁·諾瓦克（Martin A. Nowak）指出，人類語言經過幾十萬年的進化，使我們實現(xiàn)個體間無限的非基因信息的傳遞，并推動了文化的進化（Nowak et al., 2002）。語言與這些核心認知過程相關聯(lián)，語言信號會反饋和影響我們對世界的認識和表示。習得人類語言需要掌握一個復雜的、多層次的符號系統(tǒng)，這個系統(tǒng)由語音、音位學、形態(tài)學、句法、語義和語用學等幾個成分交織在一起，從而實現(xiàn)對我們思想和文化的傳襲。這種語言與認知的聯(lián)系是學習和文化傳播的渠道。

語言本身基于符號來表示概念，概念符號系統(tǒng)位于這些腦區(qū)的“心理詞典”中。人類語言的一個決定性特征是其靈活表示和重組概念的能力。人類的基因組深深植根于我們的生物構成中，基因組通過建立能夠適應和重組以響應輸入的神經系統(tǒng)，為語言習得提供了平臺。人類語言的靈活性意味著我們可以用它來表示幾乎任何我們能想到的東西。手勢、聲音、面部五官以及相關特征共同進化，形成一個日益復雜、動態(tài)和多樣化的人類語言與非語言交流系統(tǒng)。當我們出生時，口語和聽力的神經生物學系統(tǒng)就已經配置完整，使我們能夠相對容易地掌握口語；而閱讀和寫作能力需要經過正規(guī)的指導，只有經過多年的接觸和經驗才能逐漸發(fā)展完善，學習閱讀和寫作會重新開發(fā)我們的大腦。

共同進化的觀點認為，語言的進化不是發(fā)生在大腦的內部或外部，而是發(fā)生在文化進化過程中影響生物進化過程的界面上（Deacon, 1997）。共同進化過程在塑造人腦和心智方面發(fā)揮了重要的作用。如果不承認人類解剖學、神經生物學和人類心理學都是由一種最能被描述為思想的東西所塑造的，即符號參照的思想，那么就不可能理解人類的思想。雖然符號思維可以完全是個人的，但符號參照本身在本質上是社會性的。也即是說，我們不僅通過與社會其他成員的互動獲得這種表達方式，而且符號本身也可以追溯其社會起源。從具體意義上說，人類獨特的思想是一種不尋常的再生挑戰(zhàn)產物，這種挑戰(zhàn)只有符號參照才能解決。人類語言復雜，但易于學習和使用，這依賴于有效的符號交流。長期的共同進化積淀不僅使符號交流變得更容易、更有效，而且呈現(xiàn)出越有效地獲取符號信息和越強大地運用符號交流的趨向。

語言的語法語義和社會屬性。人類語言從表面看只是符號串，而其實際是具有層次樹狀句法結構的。人類語言服從形式分析：所有的語言，無論是書面語還是口語，都是由小的元素分層遞歸地組合構建成較大的單元，它們具有聲學特征或人工特征，可以依次用來組成音節(jié)、詞語、短語和句子，再由此組成段落和篇章，這樣的組合規(guī)則不是任意的，每種語言都有具體的規(guī)則。句子中詞的組合方式是由該語法規(guī)則系統(tǒng)中的層次結構決定的，因此人類的語言具有處理層次構造序列的能力和處理遞歸結構的能力。

語言的生物過程理論認為，人類天生就有認知語法結構的能力，使他們能夠發(fā)展和理解語言（江銘虎，2022）。根據(jù)這一理論，這個語法結構系統(tǒng)嵌入到人類遺傳之中，并支撐著所有語言的基本語法。語言系統(tǒng)是一個復雜的系統(tǒng)，在自然科學中，通常將復雜的現(xiàn)象和系統(tǒng)分解為基本元素或操作，以便使用。這些基本元素一旦確定就可以進行整合，用于解釋一個復雜的系統(tǒng)。復雜語言系統(tǒng)的分解要素是詞素和句法規(guī)則。對于句法領域來說，這種方法效果很好，因為有一個清晰的語言學理論定義了一個最基本的規(guī)則，即整合。人類可以創(chuàng)建和理解全新的消息，新消息是通過混合、類比或轉換舊信息而自由創(chuàng)造的。語言的一個主要特征是，一個簡單、有限的音位項集合可以產生一個無限的詞匯系統(tǒng)，其中規(guī)則決定了每個詞項的形式，而意義則與形式密不可分，因此語音語法是現(xiàn)有語音單位的簡單組合。語言的另一個重要特征是詞法和句法，其中預先存在的單元被合并，從而產生了語義上新穎或截然不同的詞匯項（江銘虎，2022）。

語言是變化發(fā)展的，人類的創(chuàng)造力推動語法的變化，聽者必須具有豐富的想象力和創(chuàng)造力。語法化實質上是建立在隱喻的基礎上的。禁止隱喻的使用會阻止語法的發(fā)展，同樣也會排除所有表達抽象思想的可能性。語法化要求一種語言系統(tǒng)在一群講述者中經常使用，并從一群講述者傳遞到另一群講述者。提出問題的能力被認為是區(qū)分語言和非人類動物交流系統(tǒng)的能力。伊麗莎·紐波特（Elissa L. Newport）指出，人類習得其母語的機制，既需要先天條件又需要后天培養(yǎng)，也就是說該過程既包括學習者所接觸的語言環(huán)境，又包括學習者所具備的先天素質，還需要以特殊的方式來學習瞬時組織語言的模式（Newport and Aslin, 2004; Newport et al., 2004）。語言是一種溝通方式，是人類行為的重要部分和定義我們社會身份的一種文化載體。人類語言還有一個基本的特征使之能夠服從于形式分析：語言結構由根據(jù)一定規(guī)則組合起來的較小的單元組成，進入較大結構的小單元的組合順序在幾個不同的水平產生。音素形成音節(jié)和詞匯，詞匯形成詞組和語句，這樣的組合規(guī)則不是任意的，每種語言有具體的規(guī)則，由此產生有效或有意義的語言結構的具體規(guī)則。人類天生就能學習語言，喬姆斯基指出，語言是一個自由創(chuàng)造的過程，它的規(guī)律和原則是固定的，但是生成原則的使用方式是自由的，甚至單詞的解釋和使用都涉及一個自由創(chuàng)造的過程，喬姆斯基認為語言是一種“心理器官”，是一組有限的計算機制，它可以無限變化，允許我們產生無限的句子（Friederici and Chomsky, 2017; Smith, 2004; Berwick and Chomsky, 2016）。

語言是人類的基本特征，也是一種文化共性。與其他非人類動物有限交流的系統(tǒng)不同，人類的語言是開放的、發(fā)展的，通過組合有限數(shù)量的符號可以產生無限數(shù)量的意義。我們所說的幾乎每一個復雜的事情都可能是之前從未說過的。語言真正的奧秘在于我們如何使用極其精細復雜的詞匯和語法結構系統(tǒng)，實時地自由表達我們的意識和思想。外在化的語言不僅是一個認知層面的問題，還是一個社會層面的問題。將語言符號外在化，無論是在墻上的繪畫還是書寫的文字，在某種意義上來說都是社會層面的問題，社會文化領域中應有某些存在的環(huán)境來支持它。龜甲、獸骨上雕刻的甲骨文，以及語言形式的外在化符號的產生，需要的不僅僅是大腦中的某些東西，更需要一個復雜的社會環(huán)境來支持它，并讓它變得有價值。語言本身是集體的產物，而不是個人的產物，具有社會屬性。語言從一開始就具有系統(tǒng)性和社會性。語言是由基因決定的，是生物進化的結果，是社會互動和交流的結果，對于人類之間的交流以及統(tǒng)一民族、文化和種族群體的認同感至關重要。至少五千年前書寫系統(tǒng)的發(fā)明使語言得以保存在實物上，這是人類一項重大的技術進步。

當接觸到語言數(shù)據(jù)時，聽者-說者的大腦會將聲音和意義聯(lián)系起來。通常我們會根據(jù)上下文學習單詞，通過逐步習得來區(qū)分其含義，通過捕捉其細微差別、內涵以及它們與事物的匹配方式，來學習單詞的含義。思想是認知活動的產物，通過它，可對我們的內在和外在世界進行假設，使其概念化、結構化和戰(zhàn)略化。學習是由經驗和神經元重組介導的發(fā)展或成熟過程，學習結果是知識和技能的積累，以更好地理解經驗和思想并使其有意義。通過語言將想法概念化，我們開始了解一些東西，即通過語言中介的互動，在面對新的體驗時，建立一些東西（如一個詞或概念）與某些東西的意義之間的關系。通過敘事來使用語言及其與文化的緊密聯(lián)系是人類認知的核心。

人類對世界的認知及認知科學的發(fā)展

人類認識的三個世界劃分。諾貝爾醫(yī)學獎得主約翰·卡魯·?？藸査梗↗ohn Carew Eccles）和哲學家卡爾·波普爾（Karl Popper）將心智問題分為三個世界（領域）的概念（Eccles and Poppe, 1984），認為人類經驗中的一切都可被歸入物理對象及狀態(tài)領域、意識狀態(tài)領域和客觀感知知識領域中的一個類別（如表2所示）。蔡曙山將人類認知分為五層級（蔡曙山，2021），將?？藸査购筒ㄆ諣柕娜祟惤涷灥膭澐稚仙嚼碚摰母叨龋J為人腦“進化奇跡”之處在于，其不僅僅是一個有血有肉的認知計算器官，還能夠產生神經認知、心理認知、語言認知、思維認知和文化認知五大非凡的現(xiàn)象（前兩項認知是動物也具有的低階認知，后三項認知是人類獨有的高階認知），這一奇跡的產生是語言使用的直接結果。

世界1是物理對象及狀態(tài)的世界，包括整個宇宙的物質和能量、所有的生物以及人類為編碼信息而制造的所有人工制品，如工具、機器、書籍和藝術品等，世界1是唯物主義者的全部世界；世界2是各種意識狀態(tài)和主觀認識的世界，我們感知的全部內容都在世界2里，包括外在感覺、內在意識和純我意識三個層次；世界3是客觀知識，是人類知識積累的結晶。這三個世界很容易界定，在人類認知的三個世界的分類中，沒有任何遺漏，它涉及存在的和我們所經歷的一切，即所有皆可歸類到三個世界當中（Eccles, 1973; 1970）。

人類具有兩種記憶（世界2）：情景記憶（記住曾經發(fā)生過的特定事件）和程序性記憶（一種與技能學習有關的記憶）。一方面，語言使用程序性記憶，我們大部分的發(fā)音、語法處理和句子構造都是不需要多加考慮的技能，就像騎自行車、游泳一樣輕松；另一方面，我們可以使用程序存儲系統(tǒng)，它包含的符號可以自動地“訪問”大腦語義網絡，以及我們曾經的豐富的人生經歷。人腦可以使用一種記憶來聯(lián)想并組織另一種記憶，而其他物種則無法使用這種記憶。

語言是只有人類才能實現(xiàn)的一種獨特的交流形式，大腦在漫長的進化過程中進行了很多改變才使語言交流成為可能?？陀^知識（世界3）用語言記載，是經驗（世界2）的先驅。當我們學習新信息并通過應用所學到的知識來修正行為時，我們就會創(chuàng)造出一種新的更豐富的體驗。因為情感是體驗的最終產物，所以我們有意采取的行動的結果是以一種新的情感產生一種新的體驗。當我們有意識地了解如何根據(jù)所學和所做的事情來創(chuàng)造新的體驗時，我們就擁有了智慧，智慧能夠有意識地理解我們如何創(chuàng)造經驗，并通過不斷進化最終形成世界3的客觀知識。因此，智慧的進化是指，基于我們已經學習、展示，然后體驗的知識，通過理解我們所創(chuàng)造的感受而獲得智慧的過程。學習知識是思考，運用知識是實踐和體驗。能夠用心去重復體驗，就是人類的智慧。

主觀認識（世界2）到客觀知識（世界3）的轉換是指一個人從自身主觀的認知和體驗，逐步理解和接受客觀存在的知識與事實的過程。這種轉換通常需要通過學習、實踐和反思等多種方式來實現(xiàn)，主觀認識到客觀知識的轉換是一個不斷學習、實踐、反思和調整的過程。而客觀知識的形成過程是一個經驗（世界2）和理性相結合的過程，需要通過觀察和實驗去發(fā)現(xiàn)事物的屬性和規(guī)律，收集數(shù)據(jù)和信息，經分析推導發(fā)現(xiàn)其中的規(guī)律和聯(lián)系，得出初步的結論，然后經檢驗和驗證、通過再次實驗、比較和重復觀察等方式以確保其正確性和可靠性。論證后的客觀知識可通過科教出版或工程應用等方式進行傳播，這個過程需要不斷地更新和完善，以適應不斷變化的世界和知識需求。

人類智慧是人類獨特的認知能力和智慧表現(xiàn)，具有以下特點：人類的抽象思維能力能夠將具體事物抽象成一般概念和規(guī)律，從而更好地理解和掌握事物的本質；人類的創(chuàng)造性思維能力能夠創(chuàng)造新的概念、思想、藝術和科技，推動社會的發(fā)展和進步；人類的自我反思能力能夠審視自己的思想、行為和價值觀，并不斷自我改進和完善；人類具有群體意識和合作精神，能夠合作解決問題、分享知識和經驗；人類的情感認知能力能夠感知和理解自己與他人的情感和情緒，從而更好地溝通和交流；人類的長期思考能力能夠預見未來的可能性并做長期規(guī)劃，從而更好地面對復雜的問題和挑戰(zhàn)。這些特點共同構成了人類的認知和智慧的本質特征。

人類智慧（世界2）和客觀知識（世界3）都是被用來解決問題、進行決策和推理的?？陀^知識是基于科學實驗和研究得出的結論和事實，具有客觀性、可重復性、普遍適用性；而人類智慧則更多的是基于個人的經驗、觀察、洞察和直覺，具有主觀性和不確定性。人類智慧具備對世間萬物聲像圖文的多模態(tài)感知能力，將不同事物聯(lián)系起來的邏輯認知能力和對社會環(huán)境反饋信息的學習校準能力。人類智慧的進化和形成是一個漫長而復雜的歷史過程，是由多方面因素相互作用和影響的結果，它受到大腦結構、語言交流、工具使用、農業(yè)革命、工業(yè)革命、社會文化、學習教育等多個因素的影響和作用。這些因素的相互作用和影響推動著人類智慧的不斷進化與發(fā)展。

認知科學、物理科學和信息科學的關聯(lián)與區(qū)別。認知科學是一門研究人類思維、學習、記憶、感知和決策等方面的多學科領域，涉及神經科學、語言學、哲學、心理學、AI和教育學等學科，是研究我們如何思考、感知和下決定的。認知技術將這些學科與工程相結合，對人類認知、智能，以及模擬和增強認知能力的技術與應用進行開發(fā)，以增強人類能力進而改變我們的生活和工作方式。

認知與意識密切相關，本質上是主觀的，是由個人經歷、信仰和情感塑造的。認知過程相較于物理或信息過程更復雜和靈活，這一過程往往需要整合多種信息，運用邏輯推理和創(chuàng)造性思維。認知技術依賴于大數(shù)據(jù)和先進的算力來學習、推理，并與人類互動，類似于人腦，可學習和適應新情況、創(chuàng)造新的解決方案，具有靈活性、智能性、交互性和自主性。認知領域、物理領域和信息領域密切相關但又有所不同，如表3所示，三者雖都是人類活動和知識發(fā)展的重要領域，但各有其研究的特點和應用領域，這些應用領域之間也存在相互聯(lián)系和交叉應用，如信息技術在物理領域的實驗和計算中的應用，AI在認知領域的應用等。

認知領域又是一個快速發(fā)展的領域，涉及復雜的多學科相互作用。通過跨學科合作，認知領域匯集了不同學科的技能和專業(yè)知識來解決復雜問題。從數(shù)據(jù)科學和工程技術到認知心理學和神經科學，從認知計算到虛擬現(xiàn)實，從導航、自動駕駛、智慧城市、智慧金融到大數(shù)據(jù)醫(yī)療，理論與應用研究的不同領域專家能夠借鑒廣泛的學科見解和技術，促進開發(fā)過程中的多樣性和包容性，通力合作開發(fā)新技術和新應用，推動認知領域的創(chuàng)新發(fā)展。

信息時代的兩次革命。計算機互聯(lián)網的出現(xiàn)是信息時代的第一次革命，它徹底改變了人們獲取、傳播和共享信息的方式。計算機互聯(lián)網為信息時代帶來了重要變革。一方面，互聯(lián)網極大地提高了信息的傳播速度，通過電子郵件、即時通訊和社交媒體等工具，人們可以在幾秒鐘內將信息傳遞到世界的任何一個角落，實現(xiàn)了實時交流和全球信息共享；另一方面，人們獲取信息變得更加便捷，過去人們可能需要花費大量時間在圖書館或通過傳統(tǒng)媒體獲取信息，而現(xiàn)在通過搜索引擎和在線數(shù)據(jù)庫就可以實現(xiàn)，NLP和數(shù)據(jù)挖掘技術的快速發(fā)展更是加快了人們獲取自己所需內容和知識的效率。

認知技術作為信息時代的第二次革命，強調人類智能和認知能力在信息處理與應用中的重要性。一方面，基于AI特別是NLP技術，計算機能夠更好地理解、處理和分析大量的信息；另一方面，認知技術的發(fā)展將改變人機交互的方式，通過NLP和語音識別等技術，計算機可以更好地理解人類的意圖和需求，提供更人性化的用戶體驗。此外，通過分析和處理大數(shù)據(jù)，計算機可以提供更全面、準確的信息支持，輔助決策，這使得認知技術在醫(yī)療診斷、金融投資和戰(zhàn)略規(guī)劃等領域具有廣泛的應用前景。

AI技術促進了認知科學與技術的發(fā)展。人類認知的研究歷史悠久，認知心理學、認知語言學和認知神經科學等有影響力的理論模型為理解人類智力的本質及其背后的認知過程提供了框架。認知技術是一種利用AI技術模擬人類認知過程的技術，使機器能夠像人類一樣感知、理解、學習、推理和解決問題。AI是一項交叉研究，基于多學科融合，促進了我們對語言學的了解與認識，促進了語言學理論本身的發(fā)展。NLP是AI的核心技術之一，目標是讓機器像人類一樣具有理解語言的智能，縮小不同語種的人類交流和機器理解之間的差距。自然語言研究從傳統(tǒng)的挖掘具有理論價值的語言事實并給出解釋，到挖掘便于機器存取的結構化的語言大數(shù)據(jù)知識，實現(xiàn)了從大規(guī)模語料中統(tǒng)計出語言的用詞組句規(guī)律。

自然語言是人類最主要的交流工具，通過理解和生成人類語言，計算機可以與人類進行有效的交互。由于大量的數(shù)據(jù)是以自然語言的形式呈現(xiàn)的，通過NLP，計算機可以通過處理和分析這些文本大數(shù)據(jù)來理解和生成人類語言，并挖掘有價值的信息和知識來支持決策制定、輿情監(jiān)控等任務。通過NLP技術可以構建和訓練大型語言模型，對語言規(guī)律和概率進行建模，對文本進行分析理解，并應用于文本分類、命名實體識別、自動文本摘要、機器翻譯、語音識別與合成、問答系統(tǒng)、人機對話系統(tǒng)等場景。搜索引擎可以理解用戶意圖并從海量數(shù)據(jù)中檢索相關信息，并提供準確的搜索結果，這為許多AI應用提供了理論基礎和技術支持。ChatGPT作為一種AI的大型語言模型，是認知技術的一種應用，它的底層邏輯是大數(shù)據(jù)的統(tǒng)計。當機器不能準確知悉事物的本質時，通過大數(shù)據(jù)的統(tǒng)計訓練來獲取經驗，通過迭代運算對未知狀態(tài)逐步逼近，從而判斷事物的本質屬性。這一過程能夠實現(xiàn)的前提是，人們使用正確語句的概率遠大于錯誤語句的概率，在此基礎上，只要語料規(guī)模足夠大，計算機就能夠統(tǒng)計出語言的組詞造句的規(guī)律性知識，用于自動語言理解和生成，其應用場景廣泛，將為人們提供更加智能化、便捷的服務和解決方案。

隨著更大規(guī)模的數(shù)據(jù)集和更強大的計算資源迅速增加，我們可以期待技術進一步實現(xiàn)更準確、更全面的語義理解能力，這將有助于提高機器對文本的深層理解，包括上下文推理、情感分析和邏輯推理等方面。隨著全球化的不斷推進，跨語言的交流和信息處理變得越來越重要。未來的NLP系統(tǒng)將更好地處理不同語言之間的語義差異、語法結構和文化背景的差異，提供更準確和自然的跨語言交流支持；同時，致力于提高對長文本的處理能力，加強對話系統(tǒng)的建模能力，這有助于實現(xiàn)更智能、更靈活的對話體驗，使機器能夠更好地理解和參與到復雜的人機對話中。就其在相關技術領域的應用來看，NLP技術結合計算機視覺可以實現(xiàn)圖像描述生成；結合知識圖譜和語義網絡可以實現(xiàn)更深層次的知識推理；結合增強學習可以實現(xiàn)更智能的對話代理。NLP技術的更廣泛應用將為人工智能的發(fā)展帶來新的機遇。

自然語言的句子無限，但句型有限，自然語言有很多歧義（其句子結構和含義可以有多種解釋），而通過一系列的算法和模型來解析語法結構、進行詞義分析，經上下文推斷、語境識別和語義角色標注等措施，技術可以消除自然語言的歧義。其中一種方法是根據(jù)預先定義的語法和規(guī)則來處理語言；另一種方法是使用統(tǒng)計模型，即通過分析大規(guī)模語料庫來學習語言規(guī)則和模式。當前使用的深度學習技術，如循環(huán)神經網絡（recurrent neural networks, RNN）和轉換器模型（transformer），就是通過大規(guī)模訓練來學習語言的表示和生成，并結合語法、語義和上下文信息，以生成準確和合理的語言表達。自然語言復雜多變，解決語言的歧義性、處理低資源語言，要繼續(xù)收集與標注大規(guī)模數(shù)據(jù)集、不斷改進和優(yōu)化算法，持續(xù)推動跨學科的合作與研究。

AI的發(fā)展水平與社會的進步和人類的福祉密切相關，AI的飛速發(fā)展將在科技和文化領域引發(fā)巨大的變革，給我們的工作和生活帶來顯著的影響。認知技術可以幫助我們更準確和高效地處理大量的信息，提高我們的決策能力和工作效率，更好地應對日常生活和工作中的挑戰(zhàn)；基于認知技術的智能家居、智能物流和智能醫(yī)療等可以幫助企業(yè)開發(fā)更智能的產品和更人性化的服務，為我們帶來更加便捷和優(yōu)質的生活和工作體驗；更重要的是，認知技術的發(fā)展有利于助推創(chuàng)新加速，這既可能引發(fā)許多學科的突破性進展，又能夠提高生產力，進而推動整個社會和經濟的發(fā)展。

認知技術將改變人們的工作和生活方式

認知技術是指與人類認知能力相關的技術，通過模仿、增強或擴展人類的認知過程來改變我們的工作和生活方式。人們越來越關注能夠以自然方式學習、推理和與人類互動的智能系統(tǒng)的發(fā)展。這得益于AI領域的突破，以及越來越多的大數(shù)據(jù)和計算能力的可用性，例如，預測和預防自然災害、防控群體性疾病等。隨著認知技術的發(fā)展，人們對邊緣計算能力的需求越來越大，邊緣計算能力可以支持分布式環(huán)境中數(shù)據(jù)的實時處理和分析，機器學習模型和其他智能系統(tǒng)也越來越需要其帶來的算法可解釋性和透明度。認知技術與物聯(lián)網的融合，為一系列行業(yè)的智能自動化和數(shù)據(jù)驅動決策創(chuàng)造了新的機遇。認知技術與物理系統(tǒng)的集成將帶來機器人、自動駕駛汽車和智能城市等領域新應用的發(fā)展。這些技術正在改變我們與機器的交互方式和彼此之間的交流模式，并有可能徹底改變我們的生活和工作方式。認知領域的關鍵優(yōu)勢之一是它能夠進化與適應不斷變化的環(huán)境和新發(fā)現(xiàn)，為創(chuàng)新增長創(chuàng)造機遇。認知技術在未來幾年可能產生如下新的突破和應用。

企業(yè)發(fā)展。認知技術可通過更好地理解企業(yè)員工的思維過程來幫助制造業(yè)設計更加高效的生產流程，其理論可應用于培訓和教育，幫助企業(yè)更好地培訓和指導員工。通過理解學習者的認知過程和思維習慣，認知技術可以設計更有效的培訓課程和教育方案，提高員工的學習效果和工作表現(xiàn)；通過理解用戶的認知過程和習慣，認知技術可以設計更便于使用的產品、更符合用戶認知習慣的產品界面和操作方式，提高產品的易用性、用戶體驗和產品質量；通過理解人類的認知過程和決策原理，認知技術可以設計更智能、高效、安全和靈活的自動化生產系統(tǒng)，降低生產成本，更好地滿足市場需求；通過自動化的生產線、智能助手和機器學習算法，認知技術能夠洞察大數(shù)據(jù)中的隱藏模式，從而幫助企業(yè)提高生產效率、減少錯誤率和進行更明智的決策。

智慧城市建設。認知技術可通過理解人類的認知過程和行為習慣，幫助設計更符合人類需求、更人性化的城市環(huán)境，更智能化的城市管理和公共服務系統(tǒng)，包括交通設施、公共空間和建筑物等，提高城市的宜居性和用戶體驗，優(yōu)化社區(qū)城市管理，完善醫(yī)療保健和教育等公共服務，提高居民的生活質量和幸福感。通過理解司機和乘客的認知過程和行為習慣，認知技術能夠設計更智能化的交通管理系統(tǒng)，提高交通效率和安全性，幫助優(yōu)化城市交通流量，減少交通擁堵和事故；通過理解罪犯的認知過程和行為習慣，認知技術可以設計更具針對性的監(jiān)控和預防犯罪系統(tǒng)，提高城市的安全性和治安水平。

智能金融研發(fā)。智能金融是結合AI技術和金融業(yè)務，實現(xiàn)智能化的金融服務。數(shù)據(jù)挖掘、機器學習和NLP等AI技術能夠對金融大數(shù)據(jù)進行分析和預測，幫助金融機構更準確、更智能地進行投資決策；區(qū)塊鏈技術可提高金融交易的透明度和安全性，并通過智能合約等技術實現(xiàn)金融服務的自動化和智能化；云計算和大數(shù)據(jù)技術可幫助金融機構存儲和處理金融大數(shù)據(jù)，提高數(shù)據(jù)的利用效率和系統(tǒng)的分析能力，降低金融機構的運營成本及風險。智能金融的研發(fā)為金融業(yè)帶來了更多的創(chuàng)新和發(fā)展機遇，智能金融與金融科技相結合，可以實現(xiàn)支付、借貸、保險等領域金融服務的創(chuàng)新和升級，更全面地保障金融安全和客戶權益。

大數(shù)據(jù)醫(yī)療發(fā)展。隨著醫(yī)療信息化的迅速推進，醫(yī)療數(shù)據(jù)的數(shù)量和種類迅速增加。大數(shù)據(jù)醫(yī)療對于推動醫(yī)療領域的發(fā)展和改善人民健康有著重要的作用。機器（深度）學習、數(shù)據(jù)挖掘等算法能夠通過分析和處理醫(yī)療大數(shù)據(jù)，發(fā)現(xiàn)潛在的規(guī)律和變化趨勢，預測疾病可能引發(fā)的風險，推斷患者在各病程階段的反應，協(xié)助醫(yī)生提升診斷疾病、制定治療決策的準確性，提高治療效果、減少醫(yī)療資源浪費；智能診斷、智能監(jiān)測和遠程醫(yī)療等技術可以實現(xiàn)醫(yī)療服務的智能化，電子病歷、醫(yī)學影像和基因序列等大數(shù)據(jù)可以被應用于疾病的診斷、預測、治療和預防；通過收集和分析大量的患者數(shù)據(jù)，認知技術能夠優(yōu)化醫(yī)療資源的配置，針對不同的患者制定不同的治療方案，從而提高醫(yī)療服務的效率和質量；個性化的健康管理和監(jiān)護系統(tǒng)將幫助人們更好地管理健康和預防疾病，有效監(jiān)測和管理患者的健康狀況，提供個性化的健康建議；通過挖掘臨床大數(shù)據(jù)，認知技術可以優(yōu)化試驗設計和樣本選擇，加快新藥研發(fā)和上市進程；通過醫(yī)療保險大數(shù)據(jù)的采集與分析，認知技術能夠實現(xiàn)醫(yī)療保險賠付模式的升級，提高醫(yī)療保險服務的效率和質量；通過在本地計算設備上進行數(shù)據(jù)訓練和模型更新，認知技術可以全面保護數(shù)據(jù)的隱私性，促進數(shù)據(jù)使用方的平臺合作與協(xié)同發(fā)展。

導航與無人駕駛技術進步。導航是通過各種設備和技術來幫助人們確定當前位置并找到目標位置的過程，它不僅需要提供準確的位置和路線信息，還需要與用戶進行良好的人機交互，使得導航更智能化、人性化和便利化。傳感器數(shù)據(jù)、地圖數(shù)據(jù)和歷史數(shù)據(jù)等多源數(shù)據(jù)的融合技術，能夠提高導航的準確性、實時性和可靠性；多模式導航將多種交通方式集成在一起，如公共交通、出租車和共享單車等，為用戶提供更便捷、更全面、更省時的出行服務，實現(xiàn)多種交通方式的信息互通，實現(xiàn)車輛之間的信息交流、信息共享和路況實時監(jiān)測的智能路網，為導航提供更準確和實時的路況信息和路線規(guī)劃，提高導航的效率和安全性。

無人駕駛技術是認知科學和AI技術在交通運輸領域的應用，其通過傳感器和控制系統(tǒng)來實現(xiàn)汽車的自主駕駛，大大提高交通的安全性和疏解效率，有利于車輛更好地感知和適應交通環(huán)境，改善交通流量管理，減少交通事故和交通堵塞。無人駕駛汽車的智能化和自適應能夠根據(jù)道路、交通和天氣等條件進行自主決策，提高汽車的駕駛安全性和穩(wěn)定性。人機交互技術讓乘客與汽車之間更智能和自然地交互，實現(xiàn)更省時、便捷的出行體驗。無人駕駛汽車與智能路網相結合，能夠實現(xiàn)交通的自主調度和優(yōu)化，從而改變人們的出行和生活方式，提高交通運輸?shù)男屎桶踩浴?/p>

結語

認知技術的競爭實際是人才的競爭，我國政府一直高度重視人才的引進和培養(yǎng)。清華大學自2005年成立了教育部認知科學創(chuàng)新基地，北京大學和貴州民族大學等高校均建立了認知科學一級學科，可培養(yǎng)本、碩、博不同層次的認知科學理論與技術人才。騰訊、百度、阿里等科技公司近年來競相投入了大量的人力和物力進行組織攻關，通過一系列戰(zhàn)略重點部署和實踐來推進認知技術的研發(fā)，尋求認知技術的新突破。從政府層面來看，通過一系列的國家重點研發(fā)計劃、國家自然科學基金和國家社會科學基金等方式，國家不斷加大對腦機接口、認知科學、AI（特別是NLP）、類腦計算和社會計算等重基礎、寬應用研究的支持力度，積極模擬人類智能，進行類腦計算，構建人造大腦，挖掘大規(guī)模數(shù)據(jù)中的人類知識，促進了來自不同領域和不同背景的研究人員形成有凝聚力的研究團隊，為得到更具影響力的研究成果打下了堅實的基礎。

認知技術具有潛在的經濟、社會、教育和戰(zhàn)略效益。隨著認知技術變得越來越復雜，廣泛來源的數(shù)據(jù)激增，為認知技術的更深一步研發(fā)提供了新的機遇。AI是認知技術的關鍵推動者，深度學習、強化學習和NLP等領域的研究擴展了AI研究的邊界，為認知技術的新突破提供了支撐。認知技術將改善人機交互方式，使得計算機更好地理解和響應人類的需求、提供更智能、高效和個性化的解決方案，這將引發(fā)諸多行業(yè)領域的變革。

值得注意的是，在發(fā)展認知技術的同時，也應注重制定相應的技術監(jiān)管框架和標準，以應對包括與隱私、偏見、公平、安全、道德和倫理相關的問題。例如，惡意行為者出于經濟利益或其他目的，濫用認知計算模型來產生大量垃圾郵件，或用來生成大量虛假和不良信息，將造成一系列不良影響。政府和科研機構組織應為這些技術的開發(fā)與部署制定相應的道德框架和指導方針，促進相關問題的國際合作，以確保負責任地使用技術并造福社會。

（本文系國家自然科學基金重點項目“語言理解的認知機理與計算機模型研究”和國家社會科學基金重大項目“語言、思維、文化層級的高階認知研究”的階段性成果，項目編號分別為：62036001、15ZDB017）

參考文獻

蔡曙山、江銘虎，2016，《人類的心智與認知》，北京：人民出版社。

蔡曙山，2021，《認知科學導論》，北京：人民出版社。

江銘虎、王琳，2013，《腦與語言認知》，北京：清華大學出版社。

江銘虎，2016，《語言信息處理》，北京：人民出版社。

江銘虎，2019，《語言的ERP腦電認知》，北京：清華大學出版社。

江銘虎，2022，《語言、腦進化與認知》，北京：清華大學出版社。

王士元，2008，《語言涌現(xiàn)：發(fā)展與演化》，中國臺北：中央研究院語言研究所。

王士元，2011，《語言、演化與大腦》，北京：商務印書館。

R. C. Berwick and N. Chomsky, 2016, Why Only Us Language and Evolution, MA: The MIT Press.

N. Chomsky, 2008, Language and Mind, Third Edition, Cambridge: Cambridge University Press.

N. Chomsky, 2014, The Minimalist Program, Cambridge: The MIT Press.

C. R. Darwin, 1871, The Descent of Man, and Selection in Relation to Sex, London: Jone Murray, Albemarle Street.

T. Deacon, 1997, The Symbolic Species: The Co-evolution of Language and the Brain, New York: W. W. Norton & Company, Inc.

J. C. Eccles, 1970, Facing Reality, London: Longman Publishers.

J. C. Eccles, 1973, The Understanding of the Brain, New York: McGraw-Hill.

J. C. Eccles and K. R. Poppe, 1984, The Self and Its Brain, Berlin, Heidelberg: Springer.

A. D. Friederici and N. Chomsky, 2017, Language in Our Brain, MA: The MIT Press.

M. A. Nowak et al., 2002, "Computational and Evolutionary Aspects of Language," Nature, 417(6889).

E. Newport and R. Aslin, 2004, "Learning at a Distance I. Statistical learning of Non-adjacent Dependencies," Cognitive Psychology, 48(2).

E. Newport et al., 2004, "Learning at a Distance II. Statistical Learning of Non-adjacent Dependencies in a Non-human Primate," Cognitive Psychology, 49(2).

D. Shilton et al., 2020, "Human Social Evolution: Self-Domestication or Self-Control?" Frontiers in Psychology, (11).

N. Smith, 2004, Chomsky: Ideas and Ideals, 2nd Edition, Cambridge: Cambridge University Press.

Cognitive Techniques: Revolution and Outlook

Jiang Minghu

Abstract: From the perspective of the long co-evolution of human brain and human language, the human brain is the brain of language, therefore as the knowledge recording tool, language helps to recording human history. Human cognition can be classified to three levels as cognitive domain, subjective consciousness and objective knowledge. There are similarities and differences among cognitive domain, physical domain and information domain respectively. The world-wide-web is the first revolution of information age. Natural language processing is the core technology of artificial intelligence that has promoted the development of cognitive science and cognitive technology. As the second revolution of the internet information age, cognitive technology will change our way of working and living.

Keywords: language, human brain, cognitive domain, physical domain, information domain, artificial intelligence

www.av视频在线观看,亚洲免费影院第一第二,一级毛片在现观看,久久精品片色免费看网站,日本大香伊蕉在人线国产,奇米精品一区二区三区在线观看,亚洲网站一区

認知技術的變革及前景展望