促進生成式人工智能發(fā)展亟須破解數(shù)據(jù)瓶頸_理論前沿

【析理論道】

作為信息化、數(shù)字化、智能化的新型技術(shù)基座，生成式人工智能對于提升國家戰(zhàn)略地位與國際競爭力具有重要意義。近年來，美國接連出臺多項人工智能戰(zhàn)略和政策文件，以謀求維持其在該領(lǐng)域的領(lǐng)先地位。歐盟也試圖通過立法打破數(shù)據(jù)孤島、構(gòu)建基于風險的分層規(guī)制體系，提升人工智能產(chǎn)業(yè)競爭力?；跀?shù)據(jù)要素稟賦，中國在發(fā)展生成式人工智能領(lǐng)域具有戰(zhàn)略優(yōu)勢。2023年中央經(jīng)濟工作會議指出：“要大力推進新型工業(yè)化，發(fā)展數(shù)字經(jīng)濟，加快推動人工智能發(fā)展。”為進一步促進生成式人工智能的快速發(fā)展，應(yīng)構(gòu)建生成式人工智能促進型法律制度，進一步優(yōu)化個人信息保護，協(xié)調(diào)著作權(quán)保護，推動企業(yè)數(shù)據(jù)互聯(lián)，用制度創(chuàng)新破解數(shù)據(jù)瓶頸，為生成式人工智能發(fā)展提供法治保障，在激烈的國際競爭中搶占主動權(quán)和制高點。

完善個人信息保護，增強訓練數(shù)據(jù)供給

個人信息是生成式人工智能訓練數(shù)據(jù)的重要來源。生成式人工智能訓練數(shù)據(jù)的形成，有賴于對個人信息保護制度的正確理解與適用，涉及個人信息保護法中的告知同意制度、必要性原則以及公開性個人信息的利用等法律規(guī)范。具體而言，告知同意制度能夠給予個體一定的自我保護，防止信息處理者過度收集個人信息。但面對信息處理的復雜實踐，受認知所限，個體有可能難以真正預(yù)防風險。必要性原則強調(diào)收集個人信息的限制與處理最小化。若對必要性原則進行僵化解釋，則任何包含個人信息的數(shù)據(jù)都無法用于人工智能訓練，這反而可能導致人工智能因為缺少某些數(shù)據(jù)訓練而變得具有歧視性、不公平性。公開數(shù)據(jù)是生成式人工智能數(shù)據(jù)的主要來源，而這些數(shù)據(jù)往往缺乏交互場景和聯(lián)系方式，信息處理者難以聯(lián)系個人和獲取個人同意。

為破解生成式人工智能在個人信息數(shù)據(jù)收集與利用方面的障礙，應(yīng)在保障個人信息安全的前提下，進一步完善個人信息保護制度。首先，對于已公開的個人信息，應(yīng)以廣泛匯聚與融合利用為前提，于技術(shù)層面構(gòu)建去標識化、差分隱私等程序性保護機制，并輔之以個人拒絕權(quán)等機制。其次，當人工智能訓練中的數(shù)據(jù)包含個人信息時，應(yīng)區(qū)分改進型與侵害型的個人信息處理。如果人工智能訓練數(shù)據(jù)是為了實現(xiàn)更為公平與準確的個人信息處理，應(yīng)將此類訓練視為符合個人信息處理目的，反之則應(yīng)視為違反必要性原則。最后，應(yīng)當優(yōu)化告知同意制度，強化隱私政策告知、加強合作治理。在個體私力救濟不足的情況下，應(yīng)強化執(zhí)法者對隱私政策的執(zhí)行、市場機構(gòu)對隱私政策與個人信息保護實踐的評級、信息處理者內(nèi)部的個人信息合規(guī)機制。

立法既要為訓練數(shù)據(jù)提供制度供給，也要為個人信息安全提供保障。對于人工智能企業(yè)合法獲取的包含個人信息的數(shù)據(jù)，應(yīng)在數(shù)據(jù)清洗、數(shù)據(jù)標準、模型訓練和評估、模型部署等階段，對個人信息數(shù)據(jù)進行全生命周期的監(jiān)管，進一步強化生成式人工智能企業(yè)的處理者責任。在技術(shù)層面，應(yīng)要求人工智能企業(yè)依托加密技術(shù)、隱私計算等技術(shù)化手段保護個人信息。在制度層面，應(yīng)要求人工智能企業(yè)通過內(nèi)部合規(guī)、設(shè)立數(shù)據(jù)保護專員、合規(guī)審計與風險評估等機制嚴格保護個人信息。

協(xié)調(diào)著作權(quán)保護，規(guī)范內(nèi)容數(shù)據(jù)合理使用

著作權(quán)保護的門檻并不高，只要求作品具有獨創(chuàng)性并能以一定形式表現(xiàn)。因此，人工智能企業(yè)利用網(wǎng)絡(luò)上的文字、圖片、聲音等素材的內(nèi)容數(shù)據(jù)進行訓練，便有可能構(gòu)成著作權(quán)侵權(quán)，面臨巨大訴訟壓力、賠償壓力以及社會聲譽壓力。由于多數(shù)內(nèi)容數(shù)據(jù)的著作權(quán)分散于各個著作權(quán)人，人工智能企業(yè)可能難以直接與他們聯(lián)系。即使聯(lián)系到這些著作權(quán)人，在要價問題上也面臨種種困難。既有的數(shù)據(jù)庫和各類著作權(quán)集體管理組織可以在一定程度上解決著作權(quán)許可問題，但對于網(wǎng)絡(luò)上的內(nèi)容數(shù)據(jù)而言，由于數(shù)據(jù)容量以及適用領(lǐng)域等方面的限制，其作用相對有限。

破解生成式人工智能內(nèi)容數(shù)據(jù)的著作權(quán)約束，需要構(gòu)建整體性的合理使用制度。生成式人工智能與非生成式人工智能相比，對于數(shù)據(jù)的利用具有復雜性，其對著作權(quán)作品數(shù)據(jù)的利用常常既涉及事實，也涉及表達，但整體上屬于合理適用范圍。具體來說，就人格權(quán)益而言，生成式人工智能利用海量數(shù)據(jù)而非特定作品進行訓練，一般不會侵害某一特定作品中所包含的人格權(quán)益；就激勵機制而言，生成式人工智能利用海量數(shù)據(jù)進行訓練，主要是為了提高其一般性的識別與創(chuàng)作能力，而不是替代某一特定作品，作者也不會因為生成式人工智能作品的出現(xiàn)而不再進行創(chuàng)作。當然，如果生成式人工智能對于著作權(quán)數(shù)據(jù)的訓練破壞了權(quán)利人的技術(shù)措施或相關(guān)協(xié)議，或者當生成式人工智能對于著作權(quán)數(shù)據(jù)的利用是“假訓練、真剽竊”，那么此類行為就對人格權(quán)益與激勵制度產(chǎn)生負面影響，應(yīng)當被排除在合理使用之外。

生成式人工智能企業(yè)在對著作權(quán)作品進行寬泛合理使用的同時，也需要承擔與此相對應(yīng)的更多責任。首先，生成式人工智能企業(yè)應(yīng)踐行社會主義核心價值觀，積極承擔社會責任，避免數(shù)據(jù)與算法歧視方面的風險與侵害。其次，生成式人工智能企業(yè)應(yīng)對實質(zhì)性相似的生成作品承擔侵權(quán)責任，這既有利于保護作品原創(chuàng)者的合法權(quán)益，也有利于激勵企業(yè)的技術(shù)創(chuàng)新。最后，法律應(yīng)審慎對各類生成類作品賦予著作權(quán)。人工智能領(lǐng)域的激勵機制在于鼓勵人工智能技術(shù)的發(fā)展與創(chuàng)新，而非激勵生成作品的生產(chǎn)。可以將人工智能的生成作品置于公共領(lǐng)域，允許公眾與企業(yè)對其進行一般利用。生成式人工智能企業(yè)也可以推出用戶付費版本，通過用戶協(xié)議和向用戶收取使用費用來獲得報酬，這可以為人工智能企業(yè)提供合理的商業(yè)激勵。

破除企業(yè)數(shù)據(jù)壁壘，助推數(shù)據(jù)匯聚融合

破除企業(yè)數(shù)據(jù)壁壘，需要倡導互聯(lián)網(wǎng)的互聯(lián)互通。網(wǎng)絡(luò)互聯(lián)曾經(jīng)是互聯(lián)網(wǎng)的核心精神之一，但隨著互聯(lián)網(wǎng)的發(fā)展和商業(yè)化，出于競爭或安全等考量，互聯(lián)網(wǎng)企業(yè)往往打造封閉型數(shù)據(jù)生態(tài)系統(tǒng)，防止其他企業(yè)特別是競爭企業(yè)獲取其數(shù)據(jù)。這導致了數(shù)據(jù)孤島現(xiàn)象，抑制了數(shù)據(jù)共享紅利的溢出效應(yīng)。對于企業(yè)而言，僅僅依靠自身掌握的商業(yè)數(shù)據(jù)進行訓練，難以觸及其他企業(yè)獨占的高質(zhì)量數(shù)據(jù)，勢必會制約生成式人工智能的訓練效果。

就數(shù)據(jù)互聯(lián)而言，應(yīng)避免對網(wǎng)絡(luò)公開數(shù)據(jù)進行絕對排他性確權(quán)。過去幾十年來，網(wǎng)絡(luò)公共空間的興起導致了數(shù)據(jù)的爆發(fā)性增長，為人工智能等技術(shù)的發(fā)展奠定了堅實的數(shù)據(jù)基礎(chǔ)。隨著數(shù)據(jù)價值的凸顯，數(shù)據(jù)的利益分配成為各方關(guān)注焦點，不少聲音呼吁通過對數(shù)據(jù)確權(quán)實現(xiàn)此類分配。但基于數(shù)據(jù)的公共性特征，過多的排他性權(quán)利保護可能導致社會對它們的利用不足，構(gòu)成“反公地悲劇”。數(shù)據(jù)的公共性并不否認對數(shù)據(jù)權(quán)益的合理保護，數(shù)據(jù)的合理保護同樣是一種公共善品，有利于激發(fā)私主體的創(chuàng)造和個體有價值數(shù)據(jù)的公開；同樣，數(shù)據(jù)的公共性也不否認數(shù)據(jù)利用的公平性需求，而這種公平性不應(yīng)依賴微型權(quán)益確權(quán)或強化企業(yè)的數(shù)據(jù)排他性確權(quán)來實現(xiàn)，而應(yīng)創(chuàng)新數(shù)據(jù)利用的收益分配機制，實現(xiàn)效率與公平的協(xié)調(diào)。

破除企業(yè)數(shù)據(jù)壁壘，也可以利用各類合理的爬蟲機制打通不同企業(yè)之間的數(shù)據(jù)壁壘。基于數(shù)據(jù)的非競爭性與爬蟲技術(shù)的中立性特征，應(yīng)當認識到爬蟲等行為一般不會影響數(shù)據(jù)持有者的合法權(quán)益，如果運用得當，反而會承載促進互聯(lián)的作用。尤其在數(shù)據(jù)企業(yè)紛紛設(shè)置壁壘、互相防范的情形下，合理的數(shù)據(jù)爬蟲可以成為不同企業(yè)數(shù)據(jù)融合的橋梁。為此，對于規(guī)范性的數(shù)據(jù)爬蟲不應(yīng)施加過多限制。對于造成宕機等后果的數(shù)據(jù)爬蟲，可以根據(jù)侵權(quán)責任法進行應(yīng)對，謹慎適用刑事措施。此外，網(wǎng)信部門可以通過鼓勵行業(yè)自律等方式，在倡導互聯(lián)網(wǎng)企業(yè)合理自治的同時，助推企業(yè)之間互聯(lián)互通，營造多樣化互聯(lián)網(wǎng)生態(tài)。在生成式人工智能等技術(shù)日新月異的背景下，企業(yè)呈現(xiàn)出前所未有的數(shù)據(jù)融合需求，應(yīng)利用法律與行業(yè)自律的方式共同推動數(shù)據(jù)互聯(lián)，為生成式人工智能企業(yè)提供充足的數(shù)據(jù)源，助力企業(yè)良性競爭、持續(xù)創(chuàng)新。

（作者：王業(yè)亮、丁曉東，分別系中國人民大學法學院博士后，中國人民大學法學院教授、未來法治研究院副院長）

www.av视频在线观看,亚洲免费影院第一第二,一级毛片在现观看,久久精品片色免费看网站,日本大香伊蕉在人线国产,奇米精品一区二区三区在线观看,亚洲网站一区

促進生成式人工智能發(fā)展亟須破解數(shù)據(jù)瓶頸