二,、人工智能生成物是否能夠獲得《著作權(quán)法》保護?2023年7月,,世界人工智能大會在上海如期舉辦,,關(guān)于機器人、人工智能的新一輪話題熱度又直線上升,。AIGC(AI-Generated Content,,人工智能生成物,此類型AI亦稱為生成式AI)自2022年開始迎來了高速發(fā)展,不僅與金融,、傳媒,、娛樂、醫(yī)療,、工業(yè)等各行業(yè)進行結(jié)合,,以低成本、高效率的方式滿足海量個性化需求,,與此同時也孕育著行業(yè)業(yè)態(tài)的新模式,。而對AIGC的規(guī)制,美國版權(quán)局于今年3月發(fā)布了關(guān)于包含AI生成內(nèi)容之作品版權(quán)登記的政策聲明(Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence),,我國也相應(yīng)出臺了《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》與《生成式人工智能服務(wù)管理暫行辦法》,。本專題將結(jié)合國際上的規(guī)制現(xiàn)狀,國內(nèi)的政策解讀,,對人工智能生成物是否能夠獲得版權(quán)保護,,如何避免人工智能生成物侵權(quán),以及人工智能所涉及的倫理問題等展開一系列探討與實務(wù)操作指引,。根據(jù)《中國AIGC產(chǎn)業(yè)全景報告》的定義,AIGC全稱為AI-Generated Content,,指基于預訓練大模型,、生成式對抗網(wǎng)絡(luò)(GAN)等人工智能技術(shù),通過已有數(shù)據(jù)尋找規(guī)律,,并通過釋放泛化能力生成相關(guān)內(nèi)容的技術(shù),。在我們闡釋AIGC可能涉及的法律爭議之前,先來看看預訓練大模型和生成式對抗網(wǎng)絡(luò)的含義,。預訓練大模型(LLM),,包含了“預訓練”-“指令微調(diào)”兩個步驟。第一步在大規(guī)模無標注數(shù)據(jù)(如互聯(lián)網(wǎng)文本)上進行模型預訓練,,學習通用的語言模式,;第二步在給定自然語言處理任務(wù)的小規(guī)模有標注數(shù)據(jù)上進行模型微調(diào),快速提升模型完成這些任務(wù)的能力,,最終形成可部署應(yīng)用的模型,。[1]生成式對抗網(wǎng)絡(luò),則是由生成器和判別器組成的深度學習模型,。生成器主要用以生成和真實數(shù)據(jù)近似的數(shù)據(jù),,而判別器主要用于區(qū)分生成器生成的數(shù)據(jù)和真實數(shù)據(jù)。生成器和判別器共同構(gòu)成了一個動態(tài)的“博弈過程”,。我們以時下熱門的圖像生成式AI及文本生成式AI詳細解釋,。圖像生成式AI是指基于給定文本描述,生成圖像的AI系統(tǒng)(Text-To-Image,又稱T2I),。這受益于計算機視覺行業(yè)的進展與深度生成網(wǎng)絡(luò)研究的突飛猛進,。目前擴散模型(Diffusion Model)因操作簡便、生成圖像精度高而成為最流行的生成模型,。這一類的典型代表有Stable Diffusion,、Midjourney。早期的模型是通過對圖像元素添加關(guān)鍵詞,,再讓指令詞與圖像信息進行匹配,,以此達到用戶輸入文本,AI輸出對應(yīng)元素拼貼的效果,。而擴散模型則在此基礎(chǔ)上改良,,通過對圖片添加噪聲(noise),再以計算機神經(jīng)網(wǎng)絡(luò)的正向加噪,、反向去噪聲過程生成質(zhì)量更高和創(chuàng)造性更強的圖像,。通過大量的學習訓練,AI就能從足夠多的素材中學習并生成最接近人類真實世界中的數(shù)據(jù),。我們再來看文本生成式AI,。時下最火的產(chǎn)品莫過于ChatGPT4。開頭我們說過預訓練大模型(LLM)包含了“預訓練”和“微調(diào)”的兩段式練習,,其實GPT在前兩代的時候并沒有展現(xiàn)出優(yōu)于其他模型的性能,,而到GPT3的時候,,突破性地在兩段式的基礎(chǔ)上加入了in-context學習方式,,通過給模型做示范,讓模型感知應(yīng)該輸出什么,,而不是直接標記最優(yōu)答案,。GPT3通過引導式的學習方式,在超大模型上展現(xiàn)出了驚人的效果:只需要給出一個或者幾個示范樣例,,模型就能照貓畫虎地給出正確答案,。而GPT4在底層技術(shù)原理上并沒有超越第三代,而是改變了訓練策略,,通過人工篩選,,不斷判斷輸出的哪些句子是好的,哪些是低質(zhì)量的,,這樣就可以訓練得到一個reward模型,。通過reward模型來模擬人類打分的過程,自動對問題的不同回答打分,,模型再根據(jù)打分調(diào)整參數(shù),。即用問題、回答和分值作為數(shù)據(jù),用強化學習的方式訓練模型,。這就是Chat GPT可以模擬情景對話,、給出多元化答案,并在和人類的對話中可以不斷修正結(jié)果的原理,。通過對上述生成式AI工作原理的闡述,,我們不難發(fā)現(xiàn),AI的學習離不開海量的數(shù)據(jù)源,,而數(shù)據(jù)來源真實性直接影響了AI輸出結(jié)果的準確性,,而數(shù)據(jù)源的合法性則可能直接導致對版權(quán)、隱私和倫理的爭議,。而對于AI輸出的結(jié)果是否能成為法律保護的對象,,又是否可能侵害他人的權(quán)利,也成為AIGC法律合規(guī)的焦點,。 二,、人工智能生成物是否能夠獲得《著作權(quán)法》保護? 今年3月美國版權(quán)局推出了關(guān)于生成式AI作品版權(quán)的政策聲明,。在這份聲明中,,對“生成式AI的生成的材料”和“由人類創(chuàng)作的(human-authored)和人工智能生成材料(AI-generated material)組成的作品”進行了區(qū)分。首先該份聲明依然堅持了一項基本原則——版權(quán)法只能保護“人”的智力創(chuàng)造,。因此,,由計算機算法自主創(chuàng)建的生成物是無法被認定為“作品”的。而在今年2月,,一份由人類作者創(chuàng)作文本,、Midjourney生成圖像的圖畫小說Zarya of the Dawn,卻得到了美國版權(quán)局的認可,,被認為構(gòu)成版權(quán)法保護的作品,,獲得了有限的保護。對此,,美國版權(quán)局進一步解釋,,該圖畫小說中人類創(chuàng)作的文本屬于人類的智力成果,符合版權(quán)法保護的標準,,可以單獨登記成為作品,;而Midjourney生成的圖像,僅僅是基于計算機算法得出的材料,,無法獨立獲得保護,,但不影響整個圖畫小說成為一個完整的作品。那么對于由人類使用生成式AI進行多次調(diào)整,、修改后的作品是否能夠保護呢,? 在此問題上,,該份聲明舉例了人類使用Photoshop編輯圖像的例子。視覺藝術(shù)家利用圖像編輯軟件修改圖片,,計算機僅僅是一種輔助工具,,它不影響人類對作品表達的創(chuàng)作性控制,因而不會影響圖片藝術(shù)家的“作者”身份,。相反,,對于由機器自動運行,沒有人類作者的任何創(chuàng)意或干預而產(chǎn)生的作品則無法獲得保護,。而關(guān)于在人工智能訓練中使用受版權(quán)保護的作品在法律上應(yīng)當如何規(guī)制等問題,,美國版權(quán)局后續(xù)也將向社會公眾征求意見。因此我們看到了一個有意思的現(xiàn)象,,美國版權(quán)局沒有一刀切地認為只要是AI生成的作品就不是“作品”,,而是需要進行個案分析。雖然如何判定人類在作品中的智力貢獻,,以及是否能夠在單件作品中獨立區(qū)分開人類創(chuàng)作部分和AI創(chuàng)作的部分,,是一件在實際操作中并不容易的事情。但至少,,該份聲明明確了,,版權(quán)法依然應(yīng)當以人為本,也奠定了生成式AI應(yīng)當服務(wù)于人類,,成為人類工具的基調(diào),。而英國在作品的創(chuàng)造性問題方面,則一直主張“額頭流汗”原則,,即只要作品中存在作者的勞動即可,,而無論此項勞動的多少。英國《1988年版權(quán),、設(shè)計與專利法》明確認可文學,、戲劇、音樂或藝術(shù)作品如果是由計算機產(chǎn)生的,,那么這一作品的作者應(yīng)當是對該作品的創(chuàng)作進行必要安排的人,此類由計算機生成作品的著作權(quán)保護期限系自作品創(chuàng)作完成當年的最后一天起五十年,,同時對于此類作品不適用著作人格權(quán),。[2]目前,我國現(xiàn)行出臺文件均沒有對AI生成物是否符合《著作權(quán)》法意義上的作品給出結(jié)論性評價,。而在國內(nèi)現(xiàn)有的案例中,,對于AI生成的作品是否是“作品”也形成了完全相反的觀點。讓我們先回歸法條,,我國《著作權(quán)法》中所稱的作品,,“是指文學,、藝術(shù)和科學領(lǐng)域內(nèi)具有獨創(chuàng)性并能以一定形式表現(xiàn)的智力成果”,所以作品具有兩個實質(zhì)構(gòu)成要件:“獨創(chuàng)性”和內(nèi)容屬于“智力成果”,。那么這里的“智力成果”是否必須為人類的智力成果呢,?我們從(2019)粵0305民初14010號“Dreamwrite”案件中可以看出一些判斷方向。深圳南山區(qū)法院認可了由Dreamwriter軟件自動撰寫完成的文章可以被認定“作品”,,但其在說理部分強調(diào)了Dreamwriter軟件的自動運行并非無緣無故或具有自我意識,,其自動運行的方式體現(xiàn)了原告的選擇,也是由Dreamwriter軟件這一技術(shù)本身的特性所決定……從涉案文章的生成過程來分析,,該文章的表現(xiàn)形式是由原告主創(chuàng)團隊相關(guān)人員個性化的安排與選擇所決定的,,其表現(xiàn)形式并非唯一,具有一定的獨創(chuàng)性,。其觀點是,,人工智能生成內(nèi)容基于人工智能的控制人或研發(fā)人員設(shè)置一定的技術(shù)、算法而得,,其在一定程度上仍屬于人類的智力成果,。但同時可見,我國法院在判斷AI生成物是否是作品的過程中,,仍不可排除地需要甄別“人”在作品中的地位和作用,。然而隨著深度學習技術(shù)和大數(shù)據(jù)等網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,人工智能早已擺脫了遵循既定算法和程序的計算機輔助工具的地位,,能夠獨立自主創(chuàng)作,。這種自主創(chuàng)作的方式將可能使人對作品的控制性創(chuàng)造作用越來越小。因而,,筆者認為,,美國版權(quán)局的甄別方法或?qū)ξ覈鳤I生成物的保護具有一定的借鑒和參考意義。當然,,我國《著作權(quán)法》雖暫無定論,,卻不妨礙生成式AI的提供者通過與用戶訂立協(xié)議的形式約定生成物的著作權(quán)歸屬。生成式AI給人類帶來的沖擊感毫無疑問是強烈的,甚至對一些職業(yè)造成了現(xiàn)實的威脅,,比如游戲制圖,、影視美術(shù)、工業(yè)設(shè)計等領(lǐng)域,,AI看上去稍加訓練便可以替代,,想象力甚至超越人類。但通過上文對AI原理的分析,,我們也可以清醒地認識到,,AI雖然具備了深度學習的能力,,但仍在模擬人類進行思考,也需要通過人類來甄別一些信息,。比如文本生成型AI,,當我們需要一個專業(yè)領(lǐng)域的LLM時,用于預訓練模型中的知識庫就顯得尤為重要,。由于大多數(shù)預訓練模型都是在通用訓練語料上進行學習的,,對于一些類似金融、法律等特殊領(lǐng)域中的概念和名詞,,AI都無法具備很好的理解,。所以需要在訓練語料中加入一些領(lǐng)域數(shù)據(jù),以幫助模型在指定領(lǐng)域內(nèi)獲得更好的效果,。這就給了專業(yè)領(lǐng)域的人才以新的合作機遇,,而未來,訓練完成的AI將可能有針對性地適配在各個專業(yè)領(lǐng)域內(nèi),,成為能提高人類效率的良好工具,。而圖片生成式AI的新賽道則展露的更早,美國早已出現(xiàn)了售賣提示詞的網(wǎng)站,。在AI的世界里,,提示詞(Prompt)就是和AI溝通語言的橋梁,通過準確的使用關(guān)鍵詞,,才能讓AI生成出自己想要的,、具有穩(wěn)定風格的作品。而那些能讓AI做人類想要讓他們?nèi)プ龅氖虑榈膶<冶环Q為提示詞工程師(Prompt Engineer),。目前國內(nèi)外,已有很多使用大模型進行生產(chǎn)創(chuàng)作的實踐應(yīng)用,,涉及軟件開發(fā),、文本處理、圖像生成等多個領(lǐng)域,,而“如何寫出好的提示詞”正在成為各個領(lǐng)域熱論的議題,。接踵而來的,即是優(yōu)秀的提示詞如何能夠保護,?我們首先來分析其是否能夠通過《著作權(quán)法》進行保護,。一些由詞組、短句堆砌而成的較為簡單的提示詞,,由于其本身不能聯(lián)系成為一個語義連貫,具有獨創(chuàng)性意義的作品,,因而不屬于著作權(quán)法保護的對象,。而如將古詩詞“橫看成嶺側(cè)成峰,,遠近高低各不同”作為提示詞,亦無法獲得保護,,因為該作品已屬于公有領(lǐng)域,,同樣不符合保護條件。由此來看,,提示詞想要獲得《著作權(quán)法》保護,,則可能需要進行非常詳細的描述,同時又要具備獨創(chuàng)性的特征,。如果要求提示詞工程師一定要達成上述條件,,其智力成果才能獲得保護,確實是有些強人所難,,更有些強AI所難,,因為AI的本質(zhì)系一系列計算機程序的組合,其善于接受的指令通常應(yīng)當是簡潔,、簡短,、明確的詞語或短句,并不需要過多的修飾或完整連貫的意思表示,。但一段好的提示詞的確需要工程師進行反復的推敲,、實驗、修改,,同時也需要工程師具有一定的計算機軟件編程知識或至少應(yīng)當初步了解其所被提示的AI的基本工作或運作原理,,要付出非常極大的努力,不可否認一段優(yōu)秀的提示詞應(yīng)當被認定是智力成果,。那么,,在提示詞本身的基本表達不能被著作權(quán)保護的情況下,是否有更好的保護方式呢,?筆者認為,,在沒有新的法律法規(guī)制定和頒布之前,我們可以在現(xiàn)有知識產(chǎn)權(quán)法律法規(guī)框架體系中尋找適合的方式,,首先,,提示詞的排列組合方式可以被定義為一種方法,而方法是可以通過發(fā)明專利進行保護的,,簡單以繪畫類AI舉例,,當我們需要使用提示詞通過繪畫類AI生產(chǎn)作品時,提示詞通常至少會包含需要繪畫的物品,、物品的色調(diào),、整體繪畫的風格,如包含人物肖像,,亦需要人物肖像的特征,,人物的情緒定義等,,對于這么多關(guān)鍵信息,我們采用不同的排列方式將會得到AI生成的不同表達的作品,,例如先體定義總體風格并嵌套色調(diào),、先定義情緒再嵌套肖像特征與先定義色調(diào)、肖像特征最后定義風格和情緒將獲得不同的作品,,這種方式即方法如具有一定的新穎性和創(chuàng)造性,,是可以嘗試申請發(fā)明專利并獲得發(fā)明專利的保護的。當然,,通過發(fā)明專利保護的劣勢也非常明顯,,即一件發(fā)明專利的審查期限至少需要12個月,甚至更久,,對于提示詞規(guī)則的生命周期而言,,保護是否會滯后可能是需要進一步考量問題;其次,,我們來看提示詞的本質(zhì),,即一些具有明確含義的字、詞,、短語或短句(下文我們稱之為“提示詞元素”),,其中明確的含義一般是指沒有歧義,只有準確表達,,讓AI準確領(lǐng)悟提示人的意圖,,才能更有效地創(chuàng)作AI生成物(作品),從這一特性我們可以基本斷言有效且優(yōu)秀的提示詞元素是有限的,,例如可以有效提示肖像的提示詞元素是這幾個,、有效提示情緒的是那幾個、有效提示風格的是這一系列,、有效提示運動狀態(tài)是那一系列,。這樣大家是否想到,或者已經(jīng)有非常多的企業(yè)已經(jīng)在做的一個工作就是收集并匯總各個領(lǐng)域有效且優(yōu)秀的提示詞元素,,并將其分類梳理為數(shù)據(jù)庫,,而“數(shù)據(jù)庫”是我國著作權(quán)法明確保護的作品客體。所以,,即便實際應(yīng)用的某一段提示詞不構(gòu)成著作權(quán)法意義上的作品而不能獲得保護,,但可以考慮對提示詞的分類組合的數(shù)據(jù)庫進行確權(quán)和保護,而其關(guān)鍵點可能在于提示詞的分類即數(shù)據(jù)庫的字段設(shè)置,,具體我們將另外行文分析,。AIGC可以說是一項最接近普通人的AI運用,它使得AI不再那么高不可攀,只要一臺聯(lián)網(wǎng)的終端,,人人都可以通過向AI發(fā)出指令的方式進行創(chuàng)作,,并得到AI創(chuàng)作物(AIGC),。AIGC讓人們體會到了AI的強大,、便捷和效率,即便是在當下生成式AI實際應(yīng)用發(fā)展的初期,,其已經(jīng)能為個人,、企業(yè)解決非常多棘手的、繁雜的問題,,其迅速熱門也就不足為奇,。由此接踵而來的當然是各種法律問題,無論是AI服務(wù)的提供者,、AI服務(wù)的運用者,、AI生成的作品的閱讀者都會想要了解自己在提供服務(wù)、使用服務(wù),、瀏覽作品時應(yīng)當符合的法律規(guī)范,,筆者的系列文章意在通過探討分析我國以及世界相關(guān)法律法規(guī)并結(jié)合自身通過分析得出一些粗淺結(jié)論讓大家更好地了解AI相關(guān)法律問題,并希望能拓寬大家的視野,,為大家在AI領(lǐng)域的運用提供靈感,。下一篇文章,我們將著重探討我國對于生成式AI的態(tài)度以及相關(guān)管理規(guī)定的解讀,,AI生成物如何避免侵權(quán)等問題,。【1】 《大規(guī)模預訓練模型》,《中國計算機學會通訊》2021年5月第5期,,P8【2】 [ 唐蕾.人工智能生成物的著作權(quán)保護比較法研究——以元宇宙背景為視角[J].電子知識產(chǎn)權(quán),2023,No.376(03):81-90.]【1】《大規(guī)模預訓練模型》,,《中國計算機學會通訊》2021年5月第5期【2】《一文讀懂ChatGPT模型原理》,JioNLP團隊,,知乎【3】ChatGPT的工作原理:機器人背后的模型,,36氪,百度作者:趙婧 羅賡 沈琲 編輯:Sharon 點擊圖片查看文章 (www.pharmaip.cn) (www.meddeviceip.com)
|