4月29日,習(xí)近平總書記在上海考察時指出,人工智能技術(shù)加速迭代,正迎來爆發(fā)式發(fā)展,上海要總結(jié)好以大模型產(chǎn)業(yè)生態(tài)體系孵化人工智能產(chǎn)業(yè)等成功經(jīng)驗,加大探索力度,力爭在人工智能發(fā)展和治理各方面走在前列,產(chǎn)生示范效應(yīng)。當(dāng)下,培育和建設(shè)大模型產(chǎn)業(yè)生態(tài)、促進(jìn)人工智能發(fā)展至關(guān)重要。
何為大模型產(chǎn)業(yè)生態(tài)
人工智能大模型是指具有大規(guī)模參數(shù)和復(fù)雜計算結(jié)構(gòu)的機(jī)器學(xué)習(xí)模型,通常基于深度神經(jīng)網(wǎng)絡(luò)構(gòu)建,參數(shù)規(guī)模可達(dá)數(shù)十億甚至數(shù)萬億。OpenAI通過GPT系列模型從0到1創(chuàng)新了大模型范式、完成行業(yè)標(biāo)準(zhǔn)定義,DeepSeek則進(jìn)行架構(gòu)創(chuàng)新、知識蒸餾和工程優(yōu)化,大幅降低了模型訓(xùn)練與推理成本,實現(xiàn)從1到N的普惠化突破,使大模型普遍可及性大幅增強(qiáng)。
大模型產(chǎn)業(yè)生態(tài)是指以通用大模型作為核心驅(qū)動技術(shù),由對大模型產(chǎn)業(yè)有重要影響的數(shù)據(jù)、算法、算力等各類要素,政府、企業(yè)、用戶等多元主體,基礎(chǔ)設(shè)施、技術(shù)模型和服務(wù)應(yīng)用等多層級產(chǎn)業(yè)鏈組成復(fù)雜體系,通過基礎(chǔ)模型的研發(fā)推動人工智能商業(yè)化和落地應(yīng)用,實現(xiàn)大模型產(chǎn)業(yè)生態(tài)擴(kuò)展。
大模型產(chǎn)業(yè)生態(tài)的形成既是必要也是必然。
從必要性而言,大模型產(chǎn)業(yè)涵蓋數(shù)據(jù)、算力、算法、模型開發(fā)和落地應(yīng)用多個環(huán)節(jié),一方面,大模型技術(shù)相對復(fù)雜;另一方面,高質(zhì)量的數(shù)據(jù)資源與算力資源供給不足,需要對要素資源和技術(shù)進(jìn)行協(xié)同整合。作為基礎(chǔ)的通用大模型難以直接滿足具體需求,需要結(jié)合場景進(jìn)行精準(zhǔn)適配,適應(yīng)不同應(yīng)用場景需求,因此大模型產(chǎn)業(yè)發(fā)展需要產(chǎn)業(yè)生態(tài)形成以降低研發(fā)成本、提升創(chuàng)新效率。
從必然性而言,大模型產(chǎn)業(yè)高度依賴數(shù)據(jù)、算法、算力資源,三要素之間相互依賴,缺一不可,這種要素的強(qiáng)耦合性決定了大模型產(chǎn)業(yè)生態(tài)化的發(fā)展方式;大模型具有通用屬性,通用技術(shù)的演進(jìn)特征就是接入各行各業(yè)成為普惠性應(yīng)用,多場景的碎片化需求會進(jìn)一步驅(qū)動整個產(chǎn)業(yè)鏈的協(xié)同,開源大模型的發(fā)展趨勢將進(jìn)一步吸引開發(fā)者接入,豐富大模型應(yīng)用生態(tài)。
大模型產(chǎn)業(yè)生態(tài)的發(fā)展趨勢與風(fēng)險
當(dāng)前,我國大模型產(chǎn)業(yè)生態(tài)處于快速發(fā)展與積極構(gòu)建的關(guān)鍵階段。相較于此前適用于特定領(lǐng)域、特定任務(wù)的人工智能,大模型產(chǎn)業(yè)生態(tài)的發(fā)展趨勢聚焦于多模態(tài)融合、人機(jī)交互共生、技術(shù)迭代輕量化、開源生態(tài)構(gòu)建等方向,需重視大模型產(chǎn)業(yè)生態(tài)發(fā)展過程中面臨的諸多法律風(fēng)險。
多模態(tài)融合是大模型產(chǎn)業(yè)生態(tài)的主要發(fā)展方向之一。大模型能夠?qū)崿F(xiàn)普惠應(yīng)用的重要基礎(chǔ)在于大模型能夠處理文本、圖像、語音、視頻等多種數(shù)據(jù)模態(tài),并且能夠進(jìn)行跨模態(tài)推理,顯著提升復(fù)雜場景中的決策能力。然而,來自不同渠道、形式多樣的多模態(tài)數(shù)據(jù)也意味著數(shù)據(jù)安全風(fēng)險的增加。隨著大模型接入各行各業(yè),其訓(xùn)練數(shù)據(jù)易涉及敏感個人信息,數(shù)據(jù)來源是否合法合規(guī)尤為重要,在數(shù)據(jù)的收集、存儲、使用和傳輸過程中,若管理措施不當(dāng),容易發(fā)生數(shù)據(jù)泄露,嚴(yán)重侵犯個人隱私。
開源生態(tài)構(gòu)建是推動大模型產(chǎn)業(yè)生態(tài)發(fā)展的強(qiáng)大動力。一方面,開源模型降低了大模型應(yīng)用門檻,減少了大模型研發(fā)的資金和時間成本,能夠吸引開發(fā)者和企業(yè)參與,加速產(chǎn)業(yè)應(yīng)用并推動技術(shù)普惠。另一方面,開源生態(tài)加速了跨行業(yè)、跨領(lǐng)域的資源共享與應(yīng)用場景創(chuàng)新。但模型代碼公開可能導(dǎo)致模型被濫用,使大模型被用于開發(fā)釣魚軟件、深度偽造工具,進(jìn)行金融詐騙、網(wǎng)絡(luò)謠言傳播等違法違規(guī)活動,不僅會損害用戶和企業(yè)的合法權(quán)益,還可能對社會秩序和國家安全造成嚴(yán)重威脅。同時,當(dāng)前的開源大模型對于算力依賴程度較大,而算力資源主要集中于歐美國家和境外相關(guān)頭部企業(yè),存在管制風(fēng)險。
人機(jī)交互的加強(qiáng)是大模型普惠應(yīng)用的必然趨勢。以能夠像人一樣擁有感知、學(xué)習(xí)和與環(huán)境動態(tài)交互能力的具身智能為例,具有物理形態(tài)的人工智能載體已經(jīng)被廣泛應(yīng)用于交通指揮、智能醫(yī)療、工業(yè)生產(chǎn)、自動駕駛、安全防護(hù)等多個領(lǐng)域,通過與人交互強(qiáng)化自主學(xué)習(xí)能力。因此,人機(jī)交互使大模型具備更強(qiáng)的環(huán)境交互性與高度自主性,行為結(jié)果難以預(yù)期。當(dāng)大模型與人類共同完成任務(wù)時,責(zé)任界定往往較為復(fù)雜。例如,在智能醫(yī)療輔助診斷中,若大模型的診斷建議導(dǎo)致誤診,可能涉及醫(yī)生、醫(yī)院、模型開發(fā)者、數(shù)據(jù)提供者等多主體責(zé)任,具體責(zé)任難以追溯。
大模型產(chǎn)業(yè)生態(tài)需要制度革新
上海在大模型產(chǎn)業(yè)生態(tài)構(gòu)建上形成了一定的示范效應(yīng),其經(jīng)驗核心在于建立“政策引領(lǐng) 生態(tài)協(xié)同 場景驅(qū)動”三位一體的發(fā)展模式。在這一發(fā)展過程中從大模型產(chǎn)業(yè)角度出發(fā),以培育與建設(shè)大模型產(chǎn)業(yè)生態(tài)為目標(biāo),積極應(yīng)對大模型產(chǎn)業(yè)中的重點風(fēng)險,實現(xiàn)??技術(shù)剛性??與制度彈性??的平衡。為此,亟待從大模型產(chǎn)業(yè)發(fā)展的規(guī)律和特征入手,構(gòu)建和完善符合其健康發(fā)展的制度體系和實施方法,以制度革新支撐技術(shù)創(chuàng)新。
在大模型產(chǎn)業(yè)的基礎(chǔ)設(shè)施層,數(shù)據(jù)和算力等資源的豐富程度決定著人工智能大模型發(fā)展的上限,故數(shù)據(jù)與算力等關(guān)鍵資源的合理共享與流動格外重要。對于多模態(tài)數(shù)據(jù)的流通與共享,需在數(shù)據(jù)分類分級的基礎(chǔ)上,根據(jù)《公共數(shù)據(jù)資源登記管理暫行辦法》加快推動公共數(shù)據(jù)資源開放共享,對敏感數(shù)據(jù)采取加密、脫敏和訪問控制等手段,實現(xiàn)數(shù)據(jù)的“可用不可見”,同時加強(qiáng)對數(shù)據(jù)來源的合法性的審查,保障數(shù)據(jù)安全。算力資源上,產(chǎn)業(yè)政策應(yīng)在遵循《反壟斷法》和《公平競爭審查制度實施細(xì)則》等法律法規(guī)的基礎(chǔ)上,通過算力補(bǔ)貼引導(dǎo)企業(yè)合理布局算力資源,降低跨區(qū)域算力調(diào)度成本,避免補(bǔ)貼過度集中在少數(shù)地區(qū)或企業(yè)。
在大模型產(chǎn)業(yè)的技術(shù)模型層,需要支持與規(guī)范模型開源生態(tài)構(gòu)建。首先,開源生態(tài)的建設(shè)以統(tǒng)一的標(biāo)準(zhǔn)為前提,開源生態(tài)構(gòu)建上,產(chǎn)業(yè)政策可通過引導(dǎo)和資金支持,推動行業(yè)協(xié)會、標(biāo)準(zhǔn)化組織等制定與大模型平臺互操作相關(guān)的行業(yè)標(biāo)準(zhǔn)和技術(shù)規(guī)范,提升技術(shù)兼容性和協(xié)同性,以標(biāo)準(zhǔn)統(tǒng)一推動創(chuàng)新與開源。
其次,加強(qiáng)對開源社區(qū)的管理和開源大模型知識產(chǎn)權(quán)保護(hù),對開源社區(qū)管理實施??基金會、企業(yè)、高校等多元主體協(xié)同多元共治,探索分離知識產(chǎn)權(quán)與使用權(quán)的“有限共享”機(jī)制和開源許可證分級管理制度,引導(dǎo)企業(yè)建立覆蓋全生命周期的開源合規(guī)體系。
最后,需要規(guī)范開源相關(guān)的壟斷行為??,禁止企業(yè)濫用市場支配地位限制模型接入或捆綁銷售,對產(chǎn)業(yè)鏈下游應(yīng)用開發(fā)者收取不合理的高價許可費(fèi)或設(shè)置歧視性條款,維護(hù)中小企業(yè)和開發(fā)者參與公平。
在大模型產(chǎn)業(yè)的服務(wù)應(yīng)用層,涉及政府和監(jiān)管機(jī)構(gòu)、相關(guān)企業(yè)、應(yīng)用平臺和用戶等多元主體,培育與建設(shè)大模型產(chǎn)業(yè)生態(tài)需要多主體形成治理合力。針對人機(jī)交互、人機(jī)協(xié)作過程中的侵權(quán)責(zé)任認(rèn)定問題,需建立“資源—責(zé)任”匹配為導(dǎo)向的責(zé)任場景分類模式,基于場景復(fù)雜度與機(jī)器責(zé)任分級規(guī)則匹配差異化義務(wù),強(qiáng)化醫(yī)療、金融等高風(fēng)險場景的責(zé)任,推動人機(jī)責(zé)任的動態(tài)調(diào)整,并適當(dāng)引入保險機(jī)制,提高大模型產(chǎn)業(yè)的抗風(fēng)險能力的同時保障受害者的合法權(quán)益得到及時有效的救濟(jì)。
針對生成內(nèi)容合規(guī)和防范虛假信息,需壓實平臺責(zé)任,對于訓(xùn)練數(shù)據(jù)來源和模型版本迭代應(yīng)記錄存證,確保其可追溯。在模型輸入端可設(shè)置敏感詞庫,防止違法內(nèi)容的生成,在輸出端要根據(jù)《人工智能生成合成內(nèi)容標(biāo)識辦法》等規(guī)定進(jìn)行標(biāo)識。
近年來一直熱議的避風(fēng)港原則,即“通知—刪除”原則,以及合理使用原則,在人工智能時代的適用需要相應(yīng)調(diào)整,但是如何調(diào)整,平臺與平臺之間、平臺對平臺內(nèi)用戶,特別是經(jīng)營者用戶的監(jiān)管義務(wù)和職責(zé)如何確定還需要進(jìn)一步明確,平臺的信息過濾義務(wù)的設(shè)定及邊界在哪里都需要科學(xué)化、精細(xì)化設(shè)計,各類平臺在進(jìn)行數(shù)據(jù)獲取與訓(xùn)練中需要守住哪些底線,使用的邊界如何劃定等都需因應(yīng)調(diào)整。總的原則在于促進(jìn)創(chuàng)新為主線,兜住安全為底線,一定要注意平衡好創(chuàng)新發(fā)展與安全運(yùn)行之間的動態(tài)平衡,既要為技術(shù)創(chuàng)新及場景應(yīng)用,特別是在應(yīng)用中創(chuàng)新留出空間,也要為各類應(yīng)用劃出紅線和底線,為應(yīng)用場景制定好規(guī)則和規(guī)矩。
(陳兵系南開大學(xué)競爭法研究中心主任、法學(xué)院副院長,數(shù)字經(jīng)濟(jì)交叉科學(xué)中心研究員;董思琰系南開大學(xué)競爭法研究中心博士生)
幫企客致力于為您提供最新最全的財經(jīng)資訊,想了解更多行業(yè)動態(tài),歡迎關(guān)注本站。鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。