算法|“深度合成”新規,“元宇宙”關鍵技術迎來監管

算法|“深度合成”新規,“元宇宙”關鍵技術迎來監管

毋庸置疑的是 , 人工智能(AI)、大數據、區塊鏈等技術在短短十幾年內已經深刻的改變了我們的生活方式 , 在這個日益虛實交融的世界里 , 新的事物在不斷被創造 , 并漸漸與舊世代的事物形成更加龐大而復雜的關系網 。
深度合成(Deep Synthesis , 以前曾被稱為Deepfake , 即“深度偽造”)作為AI技術的新應用、新實踐 , 近年來備受關注 。
一方面 , 利用深度合成技術可以自動生成文本、語音、圖像、視頻等各種數字內容 , 已經成為了當前元宇宙發展的關鍵技術;另一方面 , 近年來科技迅猛發展 , 深度合成技術門檻快速降低 , 導致濫用技術的案例頻出 , 引發各類風險 。
因此 , 當前亟待以立法的形式對深度合成技術的應用進行規制 , 尤其是要對深度合成內容的用途、標記、使用范圍以及濫用技術的處罰作出具體規定 , 同時明確責任主體 , 才能真正實現“技術向善” 。
2022年1月28日 , 國家網信辦最新公布了《互聯網信息服務深度合成管理規定(征求意見稿)》(簡稱《深度合成征求意見稿》) , 對作為元宇宙基石的深度合成技術做出了一系列較為明確的規定和指引 。 本文對此文件進行解讀 , 以幫助讀者明晰:深度合成技術怎么用才合規 。
一、深度合成技術及其在元宇宙中的實際應用
從技術上來說 , “深度合成”技術 , 實質上就是利用深度學習算法來實現的 , 其主要使用的兩個技術:自動編碼器和生成對抗網絡(GAN) 。
一個用來進行新數據的生成 , 一個用來對生成數據進行鑒別 , 經過二者無數次“合作” , 最終生成出極具“真實感”的合成數據 。 當前大家耳熟能詳的AI換臉就是利用深度合成所創造的 。
而根據《深度合成征求意見稿》第二條 , 深度合成技術指的是:
利用以深度學習、虛擬現實為代表的生成合成類算法制作文本、圖像、音頻、視頻、虛擬場景等信息的技術 , 包括但不限于:
(1)篇章生成、文本風格轉換、問答對話等對文本內容進行生成或者編輯的技術;
(2)文本轉語音、語音轉換、語音屬性編輯等對語音內容進行生成或者編輯的技術;
(3)音樂生成、場景聲編輯等對非語音內容進行生成或者編輯的技術;
(4)人臉生成、人臉替換、人物屬性編輯、人臉操控、姿態操控等對圖像、視頻內容中人臉等生物特征進行生成或者編輯的技術;
(5)圖像增強、圖像修復等對圖像、視頻內容中非生物特征進行編輯的技術;
(6)三維重建等對虛擬場景進行生成或者編輯的技術 。
按照該定義 , AI語音 , NFT生成藝術、虛擬演唱會、全息人像投影、虛擬人數字人、AR購物等元宇宙的重要組成部分都屬于深度合成技術的具體應用 。 而只要在中華人民共和國境內應用深度合成技術提供互聯網信息服務 , 或為深度合成服務提供技術支持的活動 , 均在《深度合成征求意見稿》的規制范圍內 。
【算法|“深度合成”新規,“元宇宙”關鍵技術迎來監管】隨著“深度合成”技術逐漸成熟并進入商業化應用階段 , 其巨大的經濟價值已經逐漸向世人展露 。 當前 , “深度合成”已經在音樂、影視、綜合娛樂、社交等多個行業的場景中被實際推廣應用 。
例如 , 在電影大片的制作中其應用最為成熟 , 不僅可以通過提升音視頻制作的效率和質量 , 顯著降低影片制作成本 , 還能賦予藝術創作者更大的想象空間 。 甚至深度合成技術還可以使一些已過世的演員進行在影視劇中以虛擬數字人的形態“復活” 。

相關經驗推薦