4月11日,國家網路資訊辦公室(以下簡稱「網信辦」)起草發布了《生成式人工智慧服務管理辦法(徵求意見稿)》,並向社會大眾展開為期一個月的意見徵求。
這份管理辦法(徵求意見稿)共21條,從適用範圍看,既包括了提供生成式人工智慧服務的主體,也包括使用這些服務的組織與個人;管理辦法涵蓋了產生式人工智慧輸出內容的價值導向、服務提供者的訓練原則、隱私權/智慧財產權等各項權利的保護等等。
GPT類生成式自然語言大模型及產品出現後,既讓大眾體驗到了人工智慧的飛躍式進步,也暴露出安全風險,包括產生帶有偏見和歧視性的內容、資料外洩、侵犯隱私、AI造假等問題。全球範圍,各國對人工智慧的監管漸成趨勢。
在中國,《生成式人工智慧服務管理辦法》一旦出台,國內生成式AI的大模型及產品提供者不能再無序亂「卷」了,採用者使用生成式AI時也有了規範圈。
「研發、利用生成式人工智慧產品,面向中華人民共和國境內公眾提供服務的,適用本辦法。
本辦法所稱生成式人工智慧,指基於演算法、模型、規則產生文字、圖片、聲音、影片、程式碼等內容的技術。」
4月11日,網信辦公佈的《生成式人工智慧服務管理辦法(徵求意見稿)》(以下簡稱《辦法》)在第二條中明確了《辦法》的適用主體和「生成式人工智慧」的定義。
從該條內容看,諸如百度、阿里、騰訊、華為等目前已經公開表示有生成式大模型及產品的公司,如果對中國境內用戶提供服務,將在《辦法》的管理範圍內,而使用者使用相關產品和服務,也需要遵守《辦法》的規定。
《辦法》也強調了,國家支持人工智慧演算法、框架等基礎技術的自主創新、推廣應用、國際合作,鼓勵優先採用安全可信的軟體、工具、運算和資料資源。
在這一前提下,《辦法》為生成式人工智慧產品或服務的提供方劃定了“禁區”,包括生成的內容和研發的基本原則。
在內容上,《辦法》要求:利用生成式人工智慧生成的內容應體現社會主義核心價值觀,不得含有顛覆國家政權、推翻社會主義制度,煽動分裂國家、破壞國家統一,宣揚恐怖主義、極端主義,宣揚民族仇恨、民族歧視,暴力、淫穢色情訊息,虛假訊息,以及可能擾亂經濟秩序和社會秩序的內容;利用生成式人工智慧生成的內容應當真實準確,採取措施防止生成虛假資訊.
在研發上,《辦法》要求提供方在演算法設計、訓練資料選擇、模型產生與最佳化、提供服務等過程中,採取措施防止種族、民族、信仰、國別、地理、性別、年齡、職業等歧視。
從這些要求來看,《辦法》基本上涵蓋了市面上的自然語言大模型產品在用戶實操中暴露出來的安全及倫理問題,包括產生歧視性偏見、虛假信息等內容
人類藉由生成式AI產出的問題內容已經層出不窮地出現在網路上。
例如,ChatGPT曾為用戶諮詢「如何入店行竊」時提供過步驟,儘管附上了「入店行竊違法的提示」;它的「角色扮演」功能曾被用戶誘導以DAN (Do Anyting Now)身分回答問題,給的答案裡出現了「爆粗口」的情況;還有人用ChatGPT測試的假消息在國內傳播,成了「闢謠」的內容。
微軟集合進搜素引擎Bing的聊天機器人,被海外媒體人曝光“辱罵用戶”;AI生圖應用Midjourney更是被人利用造出過“教皇穿巴黎世家羽絨服”、“馬斯克與通用汽車CEO約會」的假圖,甚至還有人用它製造了各種不存在的地震歷史和太陽風暴災害等等。
有關教宗(左)與馬斯克的假圖
#針對假訊息、辨別AI生成內容層面,《辦法》要求提供者從源頭上「能夠保資料的真實性、準確性、客觀性、多樣性」;應依照《互聯網資訊服務深度合成管理規定》對生成式的圖片、影片等內容進行識別;而生成式人工智慧產品研發中採用人工標註時,提供者應制定符合本辦法要求,清晰、具體、可操作的標註規則,對標註人員進行必要培訓,抽樣核驗標註內容的正確性。
中國監管為生成式人工智慧的內容設定禁區,某種程度上也是在要求提供大模型及產品的企業把好預訓練和資料的關。
除了對生成內容強調價值導向、社會公德、遵守法律及反歧視外,《辦法》也對生成式人工智慧相關的預訓練及資料來源、個人資訊保護等權益做出要求。
例如,《辦法》要求,提供者應對生成式人工智慧產品的預訓練資料、優化訓練資料來源的合法性負責,不含有侵犯智慧財產權的內容;資料包含個人資訊的,應徵得個人資訊主體同意;對使用者輸入資訊和使用記錄承擔保護義務,不得非法留存能夠判斷出使用者身分的輸入訊息,不得根據使用者輸入資訊和使用情況進行畫像,不得向他人提供使用者輸入資訊。
生成式AI產生的資料侵權問題也確實存在,例如,使用者在使用對話式機器人滿足一些工作需求時,難免會上傳公司的資料,如不注意,很可能造成商業機密的洩露。先前,韓國電子巨頭三星在對ChatGPT提出「限問令」後就表示,內部資料因員工與該應用程式的互動而出現外洩。
《辦法》不僅指向生成式人工智慧產品和服務的提供者,也對產品和服務使用者劃定了原則。
例如,不利用生成內容損害他人形象、名譽及其他合法權益,不進行商業炒作、不正當行銷。
由於《辦法》時根據上位法《中華人民共和國網路安全法》《中華人民共和國資料安全法》《中華人民共和國個人資訊保護法》等法律、行政法規制定,這些法律法規將適用於違反《辦法》的行為,包括侵害智慧財產權、侵害個人資訊等違法行為。
《辦法》共21條,其中有13條明確針對 “提供者”,即利用生成式人工智慧產品提供聊天和文字、圖像、聲音生成等服務的組織和個人。
大眾可透過三條途徑回饋意見
由此可見,《辦法》一旦正式出台,國內做生成式大模型及產品的企業及採用方將須在規則範圍內行事。根據網信辦官網顯示,民眾可透過三個管道提出回饋意見,回饋的截至日期為2023年5月10日。
以上是價值、隱私保護全覆蓋 網信辦擬為生成式AI'立規矩”的詳細內容。更多資訊請關注PHP中文網其他相關文章!