AI大模型怎麼備案?合規要點速查!

肖颯
更新於
Block Tao
coverImg
來源: DepositPhotos

隨著人工智慧技術的快速發展,生成式AI正逐漸滲透到我們的日常生活和各行各業中。從文字創作到藝術設計,從虛擬助理到智慧客服,AI的身影無所不在。然而,科技的創新與應用,離不開法律的規範與引導。為進一步保障與監管AI技術創新,我國推出了《生成式人工智慧服務管理暫行辦法》(以下簡稱《辦法》),為AI技術的合規應用提供了明確的法律架構。


在此之前,我國已經推出了針對深度合成演算法的《網路資訊服務深度合成管理規定》(以下簡稱《深度合成規定》),明確了深度合成服務相關方的義務與主體責任。 《辦法》和《深度合成規定》建構了針對大模型的“雙備案系統”,即“深度合成演算法備案”和“大模型備案”。


今年4月,我國頒布了一批已備案的生成式人工智慧服務訊息,這標誌著對AI服務管理的進一步加強。本文將深入解析《辦法》的核心要點,探討大模型(生成式人工智慧)備案的合規,幫助企業與開發者在享受AI技術紅利的同時,確保每一步都符合法律規範,共同推動人工智慧業界的穩健前行。



01 大模型備案VS演算法備案


在此之前,我們先簡單討論以下大模型備案和演算法備案的異同。根據《深度合成規定》,深度合成技術是指利用深度學習、虛擬實境等生成合成類演算法製作文字、圖像、音訊、視訊、虛擬場景等網路資訊的技術,包括但不限於文字生成、音樂生成、文字轉語音等。而深度合成演算法備案是對服務提供者所開發或擁有的該技術演算法進行備案。同一種演算法只需要備案一次。


《辦法》指出,具有輿論屬性或社會動員能力的深度合成服務提供者,應按照《互聯網資訊服務演算法推薦管理規定》,透過當地的網信部門,履行備案和變更、註銷備案手續。


图片


對於大模型服務提供者來說,因為大部分大模型服務中使用了深度合成技術,完成深度合成演算法的備案一般也需要完成大模型備案;反之則不然,若某項大模型技術使用的是已經備案的演算法或接口,則不需要提供深度合成演算法備案。當然,如果一個大模型服務使用了多種未備案的深度合成演算法,則需要對每個演算法進行備案。



02 備案的生成式AI(大模型)要求


為達到備案標準,服務提供者需要根據《生成式人工智慧服務安全基本要求》(以下簡稱《要求》)提供以下資料:語料安全、模型安全、安全措施,以及以上的安全自我評估。各板塊的重點審查內容如下圖所示。

图片1. 語料安全


語料安全性確保了大模型訓練時所使用的資料合規、安全。語料安全的板塊涵蓋以下內容:


·語料來源安全:對於特定語料來源,提供者在採集前後都應進行安全評估;含違法不良資訊超過5%的語料不應採集或使用,且不應使用違反我國網路安全相關法律法規要求阻斷的資訊作為訓練語料。


 ·語料來源多樣性:應提高語料來源的多樣性,確保每種語言和類型的語料都來自多個來源,並合理搭配境內外來源語料。 ·語料來源可追溯性:使用開源語料時應具有相應的開源授權協議或文件,使用自採語料時應有採集記錄,並且避免採集明確不可採集的語料。


 ·商業語料使用:使用商業語料時,應有法律效力的交易合約或合作協議,並應對交易方或合作方提供的語料、承諾、材料進行審核。 ·語料知識產權保護:應設置知識產權負責人,建立管理策略,對語料中的知識產權侵權風險進行識別,不應使用有侵權問題的語料進行訓練。


 ·語料的個人資訊保護:使用包含個人資訊的語料時,應取得個人資訊主體的授權同意,或滿足其他合法使用條件。 


·安全評估:提供者對語料安全情況進行評估時,應採用人工抽檢、關鍵字、分類模型等方法,確保抽樣合格率達到規定標準。


 ·語料標註安全:應對標註人員進行安全訓練、評估、劃分,並指定標註的規則。同時應對標註語料進行抽檢。


2.模型安全


模型安全是為了確保生成式人工智慧大模型產品在提供服務時所產生的內容的安全、準確、合法,同時保護智慧財產權和使用者隱私。


 ·模型合規:如需基於第三人基礎模型提供服務,應使用已主管機關備案的基礎型。 


·內容安全性:訓練時優先考慮生成內容的安全性,並引導模型產出正向內容。 


·準確度與可靠性:提高生成內容中數據及表達與科學常識及主流認知的符合程度,減少其中的錯誤內容,並提高生成內容對使用者的幫助作用。


3.安全措施


建立全面的安全管理体系,包括合规性、风险控制、透明度、用户控制、未成年人保护、响应机制和系统安全性,以促进生成式人工智能服务的健康发展并保护用户权益。


·模型安全性:使用经备案的模型,并对关键场合,例如金融、医疗信心、基础设施的风险保护措施,和未成年人使用场景实施额外保护。


·服务透明度:公开服务信息、模型算法概要、个人信息用途;显著位置展示,易于用户访问。


·用户输入信息:提供便捷方式让用户关闭信息训练功能;显著告知信息收集状态和关闭选项。


·内容标识:确保图片、视频等内容标识符合国家标准。


·计算系统安全:评估供应链安全,芯片支持硬件安全启动,保障系统安全运行。


·投诉举报机制:提供投诉举报途径,明确处理规则和时限。·服务稳定性:隔离训练与推理环境,防范攻击;定期安全审计,建立备份和恢复策略。



03寫在最後


此外,《要求》也提出了一些其他條件,包括但不限於:


· 關鍵字庫量不少於10,000個,且具代表性,每週最好至少依照網路需要更新一次詞庫。


· 建立完整的生成內容測驗題庫,總規模不少於20000題,且具代表性。


· 建立完整的拒答測驗題庫,包含應拒答題庫和非拒答題庫各500題等等。


隨著《生成式人工智慧服務管理暫行辦法》的實施,大模型備案所涉及一系列相對複雜的流程與合規問題,對許多產業內的個體經營者提出了新領域的挑戰。合規不僅是企業與開發者的責任,更是推動整個產業健康有序發展的關鍵。在享受AI技術帶來的便利和紅利的同時,我們必須時刻保持警醒,確保每一步操作都在法律的框架之內。最後,如各位老友有任何AI領域的法律及合規問題,也隨時歡迎來與颯姐共同探討!


* 本文內容僅代表作者個人觀點,讀者不應以本文作為任何投資依據。在做出任何投資決定之前,您應該尋求獨立財務顧問的建議,以確保您了解風險。差價合約(CFD)是槓桿性產品,有可能導致您損失全部資金。這些產品並不適合所有人,請謹慎投資。查閱詳情


goTop
quote
這篇文章有幫到您嗎?
相關文章
placeholder
美國大選對中國影響幾何?高盛看漲A股,人民幣匯率難守穩?當前距離美國2024年大選日不到一週的時間,除了川普交易外,中國市場投資人應該關注哪些資產的波動?
作者  Esteban Ma
11 小時前
當前距離美國2024年大選日不到一週的時間,除了川普交易外,中國市場投資人應該關注哪些資產的波動?
placeholder
中國製造業PMI重回擴張區間 近八成上市公司Q3實現盈利 AH股10月收官日齊升Investing.com-周四(31日),10月收官日,A股、港股齊升, A股超3500股上升。隨著一攬子增量政策落地,國經濟景氣水準繼續回升向好。
作者  Investing.com
13 小時前
Investing.com-周四(31日),10月收官日,A股、港股齊升, A股超3500股上升。隨著一攬子增量政策落地,國經濟景氣水準繼續回升向好。
placeholder
10月收官日,上證指數升約0.4%,深成指連續兩個月上升,兩市成交額重返兩萬億Investing.com –周四,10月31日,10月收官日,A股市場全天震盪上行,滬指3300點遇阻橫盤,中證1000指數領升,深成指連續兩個月上升,本月升幅達0.58%。
作者  Investing.com
13 小時前
Investing.com –周四,10月31日,10月收官日,A股市場全天震盪上行,滬指3300點遇阻橫盤,中證1000指數領升,深成指連續兩個月上升,本月升幅達0.58%。
placeholder
京東方:需求綿軟無力,再等一輪週期?京東方2024 年三季度實現營收 503 億元,同比增長 8.6%; 第三季度毛利率 17.4%,同比提升 2.6pct。收入和毛利率的增長,主要是受面板價格同比提升的帶動。結合面板市場價格的情況,細看公司本季度業績增長中,出貨量和麪板價格都有個位數的小幅增長。
作者  海豚投研
17 小時前
京東方2024 年三季度實現營收 503 億元,同比增長 8.6%; 第三季度毛利率 17.4%,同比提升 2.6pct。收入和毛利率的增長,主要是受面板價格同比提升的帶動。結合面板市場價格的情況,細看公司本季度業績增長中,出貨量和麪板價格都有個位數的小幅增長。
placeholder
“越跌越貴”,中國中免還有沒有底?10月30日晚,$中國中免(601888.SH) $中國中免(01880.HK) 正式公佈了 2024 年 1 季度財報。
作者  海豚投研
22 小時前
10月30日晚,$中國中免(601888.SH) $中國中免(01880.HK) 正式公佈了 2024 年 1 季度財報。