AI大模型如今是愈發成熟、高效,幾乎能滿足人們的各式各樣的需求。颯姐團隊的朋友們工作之餘也會用用各類AI大模型,體驗一下科技的力量。但在這個過程中,颯姐團隊卻發現,有的AI大模型似乎會把網路上公開的個人資訊收集,甚至可能向使用者輸出這些個人資訊。
那麼問題來了,倘若大模型蒐集網路上公開的個人資訊並回饋給了用戶,這種行為是否違法甚至於構成犯罪呢?颯姐團隊今日文章便為大家分析一下這個問題。
01 公開的個人資料便能隨意使用?
眾所周知,AI大模型的訓練離不開大量資料的投餵,而網路上的公開資料當然是極佳的投餵材料,能夠提供大量資訊和資料供AI大模型訓練使用。而公開的個人資訊自然也在其中。一個問題在於,個人資訊一旦在網路公開,是否就能夠供他人隨意使用,乃至於用於AI訓練以及輸出呢?
對此,《民法典》第一千零三十八條雖然明確指出,“未經自然人同意,不得向他人非法提供其個人信息,但是經過加工無法識別特定個人且不能復原的除外”,但是第一千零三十六條同樣指出,「合理處理該自然人自行公開的或者其他已經合法公開的信息,但是該自然人明確拒絕或者處理該信息侵害其重大利益的除外」的情況下,行為人是不承擔民事責任的。
除此之外,根據《個人資訊保護法》第二十七條「個人資訊處理者可以在合理的範圍內處理個人自行公開或其他已經合法公開的個人資訊;個人明確拒絕的除外。個人資訊處理者處理已公開的個人訊息,對個人權益有重大影響的,應當依照本法規定取得個人同意。處理個人自行公開或其他已經合法公開的個人資訊」的情況下無須取得個人同意。
因此,綜合以上法律規定,針對公開的個人資訊,使用的規則如下:
(1)個人資訊處理者能夠處理個人自行公開或其他已經合法公開的個人資訊;
(2)但前述處理行為必須在合理範圍內;且
(3)不得處理個人明確拒絕處理的個人資訊;且
(4)不得未經個人同意處理會對個人權益造成重大影響的個人資訊。
可見,即便是公開的個人訊息,也不代表AI大模型能夠隨意作為訓練素材。
02 哪些公開個人資訊不能隨意使用?
如前所述,對於個人明確拒絕的公開個人資訊以及未經個人同意會對個人權益造成重大影響的公開個人資訊便是不能隨意使用的個人資訊。實務上,由於後者的範疇難以確定,必須進行個案分析,颯姐團隊在此僅針對個人明確拒絕處理的公開個人資訊進行舉例。我們認為,如下三種情況下的公開個人訊息,AI大模型是不能將其作為訓練材料進行使用的。
其一,所公開網站上的Robots協議明確拒絕抓取的情況。一般而言,網站上的Robots協議可以禁止某些特定主體的爬取功能,如個人資訊所公開網站的Robots協議明確拒絕了爬取,那麼在一定程度上能夠認為公開該資訊的個人不願意其個人資訊被搜尋引擎、AI模型等進行爬取。因此可以被認為是不能隨意使用的情況。
其二,在公開個人資訊的內容中明確聲明不能用於AI模型訓練的情況。對於此種情況,由於個人明確拒絕他人使用其公開資訊進行AI模型訓練,因此應認為該公開個人資訊不能隨意使用。
其三,所公開網站或平台上的使用者協議、聲明、公告等文字明確其網站或平台上的公開個人資訊不得用於AI模型訓練的情況。此時,由於個人資訊主體系在同意該使用者協議、聲明、公告等基礎上公開了其個人訊息,因此,可以認為該使用者協議、聲明、公告等所表達的不得用於AI模型訓練的說明代表了個人的明確拒絕,進而使得該公開個人資訊不得用於AI模型訓練。
03 違法使用公開個人資訊,可能構成什麼犯罪?
在明確了前述公開個人資訊不得隨意使用的基礎上,違法使用此類個人資訊就可能構成相關犯罪。其中,最可能構成的,便是侵犯公民個人資訊罪。
《刑法》第二百五十三條之一規定:
「違反國家有關規定,向他人出售或提供公民個人信息,情節嚴重的,處三年以下有期徒刑或拘役,並處或單處罰金;情節特別嚴重的,處三年以上七年以下有期徒刑,並處罰金。
違反國家有關規定,將在履行職責或提供服務過程中獲得的公民個人信息,出售或提供給他人的,依照前款的規定從重處罰。
竊取或以其他方法非法取得公民個人資訊的,依照第一款的規定處罰。
單位犯前三款罪的,對單位判罰金,並對其直接負責的主管人員和其他直接責任人員,依各該款的規定處罰。 」
根據該規定,違反國家相關規定,向他人出售或提供公民個人資訊的行為和竊取或以其他方法非法獲取公民個人資訊的行為均涉嫌構成侵犯公民個人資訊罪。
而根據《最高人民法院、最高人民檢察院關於辦理侵犯公民個人資訊刑事案件適用法律若干問題的解釋》第四條的規定,「違反國家有關規定,透過購買、收受、交換等方式獲取公民個人資訊,或在履行職責、提供服務過程中收集公民個人資訊的,屬於刑法第二百五十三條之一第三款規定的'以其他方法非法獲取公民個人資訊'。雖然在公開但係個人明確拒絕的情況下,該行為屬於違反國家有關規定,獲取公民個人信息的行為,因此應屬於“以其他方法非法獲取公民個人信息”的情況,進而在滿足相關司法解釋對於“情節嚴重」的要求的基礎上,應認為涉嫌構成侵犯公民個人資訊罪。 」
04 寫在最後
AI大模型訓練是形成好用、高效的大模型的必要過程,因而不可避免地需要大量資料的投餵,但各大企業切不可因小失大,在進行訓練的同時,也要注意各類資料來源的合規,保障自身合規性。
* 本文內容僅代表作者個人觀點,讀者不應以本文作為任何投資依據。在做出任何投資決定之前,您應該尋求獨立財務顧問的建議,以確保您了解風險。差價合約(CFD)是槓桿性產品,有可能導致您損失全部資金。這些產品並不適合所有人,請謹慎投資。查閱詳情