當AI取代搜尋引擎，增效還是風險？

肖颯

更新於 2024-5-7 24:25

審核人

Block Tao

5月3日，在海外著名技術社區Hacker News中有用戶發帖指出：一個名為“search.chatgpt.com”的域名已經被創建並通過了安全證書，這一消息又一次引發了行業內對於AI搜尋引擎的各種猜想。

自從ChatGPT首次亮相以來，業界就一直對OpenAI是否會推出搜尋引擎一事存在著眾說紛紜的猜想，而隨著越來越多的蛛絲馬蹟開始為這些猜想勾勒出具體的輪廓，一項基於AIGC技術的全新搜索科技似乎已經呼之欲出，並將顛覆性地改變人們對於搜尋引擎的傳統認知。

01 AI會如何改變搜尋引擎？

“AI技術將為現有的資訊檢索方式帶來深度的變革”，對於這一觀點，業內幾乎已經達成了共識。在2023年由高盛集團和SV Angel在舊金山舉辦的AI Forward 2023活動上，比爾蓋茲直言不諱地表示「頂級人工智慧終將顛覆搜尋引擎、生產力軟體和線上購物網站的應用，並最終在IT技術競賽中大獲全勝」。

實際上，如果單從應用的層面來看，對話式的人工智慧大語言模型已經在某種程度上滿足了傳統搜尋引擎的全部使用者需求，且其在使用者互動等方面體現出的優勢，更是大有將搜尋引擎「取而代之」的趨勢。在同樣接取網路的前提下，具備深度學習能力的AI的確突破了許多傳統搜尋引擎的技術桎梏：

其一，是為使用者提供的更為精準且具體的檢索結果。通常情況下，限於搜尋引擎的資料抓取邏輯，採用相同關鍵字進行檢索的結果是近乎完全一致的，使用者很難取得完全符合自身搜尋習慣的客製化結果。實際上，當我們利用搜尋引擎進行資訊檢索時，對於有用資訊的最終篩選是需要主動依靠人力進行的。而生成式AI則可以根據使用者的需求和習慣，透過資訊的總結呈現出更準確的結論性成果，這將大幅優化使用者的搜尋體驗。

其二，是對於用戶資訊搜尋效率的提升。傳統搜尋引擎的機制通常是將用戶提供的關鍵字進行拆分，並針對其中有價值的資訊進行抓取，這導致用戶輸入檢索條件的文本長短與關鍵字精確度將很大程度影響獲取結果的效率。而AIGC在文字處理上的優勢則避免了這一弊端，AI在「理解」的基礎上尋找用戶所需要的信息，並在長文本的處理上具有先天性的優勢，且透過一段時間的數據投餵，AI的檢索效率也會隨著訓練量的增加而獲得進一步的提升。

其三，是對使用者互動方式的改變。傳統搜尋引擎與使用者的互動方式大多仍限於文字或圖像等較為單一的要素，而AIGC本身可透過複數大模型的訓練整合文字、圖像，甚至影音等複雜媒介，如Google推出的AI搜尋引擎SGE之類相關領域的先行者，就已經開始嘗試在互動方式上做出改變。在未來，AI主導的搜尋方式即便仍採取對話式的形式，其互動端的複合程度也將獲得極大的提升，並與使用者的應用需求深度融合。

02 更加自動 = 更多風險？

以AI取代傳統搜尋引擎對相關產業而言將會是一場“革命”，其中的利弊或許一時還無法清晰辯駁，但上述的諸多優勢背後，亦隱藏著不可小覷的風險。撇開AIGC本身可能存在的資料侵權和資訊偽造等老生常談的問題，以搜尋引擎的使用邏輯應用AI將不可避免地面臨自動化決策所帶來的影響。

如上文所述，AI為用戶提供更為精準且高效的檢索服務的基礎是其對於用戶檢索系統的“深度學習”，而從另一個角度上看，這即意味著用戶想要獲得上述“貼心服務”，就需要同意將自身的搜尋資料用於AI的訓練。誠然，自動化決策賦予了相關應用“自我思考的能力”，是促進AI及大數據等信息技術聯動，降低信息處理成本的同時提高決策效率的必要基礎，但自動化決策的“自我意識”及衍生而來的「演算法黑盒子」等問題也為資料和個人資訊的安全帶來了巨大的風險。

首當其衝的即最為人們所熟知的「資訊繭房」所帶來的綜合性風險。「資訊繭房」最早由哈佛大學法學院桑斯坦教授提出，意指公眾在海量資訊傳播中，因非對資訊存有全方位需求，而只關注自己選擇的或能使自己愉悅的訊息，長此以往，將自己束縛在如蠶織就的訊息「繭房」中的現象。

搜尋引擎本身在應用中的「問答」屬性已成為促成現代社會「資訊繭房」形成的主要誘因之一，而自動化演算法在生成式AI中的進一步的應用更可能引發「迴聲室效應」和「同質化效應」。換言之，在使用者透過投餵搜尋資料而獲得AI客製化服務的過程中，AI的學習本身就是對「繭房」的不斷加強。

其次，用戶在搜尋過程中無意間透露的用戶資料與零散的個人資訊，也將面臨資料外洩帶來的風險。雖然嚴格意義上講，使用搜尋引擎並非對使用者個人資訊的收集階段；使用者在搜尋過程中所透露的檢索內容、習慣等碎片化的個人資訊也不具有非常清晰的可識別性。但經過深度學習訓練的AI多具備預測功能，透過演算法的預測與推斷，AI很容易完成對特定使用者的畫像，並產生具有辨識性的個人資訊。

如美國研究者曾對「Facebook Likes」58,000名志工提供的準確率高達80%-90%的個人資訊，如性取向、種族、智力狀況、宗教及政治觀點、性格特質、幸福指數、成癮使用、父母離異、年齡和性別資訊進行數學建模，自動化演算法在未獲取志願者其他任何資訊和個性特徵的情況下，可以相當準確地預測出該Facebook用戶是否為同性戀者。這些在使用過程中產生的個人資訊亦面臨洩漏的風險。

此外，目前自動化決策所存在的演算法歧視問題，亦有可能在AI搜尋的過程中遭到擴大。自動化演算法帶來的歧視風險通常來自兩個方面：其一是設計者本身將存在的偏見以替代變數的形式編入了演算法程式中；其二則是資料收集的非準確性導致演算法出現了誤判。而在AI自主學習的過程中，資料的取得與處理皆是自動進行的，這意味著上述兩個面向的風險都陷入了「演算法黑箱」中的不可控領域。

因而，AI在提供降本增效的「貼心」搜尋服務的同時，實際上也迫使其使用者和設計者將一把不得不接受的雙刃劍牢牢攥在了手中。

03 AI搜尋情境下使用者對自動化決策的拒絕權

基於自動化決策可能引發的上述風險，當前，世界各國在相關立法中均對其設定了一定的限制，如歐盟《一般資料保護條例》(General Data Protection Regulation, 以下簡稱GDPR)第22條，與對其進行了學習的我國《個人資訊保護法》(以下簡稱《個保法》)第24條第3款，就都賦予了個人資訊主體演算法解釋權和自動化決策拒絕權。因而，在未來AI搜尋取代傳統搜尋引擎的大趨勢下，使用者對自動化決策的拒絕權將成為規避相關風險的重要權利。

當然，我國《個保法》對相關權利的規定仍存在「律性質不明、概念內涵不清、利益關係失衡、程序性救濟手段缺失」等有待解決的規範性法問題，[3]亟待立法機關及司法實務進一步解釋和明確。對此，一種可行的思路即通過參考歐盟《人工智慧法案》的分級規則，對用於資訊檢索等強自動化決策的AI演算法根據“不可接受的風險”“高風險”“有限風險”以及“最小風險」等四個等級進行分級，並依據不同等級的風險賦予使用者相應的拒絕權。透過AI自動化決策的合理定級，確定風險預防策略，以便更好地保護個人資訊主體的相關權益。

04 寫在最後

誠然，對於新科技的促進與所涉權益的保護之間存在著某種天然的矛盾。但在法律的視野下，二者應當亦存在可探索的平衡點。科技的發展不應為權益保護所掣肘，反之也不能犧牲主體的權益來為技術鳴鑼開道。自動化決策拒絕權的明確只是應對風險諸多思路的其中一種，在技術變革到來之前，如何以更多樣化的保護手段避免合法權益遭受侵害，如何打開更加多元的AI法律治理格局，將會是科技界與法學界共同探索的深刻議題。

* 本文內容僅代表作者個人觀點，讀者不應以本文作為任何投資依據。在做出任何投資決定之前，您應該尋求獨立財務顧問的建議，以確保您了解風險。差價合約（CFD）是槓桿性產品，有可能導致您損失全部資金。這些產品並不適合所有人，請謹慎投資。查閱詳情

這篇文章有幫到您嗎？

比特幣詐騙有哪些？投資虛擬貨幣如果被騙了，應該怎麼辦？投資比特幣安全嗎？加密貨幣交易所詐騙手法有哪些？投資虛擬貨幣如果被騙了，應該怎麼辦？

作者 Kuma Hsiung

投資比特幣安全嗎？加密貨幣交易所詐騙手法有哪些？投資虛擬貨幣如果被騙了，應該怎麼辦？

比特幣入門：什麽是比特幣？如何免費獲得BTC？我們一起來系統地瞭解『比特幣』，包括它是什麽？如何產生？以及如何免費獲取等

作者 Block Tao

我們一起來系統地瞭解『比特幣』，包括它是什麽？如何產生？以及如何免費獲取等

台灣在哪購買比特幣最好？Top3虛擬貨幣交易所排名及推薦比較虛擬貨幣交易所合法性、安全性、流動性、手續費、支援幣種等

作者 Block Tao

比較虛擬貨幣交易所合法性、安全性、流動性、手續費、支援幣種等

比特幣價格走勢有哪些規律？2024及未來趨勢如何？比特幣價格會漲嗎？比特幣價格有什麼走勢規律、未來趨勢及如何投資比特幣