一項由魯爾大學波鴻分校與馬克斯・普朗克軟件系統研究所進行的研究,深入分析了傳統搜索引擎與生成式人工智能系統在信息來源和信息呈現上的不同。研究團隊對谷歌的自然搜索結果與四個生成式 AI 搜索系統進行了對比,包括谷歌 AI 概述、帶搜索功能的 Gemini2.5Flash、GPT-4o-Search 和啓用搜索工具的 GPT-4o。這項研究涉及超過4600個查詢,涵蓋政治、產品評論和科學等六大主題,揭示了這些系統在處理網絡信息時的多樣性。

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
研究發現,AI 搜索系統能夠從更廣泛和不太知名的網站獲取信息。例如,在 AI 概述中,53% 的引用網站未能出現在谷歌搜索結果的前十名,而27% 甚至沒有進入前100名。這說明用戶可能會看到來自較少審查或不熟悉網站的信息。
在信息來源的引用深度上,GPT-Tool 平均每個答案僅引用0.4個外部來源,主要依賴於其內部數據。而 AI 概述和 Gemini 則每次查詢引用超過8個外部來源,顯示出其信息獲取的豐富性。此外,傳統的谷歌搜索通常限制每次查詢的結果爲十個鏈接,使其信息來源更加集中。
研究還強調,在處理當前事件時,傳統搜索引擎的表現明顯優於 AI 系統。在對100個熱門話題的測試中,AI 概述僅能覆蓋3% 的查詢,而 GPT-4o-Search 覆蓋率爲72%。這顯示出 AI 系統在最新信息更新上的不足,可能導致用戶接收到過時或不準確的信息。
劃重點:
🌐 AI 搜索系統引用的53% 網站未在谷歌前十名中出現,來源更加多樣。
📊 GPT-Tool 平均僅引用0.4個外部來源,主要依賴內部知識。
📰 傳統搜索在當前事件的準確性上明顯優於 AI 搜索系統。
