一項最新的研究揭示了AI搜索引擎在處理新聞信息時存在的嚴重問題。哥倫比亞新聞評論(CJR)的數字新聞中心對八款具備實時搜索功能的AI工具進行了測試,結果令人擔憂:超過60%的新聞查詢得到了不正確的答案。

研究發現,不同AI平臺的錯誤率差異顯著,其中Grok3的錯誤率高達94%,ChatGPT Search也達到了67%。即使是付費版本,如Perplexity Pro和Grok3的高級服務,也更頻繁地給出自信但錯誤的回答。研究人員強調,這些AI模型普遍存在**“自信地錯誤”**的傾向,即在缺乏可靠信息時,不會拒絕回答,而是編造看似合理的錯誤答案。
此外,研究還揭示了AI搜索引擎在引用方面的問題。它們常常指向新聞內容的聯合發佈平臺,而非原始出版商的網站。更令人擔憂的是,部分AI工具還會捏造無效的URL鏈接,導致用戶無法訪問信息來源。例如,Grok3在測試中超過一半的引用鏈接是失效的。
這些問題給新聞出版商帶來了嚴峻挑戰。阻止AI爬蟲可能導致內容完全失去署名,而允許抓取則可能面臨內容被廣泛使用卻無法引流回自身網站的困境。時代雜誌的首席運營官馬克·霍華德對此表達了對透明度和控制權的擔憂。
研究人員指出,鑑於目前約四分之一的美國人已將AI模型作爲傳統搜索引擎的替代品,如此高的錯誤率令人擔憂信息的可靠性。此項研究進一步證實了去年11月發佈的類似報告,該報告也指出了ChatGPT在處理新聞內容時存在的準確性問題。儘管OpenAI和微軟承認收到了研究結果,但並未直接回應具體問題。
劃重點:
⚠️ AI搜索引擎新聞搜索錯誤率驚人,超過六成答案不可靠。
🔗 AI工具引用混亂,常指向轉載平臺或捏造失效鏈接。
🤖 付費AI搜索服務也可能更頻繁地給出錯誤答案。
