最近,普林斯頓大學的研究團隊發佈了一項有趣的研究報告,指出在2024年8月,維基百科上約有4.36% 的新文章包含了顯著的 AI 生成內容。
這個研究由 Creston Brooks、Samuel Eggert 和 Denis Peskoff 三位學者共同完成,他們使用了名爲 GPTZero 和 Binoculars 的工具來檢測這些 AI 生成的內容。
研究表明,與 GPT-3.5發佈前的數據相比,2024年的維基百科文章中 AI 生成的內容明顯增加。在檢測的2909篇英文維基百科文章中,GPTZero 標記了156篇,Binoculars 則標記了96篇,而這兩種工具之間有45篇文章是重疊的。
被標記的文章通常質量較低,引用也較少,而且在維基百科的知識網絡中融入得不夠好。一些文章更是顯得自我推銷,涉及個人或商業推廣,很多時候只附上了膚淺的引用,比如個人的 YouTube 視頻。
在政治內容方面,有八篇文章明顯推動了特定的觀點,涉及一些有爭議的話題,例如有關阿爾巴尼亞歷史的編輯戰爭。此外,部分用戶還利用大型語言模型(LLMs)來撰寫一些小衆主題的內容,包括真菌、美食和體育等,甚至有逐章書籍摘要的內容。
研究還將維基百科的 AI 生成內容與 Reddit 和聯合國新聞稿進行比較,發現 Reddit 上的 AI 生成內容遠低於維基百科,僅佔不到1%。這表明,AI 生成內容在 Reddit 上要麼很少,要麼受到審查,或者難以檢測。而聯合國的 AI 生成新聞稿則顯著增加,從2022年前的不到1% 飆升至2024年的20%。
報告最後強調,隨着生成型 LLMs 的崛起,AI 檢測工具也在不斷髮展。但在不同文本長度、領域和人機整合等不同上下文中評估這些檢測器仍然面臨挑戰。
爲了應對 AI 生成內容的挑戰,個人、教育機構、企業和政府需要積極尋找可靠的方法來驗證人類創作的內容。各國的監管機構也應加強對 AI 生成內容的管理。比如,中國已經開始採取措施,提高互聯網上 AI 生成信息的透明度,發佈了相關的草案規定。而印度也在今年對 AI 相關內容的標記發佈了建議,雖然這一提議曾引發廣泛的爭議和批評。
劃重點:
📊 研究顯示,約4.36% 的維基百科新文章爲 AI 生成內容。
🔍 Reddit 上的 AI 生成內容不到1%,顯示出顯著差異。
🌐 各國正在探索對 AI 生成內容的監管措施和標記要求。