近十年科學論文分析顯示,研究人員發現人工智能模型濫用了一些 “風格” 詞彙,而這些詞彙在幾年前還很少被使用。
在一項尚未經同行評審的新研究中,研究人員採用了一種新穎的方法,類似於流行病學,通過分析生物醫學論文中的 “多餘詞彙使用”,來揭示大型語言模型往往濫用某些詞彙的情況。研究結果爲人工智能在學術界的影響提供了有趣的見解,表明至少有10% 的摘要是在2024年使用了大型語言模型進行處理。
圖源備註:圖片由AI生成,圖片授權服務商Midjourney
這項研究是對2010年至2024年間 PubMed 上發佈的1400萬篇生物醫學摘要的廣泛分析。研究人員以2023年之前發表的論文爲基準,對比了在 ChatGPT 等大型語言模型廣泛商用時發表的論文。他們發現,一些曾被認爲 “不常見” 的詞彙,如 “深入”,現在使用的頻率比過去增加了25倍,而其他詞彙,如 “展示” 和 “強調”,則出現了類似的增加。然而,一些 “常見” 詞彙也有所增加:像 “潛在”、“發現” 和 “關鍵” 等詞彙的使用頻率增加了最多4%。
研究人員指出,這種顯著的增加在沒有一些緊迫的全球事件的解釋下基本上是前所未有的。他們發現,在2013年至2023年間的多餘詞彙中,出現了像 “埃博拉”、“冠狀病毒” 和 “封鎖” 等與現實事件緊密相關的名詞。然而,在2024年的多餘詞彙中,幾乎全部是 “風格” 詞彙。從數量上看,2024年的280個多餘 “風格” 詞彙中,三分之二是動詞,約五分之一是形容詞。
根據這些多餘風格詞彙作爲 ChatGPT 使用的 “標記”,研究人員估計,如中國、韓國和臺灣等非英語國家發表的約15% 的論文現在是由人工智能處理的,而在英語爲母語的國家如英國,這一比例爲3%。因此,大型語言模型可能是非母語使用者在一個英語主導的領域取得成功的有效工具。
劃重點:
🔍 通過分析生物醫學論文,研究人員發現人工智能模型濫用了一些 “風格” 詞彙,這些詞彙在幾年前還很少被使用。
🔍 大型語言模型的廣泛商用導致了一些詞彙的使用頻率顯著增加,表明人工智能對學術界的影響可能是前所未有的。
🔍 在非英語國家發表的論文中,由人工智能處理的論文比例高達約15%,顯示大型語言模型可能是非母語使用者在英語主導領域取得成功的有效工具。