最近,來自斯坦福大學等機構的研究者,將數千篇Nature、ICLR等頂會文章,輸入GPT-4生成評審意見,再與人類審稿人意見比較。結果顯示,GPT-4審稿意見與人類一致度超過50%,對82%作者來說也很有幫助。研究還發現,相比人類審稿人,GPT-4更關注論文的影響因子,而不太在意補充消融實驗等細節。用戶普遍認爲GPT-4生成的審稿反饋,可以提高評審準確性,降低人力成本。本研究表明,利用LLM輔助學術論文審稿,是可行的。