一位歷史學家對 Gemini3Pro 進行了嚴苛測試:50份約1萬詞的英文學術手寫樣本,涵蓋多種複雜書寫體與成像條件。結果顯示,Gemini3在字符錯誤率(CER)和詞錯誤率(WER)上實現驚人突破,CER 僅0.56%、WER1.22%,已接近或達到專業人類轉錄水平。

從“看不懂”到“能推理”,AI 跨越認知門檻
傳統大語言模型因“預測式”本質,在非常規拼寫、長 s(ſ)、模糊標點、歷史度量單位等高含混場景中表現疲軟。而 Gemini3不僅識別出未經訓練的複雜手寫字體表格,甚至優於受過專業訓練的學生。在嚴格計分下,前代 Gemini-2.5-Pro 的 CER 爲4%、WER11%;若排除標點與大小寫,降至2%/4%。而 Gemini3直接將錯誤率壓至原模型的1/7至1/9,提升幅度達50%–70%。
不止轉錄:它開始“理解”歷史世界
最震撼的並非低錯誤率,而是 隱含推理能力 的浮現。
面對一處模糊數字,Gemini3自主補全缺失語境,完成跨越 歷史貨幣與重量單位的多步換算,最終得出需對文檔世界進行抽象建模的正確結論——這些符號從未在訓練中被明確定義。

統計模型內部的“自發邏輯”覺醒?
作者驚歎:Gemini3似乎跨越了專家長期認爲“當前架構無法逾越”的界限。
在純統計框架內,感知、記憶與邏輯的自組織結合 正在發生——這是否預示着一種新型隱性推理機制的誕生?AIbase 結語
從“讀不懂古籍”到“能推理歷史邏輯”,Gemini3正在重新定義 AI 在人文學科中的邊界。
未來,歷史學家或許不再是唯一能“聽懂過去聲音”的人。
