騰訊混元等聯合發佈首個古文字OCR評測基準 Chronicles-OCR

5月18日，騰訊混元、SSV數字文化實驗室及SSV技術架構部聯合安陽師範學院甲骨文信息處理重點實驗室、中科院信工所、南開大學，正式發佈了業界首個覆蓋“七體之變”完整演化軌跡的中國古文字識別評測基準Chronicles-OCR。該基準的推出，旨在精準衡量多模態大語言模型（VLLM）在面對橫跨三千年的漢字視覺分佈漂移時的感知能力，推動數字人文領域的底層技術突破。

該數據集由領域專家多層級交叉標註，包含2，800張嚴格平衡的高質量圖像。針對古早字體（甲骨、金文、篆書）與成熟字體(隸、楷、行、草)的特性，項目組設計了階段自適應標註範式，並設立跨時代字符檢測、細粒度古字識別、古文轉寫和字體分類四大核心任務，實現了視覺感知與語義推理的解耦評測。

在對GPT-5、Gemini3.1Pro、Claude Opus4.7等28個主流大模型的評測中，基準揭示了當前行業多模態能力的短板:在古早字體上，端到端檢測任務由於缺乏現代版式先驗而導致主流模型全軍覆沒;在細粒度識別中，最高準確率僅爲27.1%;而在字體分類任務中，模型傾向於識別載體紋理而非微觀筆畫。值得注意的是，實驗表明開啓推理（Reasoning）模式反而會放大感知不確定性，導致表現下降。

此次 Chronicles-OCR 的開源發佈，不僅量化了頂尖商用模型與古文字實際研究需求之間的技術鴻溝，也爲學術界和工業界明確了微觀感知優化的技術路徑。讓大模型從“識字”走向“讀史”，將成爲多模態大模型攻克長尾垂直場景、傳承文化遺產的關鍵一步。

視覺大模型遭遇滑鐵盧：首箇中國古文字OCR評測基準開源

騰訊混元大模型聯合故宮博物院等機構推出“Chronicles-OCR”，這是業界首個覆蓋漢字“七體之變”演化軌跡的古文字感知評測基準。數據集由專家多層交叉標註，包含2800張圖像，旨在測試AI對甲骨文等古文字的識別能力，推動人工智能理解漢字從龜甲刻痕到現代代碼的完整演變。

騰訊發佈OpenSearch-VL：開源多模態深度搜索 agent 的“全家桶”方案

騰訊混元聯合UCLA、港中文等機構，針對多模態大語言模型（MLLMs）從“被動理解”向“主動推理”進化的需求，開源了多模態搜索智能體。此前，高質量數據、自動化軌跡合成路徑及訓練配方的缺失，導致頂尖智能體難以復現。此次開源旨在打破僵局，推動社區發展。

DeepSeek V4下週發佈:原生支持影音圖文生成，適配國產算力

深度求索將於下週發佈多模態大模型V4，原生支持圖像、視頻與文本生成，旨在填補國內高性能低成本開源多模態模型市場空白。這是繼1月發佈R1推理模型後的首次重大更新。發佈初期將提供簡要技術說明，一個月後公開詳細工程報告。V4模型已與華爲、寒武紀完成底層生態合作。

DeepSeek V4 發佈在即！全新多模態模型讓 AI 生成更智能

深度求索將於下週推出多模態大模型DeepSeek V4，原生支持圖像、視頻和文本生成。這是繼今年1月發佈R1推理模型後的首次重大更新，旨在滿足國內對低成本開源模型的需求，推動AI發展。同時將發佈簡要技術說明，詳細版本預計一個月後推出。

騰訊混元等聯合發佈首個古文字OCR評測基準 Chronicles-OCR

相關推薦

字節跳動聯合港科大發布MMProLong：長文檔LMM訓練問答對效率遠超OCR轉錄

視覺大模型遭遇滑鐵盧：首箇中國古文字OCR評測基準開源

騰訊發佈OpenSearch-VL：開源多模態深度搜索 agent 的“全家桶”方案

DeepSeek V4下週發佈:原生支持影音圖文生成，適配國產算力

DeepSeek V4 發佈在即！全新多模態模型讓 AI 生成更智能