騰訊混元などによる初めての古代文字OCR評価基準 Chronicles-OCR の発表

5月18日、騰訊混元（Hunyuan）、SSVデジタル文化ラボラトリーおよびSSVテクノロジーアーキテクチャ部門は、安阳師範大学の甲骨文情報処理重点実験室、中国科学院情報工学研究所、南開大学と共同で、業界初の「七体変化」の完全な進化経路をカバーする中国古文字認識評価基準「Chronicles-OCR」を正式に発表しました。この基準の導入は、三千年前から現代に至る漢字の視覚的分布の変化に直面したマルチモーダル大言語モデル（VLLM）の知覚能力を正確に測定し、デジタル人文科学分野における基本技術の突破を推進することを目的としています。

このデータセットは、専門家による多段階の交差ラベリングによって構成されており、厳密にバランスが取れた高品質な画像が2,800枚含まれています。古くからの字体（甲骨文、金文、篆書）と成熟した字体（隷書、楷書、行書、草書）の特性に応じて、プロジェクトチームは段階的な適応型ラベリング方式を開発し、時代を超えた文字検出、細粒度の古字認識、古文転写、字体分類の4つの核心的なタスクを設け、視覚的知覚と意味的推論の分離評価を実現しました。

28の主要な大規模モデルであるGPT-5、Gemini3.1Pro、Claude Opus4.7などの評価において、この基準は現在の業界におけるマルチモーダル能力の欠点を明らかにしました。古くからの字体では、エンドツーエンドの検出タスクにおいて現代のレイアウトに関する事前知識が不足しているため、主流モデルはすべて失敗しました。細粒度の認識では最高でも27.1％の精度にとどまりました。また、字体分類タスクでは、モデルが載体のテクスチャを識別しようとする傾向があり、微細な筆画を識別することはできませんでした。注目すべきは、実験結果により、推論（Reasoning）モードを有効にすると感知の不確実性が拡大し、結果が悪化することが示されたことです。

今回のChronicles-OCRのオープンソース公開は、トップクラスの商用モデルと古文字の実際の研究ニーズとの間の技術的なギャップを数値化し、学術界と産業界に対してマイクロレベルの知覚最適化の技術的道筋を明確にしました。大規模言語モデルが「文字を読む」ことから「歴史を読む」ことへと進化し、マルチモーダル大規模モデルが長尾の垂直領域を克服し、文化的遺産を継承する上で重要な一歩となることを目指しています。

ビジュアル大モデルが苦戦：初の中国古文字OCR評価基準をオープンソース化

腾讯混元大モデルは故宮博物院などと協力し、漢字「七体の変遷」の進化軌跡を網羅する初の古文字認識ベンチマーク「Chronicles-OCR」を発表。専門家による多層クロスアノテーションで2800枚の画像を含むデータセットは、甲骨文字などのAI認識能力をテストし、亀甲刻みから現代コードへの漢字の完全な進化を理解する人工知能を推進する。....

テンセントがOpenSearch-VLをリリース：オープンソースのマルチモーダル深層検索エージェントのフルセットソリューション

テンセントの混元は、UCLAや香港中文大学などと協力し、マルチモーダル大規模言語モデル（MLLMs）の「受動的理解」から「能動的推論」への進化を促進するため、マルチモーダル検索エージェントをオープンソース化しました。これまで、高品質データ、自動軌跡合成パス、訓練レシピの欠如により、トップエージェントの再現が困難でした。今回のオープンソース化は、この停滞を打破し、コミュニティの発展を目指します。....

20％の労働力に影響！メタの備忘録が暴露した深度的な再編成計画　7000人がAI新市場へ転勤

Metaは5月18日、社内メモで5月20日に全世界の従業員の10%を解雇し、年内にさらなる大規模な人員削減を計画していると発表。同時に管理職を削減しフラットな組織へ移行、AI戦略への全面的な転換を進める。人事責任者のジャネル氏が再編を主導した。....

百度が2026年第1四半期の財務報告を発表：総売上高321億元、AI事業収益比率が初めて52％を超える

百度2026年第1四半期決算によると、総収入321億元、一般業務収入260億元（前年比2%増）。AI業務収入136億元で、一般業務に占める割合が初めて52%を超え、成長の核心エンジンとなった。経営陣は大規模モデルの反復、計算能力配置、商業化経路について議論した。....

騰訊混元などによる初めての古代文字OCR評価基準 Chronicles-OCR の発表

関連推奨

ビジュアル大モデルが苦戦：初の中国古文字OCR評価基準をオープンソース化

テンセントがOpenSearch-VLをリリース：オープンソースのマルチモーダル深層検索エージェントのフルセットソリューション

完全に人工知能に傾く：メタ、世界中で10％の減員を計画し、従業員の抗議を引き起こす

20％の労働力に影響！メタの備忘録が暴露した深度的な再編成計画　7000人がAI新市場へ転勤

百度が2026年第1四半期の財務報告を発表：総売上高321億元、AI事業収益比率が初めて52％を超える

騰訊混元などによる初めての古代文字OCR評価基準 Chronicles-OCR の発表

関連推奨

ビジュアル大モデルが苦戦：初の中国古文字OCR評価基準をオープンソース化

テンセントがOpenSearch-VLをリリース：オープンソースのマルチモーダル深層検索エージェントのフルセットソリューション

完全に人工知能に傾く：メタ、世界中で10％の減員を計画し、従業員の抗議を引き起こす

20％の労働力に影響！メタの備忘録が暴露した深度的な再編成計画 7000人がAI新市場へ転勤

百度が2026年第1四半期の財務報告を発表：総売上高321億元、AI事業収益比率が初めて52％を超える

20％の労働力に影響！メタの備忘録が暴露した深度的な再編成計画　7000人がAI新市場へ転勤