古代ローマ時代には、政治的な落書きから愛の詩まで、商業記録や記念碑の銘文まで、あらゆる場所に銘文が存在していました。これらの文字は現代の歴史家にとって豊かな生活の場面と歴史的背景を提供しています。しかし、これらの銘文は破損したり、褪色したり、意図的に破壊されたりしているため、読み解くのが困難です。

十分な文脈情報がないため、これらのテキストの復元や鑑定、年代の特定はほぼ不可能な作業でした。そのため、グーグルのディープラーニングチームは「Aeneas」モデルをリリースしました。これは、古代の銘文に対して文脈を解釈するための最初の人工知能ツールです。

image.png

Aeneasの登場は、歴史研究において大きな進歩をもたらしました。伝統的に歴史家は自身の専門知識とリソースを頼りに、いわゆる「平行テキスト」と呼ばれるテキスト間の類似性を探してきました。一方で、Aeneasは数千ものラテン語の銘文を処理し、このプロセスを大幅に加速します。数秒で関連するテキストと文脈的な類似例を提供することで、歴史家がより深い解釈と研究を行うことを支援します。

このモデルはラテン語に限らず、他の古代言語や文字、たとえばパピルス文や通貨などにも拡張可能であり、歴史研究の可能性をさらに豊かにしています。Aeneasのマルチモーダル入力機能により、テキストと画像情報を同時に処理できるため、銘文の地理的起源の判断が向上します。このツールの先進性は、長さが不明なテキストの欠損部分の回復や、歴史的テキストの復元および予測において新しい基準を設けている点に現れています。

このモデルを訓練するために、研究チームはローマ銘文データベースやハイデルベルク銘文データベースなどの複数の歴史データベースからのデータを統合し、176,000を超える古代ローマの銘文を含むラテン語銘文データセットを作成しました。こうした方法により、Aeneasは銘文の識別と分類を効果的に行い、歴史家の研究に強力なサポートを提供しています。

評価では、23人の歴史家がAeneasを使用して銘文の復元、鑑定、年代の特定について研究を行いました。その結果、歴史家がAeneasが提供する文脈情報とモデルの予測を組み合わせた場合、最も良い研究成果を得ることができました。多くの参加者は、Aeneasが彼らの作業フローを高速化し、複雑な銘文作業への自信を高めたと述べました。

プロジェクト: https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/

ポイント:

🔍 AeneasモデルはグーグルDeepMindによってリリースされ、歴史家が古代のテキストを理解するのを支援することを目的としています。

🗣️ このモデルは古代のテキストの類似性を分析し、テキストの空白を埋め、歴史研究者の負担を軽減することができます。

📜 Aeneasはテキストを「歴史的指紋」に変換し、歴史家が広範囲な文脈の中で銘文を解釈するのを支援します。