Mistral AI は、最新バージョンのドキュメント認識技術「Mistral OCR3」をリリースしました。これはドキュメント処理分野における重要な進歩を示しています。この技術は、さまざまな種類のドキュメントを処理する際、優れた正確性と効率性を示しており、特に表やスキャンされたドキュメント、複雑な表、および手書きの認識において、前バージョンである Mistral OCR2 と比較して全体的なパフォーマンスが74%向上しています。

Mistral OCR3 の設計目的は、多様な種類のドキュメントからテキストと埋め込み画像を抽出し、極めて高い正確性と優れた性能を実現することです。これは Markdown 出力もサポートしており、HTML を基にしたテーブルの再構築も可能で、下流システムがドキュメントの内容と構造をより良く理解するのに役立ちます。市場上の多くの同種製品と比較して、Mistral OCR3 はコンパクトで価格も手頃であり、1,000ページあたりの処理費用は2ドルで、一括APIを使用すると50%の割引が適用され、最終的には1,000ページあたり1ドルになります。
製品の正確性を確保するために、Mistral OCR3 はより挑戦的な内部ベンチマークを導入し、リアルビジネスシナリオでのパフォーマンスに焦点を当てています。前世代のOCRモデルと比較して、この技術は手書き認識、フォーム、スキャンおよび複雑なドキュメントの処理において顕著なアップグレードを施しており、さまざまなドキュメントタイプのニーズに対応しています。

Mistral OCR3 は、高容量のエンタープライズプロセスおよび対話型ドキュメントワークフローに特に適しています。開発者はこの技術を使って、テキストと画像をMarkdown形式で抽出し、請求書、合規用フォームなどのさまざまなドキュメントを自動的に解析し、手書きまたは歴史的なファイルのデジタル化を実現できます。現在、初期の顧客は請求書処理、企業のアーカイブのデジタル化、および技術報告書のテキスト抽出において積極的な成果を収めています。
IDC の研究ディレクターであるティム・ロウ氏は、OCR技術が生成AIとエージェントAIを実現するための重要な基盤であると指摘しています。高精細なテキストと埋め込み画像を効率的に抽出できる組織は、データの価値を解放し、競争優位を得る機会を持つことになります。
ポイント:
📄 Mistral OCR3 の全体的な正確性は前バージョンよりも74%向上し、特に複雑なドキュメント処理において優れています。
💰 この技術は価格が手頃で、1,000ページあたりの処理費用は2ドル、一括APIで使用すると1ドルになります。
🖥️ Mistral OCR3 は、請求書処理、ドキュメント解析、および歴史的なファイルのデジタル化など、さまざまなビジネスシナリオに適しています。
