法國人工智能初創企業Mistral AI於本月 23 日正式推出最新文檔內容識別模型OCR 4,在光學字符識別領域投下一枚重磅炸彈。這款小型聚焦模型支持橫跨 10 個語族的多達 170 種語言,在權威基準測試OmniDocBench中斬獲93. 07 分,輸出質量相較GPT 5.5 Pro、Gemini 3.1 Pro Preview等競爭對手更受人類評審青睞。

image.png

小型但全面,覆蓋多場景下游任務

OCR4 的定位並非追求參數規模,而是一個專精於文檔識別的高效模型。它在輸出識別文本的同時還能提供邊框定位、區域分類及置信度評分,可廣泛支持RAG語義分塊、智能體結構化基本單元、連接器結構化內容等多種下游工作負載。

定價方面,OCR4 基礎API調用爲每千頁 4 美元,若採用批處理方式可享受50%的折扣;而文檔人工智能定價則爲每千頁 5 美元。

Mistral AI作爲歐洲AI領域最具代表性的初創公司之一,此前已憑藉開源與閉源並行的模型策略在全球市場嶄露頭角。此次推出OCR 4,將公司能力從通用大語言模型進一步延伸至文檔智能處理這一垂直賽道,直接與OpenAI、Google等巨頭在基礎工具層展開競爭。