お問い合わせ
AIニュース

Mistral AIが文書AI「OCR 4」を公開 ── 170言語対応・1000ページ4ドルで紙書類をデータ化

この記事の監修者 株式会社デジタルゴリラ

フランスのAIスタートアップMistral AIが2026年6月23日、文書解析モデル「OCR 4」を公開した。PDF・Word・PowerPointなど複数形式に対応し、170言語のテキストを構造付きで抽出できる。

精度・速度・コスト──OCR 4が示した3つの数字

OCR 4は、文書内のテキスト位置を示すバウンディングボックス、見出し・表・数式・署名といったブロック分類、単語単位の信頼度スコアを同時に出力する。従来のOCRが「文字を読む」だけだったのに対し、文書の構造ごとデータ化できる点が特徴だ。

ベンチマーク「OlmOCRBench」で85.20を記録し、競合モデルとの人間評価では72%の勝率を達成した。APIでの利用は1000ページあたり4ドル、バッチ処理なら2ドルに下がる。

“reached equivalent accuracy at roughly 8x lower cost and 17x lower latency”

(筆者意訳:同等の精度で、コストはおよそ8分の1、処理速度はおよそ17倍に向上した)

── Aidan Donohue, Rogo社

中小企業が注目すべき理由──「機密書類を外に出せない」問題を解決する

OCR 4が中小企業にとって特に刺さる点は、自社サーバー上での完結運用に対応していることだ。契約書・人事書類・財務資料といった機密性の高い書類を、外部のクラウドサービスに送信せずに処理できる。「クラウドへのデータ送信はコンプライアンス上難しい」という壁がある企業でも、社内環境のまま導入に踏み切れる。

既存のシステムとの接続も整備されており、Amazon SageMaker(AWSが提供する機械学習の実行基盤)やMicrosoft Foundry(Microsoftのエンタープライズ向けAI開発・運用環境)との連携がすでに提供されている。自社ITインフラにOCR機能を組み込みやすい設計になっており、専任のエンジニアが少ない中小企業でも既存環境を大きく変えずに活用できる可能性がある。


出典: Mistral AI「Mistral OCR 4 : SOTA OCR for Document Intelligence」(2026年6月23日)

株式会社デジタルゴリラ