Mistral AI发布OCR4:支持170种语言,交互更人性化
Mistral AI 发布多语言文档识别新模型 OCR4
法国人工智能初创公司 Mistral AI 近期推出了其最新研发的文档识别模型 OCR4。该模型在多语言处理能力上实现了显著突破,能够支持覆盖10个语族的170种语言,为全球范围内的文档内容识别和处理提供了强有力的技术支持。
在业界权威的 OmniDocBench 测试中,OCR4 模型取得了93.07分的优异成绩。其输出文本的准确性和自然流畅度均获得了高度评价,并且在用户体验评估环节,其表现力超越了包括 GPT5.5Pro 和 Gemini3.1Pro Preview 在内的多款行业内领先模型。

Mistral AI 指出,OCR4 作为一款专为高效处理而设计的模型,不仅能精准提取文档中的文本信息,还集成了边框识别、区域分类以及置信度评分等专业功能。同时,OCR4 充分考虑了下游业务场景的集成需求,支持 RAG 语义分块,并具备智能体基本单元和连接器结构化内容输出的能力,能够有效应对各类复杂的文档智能化工作负载。
OCR4 模型在定价策略上提供了灵活性,其基础 API 服务的价格为每千页4美元,而针对大批量处理的企业用户,还提供高达50% 的价格优惠。对于更为专业的文档人工智能服务,定价为每千页5美元。此类定价方案旨在降低企业用户的应用门槛,从而加速文档自动化处理技术的广泛应用。
Mistral AI OCR4 模型在多语言支持、识别精度以及功能集成方面的表现,使其在文档智能处理领域展现出强大的竞争力,尤其适合需要处理海量跨语言文档的企业及研究机构。该模型通过提供高效、精准且具备成本效益的解决方案,有望推动文档自动化和信息提取技术的进一步发展。