DeepSeek开放识图模式，多模态理解进入内测

作者 V科技发布时间 2026年05月09日 14:44 浏览量 4 0 评论

国产大模型 DeepSeek 近日正式启动大规模识图模式内测，标志着该模型在多模态交互能力上实现了重大突破。此次升级允许用户通过上传图片，进行更深层次的视觉信息理解与交互，将 DeepSeek 的产品矩阵推向图文并茂的新维度。尽管目前仍处于内测阶段，但识图模式已与“快速模式”、“专家模式”并列，显示出其在 DeepSeek 生态中的核心地位。

与传统的 OCR 功能不同，DeepSeek 的识图模式着重于对图像内容的深度识别和语义分析。在实际测试中，该模式能够理解图片的逻辑结构和情境信息，实现复杂跨媒介的交流。这不仅弥补了 DeepSeek 在多模态能力上的既有短板，也使其在与 GPT-4o 等国际领先模型的竞争中，向前迈进了关键一步。

DeepSeek 在保持其计算能力性价比优势的同时，快速补足多模态交互的短板，反映出国内大模型行业正从文本生成领域，加速向“视觉语言耦合”的全方位感知能力转变。识图功能的推出，有望在自动化办公、工业视觉分析以及复杂图表解读等应用场景中，显著提升其生产力价值，推动国内大模型市场进入多模态能力普及的新阶段。

V科技点评

对于 AI 产品而言，支持识图模式意味着其应用边界的极大拓展。DeepSeek 的这一能力，能够让用户在处理包含大量视觉信息的任务时，如分析设计图纸、解读数据图表、识别商品信息等，获得更直观、高效的交互体验。其输入形式更加灵活，不仅限于文本，还能通过图像进行理解和回应，极大地降低了复杂信息输入的门槛。

DeepSeek 此次在识图模式上的发力，显示出其在追赶行业前沿的决心。通过在多模态领域实现突破，DeepSeek 有望在更广泛的应用场景中展现其技术实力，并为国内大模型生态的发展注入新的活力。

DeepSeek开放识图模式，多模态理解进入内测

暂无评论！成为第一个。

发表回复取消回复

Mixdesk

CREATUS.AI

Powered_by Agency

Jeeva.ai

DeepSeek开放识图模式，多模态理解进入内测

相关资讯

暂无评论！成为第一个。

发表回复 取消回复

发表回复取消回复