DeepSeek灰度上线识图新模式
DeepSeek 近期在其网页端和移动应用中悄然启动了“识图模式”的灰度测试,此举标志着该公司在多模态能力布局上迈出了关键一步。
新上线的识图模式并非作为附加功能,而是以独立的一级入口与快速模式、专家模式并列,显示出 DeepSeek 将视觉理解能力视为一项核心竞争力进行重点投入的战略意图。
目前,该功能尚未全面开放,部分用户已能正常体验,而另一些用户虽然可以看到入口,但会收到“识图模式暂不可用,请稍后再试”的提示。从用户界面来看,进入识图模式后,用户将能够在对话框旁边找到用于上传图片的按钮,从而开启与图像的互动。

现阶段的识图模式主要聚焦于图片内容的理解、解读与分析,能够支持视觉问答、图片理解及截图分析等多种场景。这意味着其主要定位为视觉语言模型(VLM),而非集成了图像生成、视频理解或跨模态生成能力的综合性多模态工具。
对于 AI 模型而言,多模态能力的拓展是提升智能水平和应用场景广度的重要途径。DeepSeek 在此方向的探索,尤其是在视觉理解方面的初步成果,预示着未来可能朝着更强大的视觉感知和交互方向发展。当前阶段的 VLM 能力,虽然未涉及生成,但已能满足大量信息提取和分析需求,例如用于内容审核、辅助创作、教育辅助等领域。未来若能融合生成能力,则能进一步释放其创造潜力。

DeepSeek 此次在多模态领域的布局,为激烈的 AI 市场带来了新的观察点。在追求通用人工智能的道路上,不同厂商在技术路径和能力侧重上呈现出多样化趋势。DeepSeek 以其独特的切入点,有望在特定领域形成差异化优势。
此次“识图模式”的推出,虽然仍处于早期测试阶段,但它为 DeepSeek 的 AI 产品线注入了新的活力,也为用户提供了更丰富的交互体验。随着技术的不断成熟和功能的迭代,我们期待 DeepSeek 能在多模态交互领域带来更多惊喜。