商汤科技进军智能体,全模态基座已就绪
人工智能技术竞争已进入新阶段,从过去侧重于语言理解,转向更强调“智能体”的实际应用能力。商汤科技近日宣布,正全力开发一款原生全模态智能体基座,其核心能力集“理解、生成、行动”旨在统一处理各种信息模态,并与 OpenAI 的 GPT-Image 2 形成直接竞争。
商汤此次推出的智能体基座,标志着人工智能将从以往被动的问答模式,进化为能主动执行任务的形态。该技术有望深度整合多模态信息处理与复杂任务执行逻辑,使 AI 不仅能精准解读用户指令,还能通过生成内容并付诸行动,实现数字世界中的自主交互,从而在各类实际应用中提供更强的实操价值。
这项关键技术的研发目前进展顺畅,商汤科技已规划于 2026 年下半年向市场推出这款具有战略意义的智能体基座产品。
在当前人工智能产业从基础大模型向智能体生态演进的关键时期,商汤科技的这一举措被视为其大模型战略的重要布局。能够有效打通信息理解、内容生成与任务执行之间界限的厂商,将更有可能在未来的智能化生产和企业服务体系中确立领先地位,并有望借此进一步强化其在底层算法和上层应用领域的优势。
作为一款原生全模态智能体基座,该产品预期能够处理文本、图像、音频、视频等多种信息形式,并能够将理解到的信息转化为具体的执行动作。其潜在的应用场景广泛,从复杂的自动化办公流程,到提供高度个性化的客户服务,乃至在科研领域辅助数据分析与实验设计。输入的灵活度与输出的多样化将是衡量其核心竞争力的关键。上手门槛方面,虽然底层技术复杂,但面向开发者和最终用户的应用接口设计,将决定其普及速度。