腾讯云发布音视频 AI 品牌 WAND,赋能音视频内容创作
腾讯云音视频发布AI原生底座WAND,赋能Agent视听应用新篇章
在2026AI产业应用大会上,腾讯云音视频正式推出了其AI原生能力底座WAND。这一战略性升级标志着腾讯云音视频从过去提供单一媒体处理功能,转向构建面向AI应用和Agent的原生媒体底层支撑。WAND整合了腾讯云在音视频领域超过20年的技术积累,在底层模型、媒体处理能力以及接入方式上均实现了全面革新,旨在将强大的音视频AI能力以Agent-Native模式开放给整个行业。

WAND的架构设计分为模型引擎、能力层和场景方案三个主要部分。模型引擎部分集成了编解码、增强、擦除、生成、理解以及音频等六大自主研发的媒体专用模型,有效弥补了当前主流生成式大模型在媒体内容生产流程中的功能短板。能力层则对超过60项媒体AI能力进行了重组,依据生成、理解、处理和编码的逻辑划分,并以API、Agent预编排工作流(Agentic Workflow)以及Skills等多种模式提供服务,让Agent能够端到端地自主完成整个媒体处理链路,无需频繁切换工具。

WAND能力架构图
在实际应用场景中,WAND展现出了极高的适配性和效率优势。例如,在电商领域,WAND的生成模型能够针对不同商品品类定制化处理策略,显著降低了图片处理的报错率,并大幅提升了图片的可用性。在短剧和漫剧的创作方面,WAND能够将剧本生成、角色一致性保持等多个复杂环节串联成一条自动化流程,平均生产效率提升高达90%,并且已成功服务国内超过80%的头部漫剧制作平台。其AI增强和无痕擦除技术也凭借卓越的表现,双双荣获了NAB Show 2026年度产品奖的殊荣。
对于赛事直播这类对并发能力和低延迟有着严苛要求的高强度场景,WAND通过其自研模型的协同调度能力,将视频的识别、生成、合成及编码流程整合为全自动化处理。与传统的解决方案相比,这种方式能够节省超过50%的码率,并且已经成功支撑了数千场全球顶级的赛事活动。
作为在音视频领域连续11次蝉联中国及出海市场份额第一的领先者,腾讯云音视频推出WAND这一AI原生底座,意在加速音视频能力的转化,使其成为能够被Agent统一调度、具备生产级工具属性的核心要素,从而全面激发AI Agent时代下视听应用的创新潜力。
WAND作为一款面向Agent的AI原生底座,其核心优势在于通过Agentic Workflow和Skills模式,极大地简化了AI Agent调用和编排复杂音视频处理任务的门槛。对于开发者而言,这意味着无需深入了解底层模型细节,即可通过相对简单的接口调用强大的媒体AI能力,降低了AI应用开发成本,尤其是在内容生成、编辑和增强方面,为AI Agent的创造力提供了坚实的技术支撑。