谷歌 Gemini 产品更新与最新进展
Google I/O 2026 大会于 5 月 20 日凌晨拉开帷幕,CEO Sundar Pichai 在开幕演讲中揭示了围绕其核心 AI 模型 Gemini 的一系列重大产品更新。此次发布会不仅展示了 Gemini 在多模态处理和智能体能力上的飞跃,更预示着 AI 将更深度地融入用户日常的数字生活和工作流程。
Gemini Omni 系列:视频内容创作的新纪元
此次发布会的重头戏之一是 Gemini Omni 系列视频生成与编辑专用模型的正式上线,首款模型为 Gemini Omni Flash。这一系列模型的最大亮点在于其强大的多模态输入支持,能够以图像、文本、视频或音频作为参考进行生成。更重要的是,用户可以通过自然语言进行多轮次、精细化的视频编辑,并且模型能够智能维持角色一致性、物理逻辑和场景的连续性。结合 Gemini 模型对现实世界的理解,Omni 系列能够生成更符合物理规律(如重力、动能、流体动力学)的视频内容。Gemini Omni Flash 已于即日起向全球 Google AI Plus、Pro 和 Ultra 订阅用户在 Gemini 应用及 Google Flow 中开放,本周内将登陆 YouTube Shorts 和 YouTube Create 应用,未来几周还将通过 API 面向开发者和企业客户提供服务。

Gemini 3.5 Flash:智能体与编程任务的效率革新
面向智能体和编程任务,Gemini 3.5 系列的首个模型 Gemini 3.5 Flash 也宣告上线。该模型已全量部署于 Gemini 应用、Google Search 的 AI Mode、Google Antigravity 及 Gemini API 等平台。在多项行业基准测试中,Gemini 3.5 Flash 均取得了亮眼的成绩,例如在 Terminal-Bench 2.1 上得分 76.2%,GDPval-AA 为 1656 Elo。其突出的优势在于高达前沿模型 4 倍的输出 Token 速度,以及支持在新版 Antigravity harness 中以协作式子智能体的方式执行复杂的多步骤工作流和编程任务。Gemini 3.5 Flash 已成为 Gemini 应用和 Google 搜索 AI 模式的默认模型。Google 还透露,基于 Frontier Safety Framework 开发的 Gemini 3.5 系列在网络安全和 CBRN 防护方面得到了强化,而 Gemini 3.5 Pro 模型也在内部测试中,预计下月推出。
Gemini 应用全面升级:个性化与全天候智能助手
Gemini 应用本身也迎来了一系列革新,除了集成 Gemini 3.5 Flash 和 Gemini Omni 视频模型,还引入了全新的 Neural Expressive 设计语言。用户将体验到个性化的“每日摘要”(Daily Brief),该功能在获得授权后可连接 Gmail 和日历,自动整理紧急邮件、日程安排和待办事项,并根据用户目标优先级推荐下一步行动。此外,面向任务执行的全天候个人 AI 代理 Gemini Spark 也同步登场。Gemini Spark 基于 Gemini 3.5 和 Antigravity harness,能够与 Gmail、Docs、Slides 等 Workspace 工具无缝协作,并已初步支持 Canva、OpenTable 和 Instacart 等第三方服务,未来还将支持自定义子代理和本地浏览器集成。Daily Brief 已开始面向美国地区的 Google AI 付费订阅用户推送,Gemini Spark 本周将面向部分可信测试者开放,并计划下周在美国地区的 Google AI Ultra 用户中进行测试。Gemini macOS 客户端的 Spark 功能和新语音功能预计于今年夏季上线。

Google 搜索智能化:信息获取的交互新模式
Google 搜索服务也迎来了深度 AI 整合。全新的智能搜索框能够根据用户的搜索关键词动态扩展,支持文字、图片、文件、视频乃至 Chrome 标签页作为输入源,即日起已在全球 AI 模式可用地区开放。AI 概览服务也同步支持追问和扩展对话。Google 搜索还引入了信息智能体,该智能体能够全天候在后台监测博客、新闻、社交帖文以及金融、购物、体育等实时数据,预计今夏首先面向 Google AI Pro 和 Ultra 订阅用户开放。此外,本地体验、服务预订以及代用户致电商家等能力也计划在夏季于美国地区上线。基于 Antigravity 的自定义小程序(mini apps)也将根据用户搜索内容生成定制化的可交互搜索结果,未来数月首先面向美国 Google AI Pro 和 Ultra 订阅用户推出。AI 模式也正式支持个性化智能服务,面向全球 200 个国家和地区的 98 种语言提供,无需订阅即可连接用户的 Gmail、Google 相册,并提供个性化搜索结果,后续还将集成 Google 日历。

Universal Cart:打通全渠道的智能购物体验
Google 在本次发布会上还展示了跨商家、跨服务的智能购物车 Universal Cart。该功能允许用户在搜索、Gemini、YouTube 和 Gmail 等产品中直接添加商品,并能在后台利用 Gemini 模型能力追踪优惠、价格变动、历史价格以及进行补货提醒。Universal Cart 基于 Google Wallet 构建,能够识别支付方式的权益、会员信息和商家优惠,并在多零售商的场景下推断用户需求。其结账流程由 Universal Commerce Protocol(UCP)支持,用户可通过 Google Pay 在众多知名品牌(如 Nike、Sephora、Target、Walmart 等)及其 Shopify 商家完成支付,或选择跳转至商家网站购买。Universal Cart 将于今年夏季在美国地区的搜索服务和 Gemini 应用中上线,随后扩展到 YouTube 和 Gmail。

在硬件和平台方面,Google 还公布了 Android XR 智能眼镜的最新进展,并更新了 Workspace AI、SynthID 数字水印技术、Google Flow 以及 Wear OS 7。


Google 在 I/O 2026 上推出的 Gemini 系列更新,清晰地勾勒出 AI 赋能的未来数字生活图景,从内容创作到信息获取,再到购物体验,AI 正以前所未有的深度和广度重塑用户与科技的交互方式。这些能力的融合,特别是 Gemini 3.5 Flash 在效率上的提升以及 Omni 系列在创意领域的突破,为用户和开发者带来了巨大的想象空间。