OpenAI 插件接管浏览器,实测复杂任务表现惊人
人工智能领域迎来一项突破性进展,OpenAI 于 5 月 7 日正式发布了其 Codex for Chrome 浏览器扩展功能。该功能的推出预示着 AI 助手正逐步深入用户日常的网页浏览与操作流程,开启了人机交互的新篇章。
这一名为 Codex for Chrome 的插件,旨在赋予 AI 对 Chrome 浏览器执行深度控制的能力。在获得用户明确授权后,Codex 能够像人类用户一样理解网页内容、执行浏览器内的系统指令,甚至协助用户完成复杂的在线表单填写。这意味着 AI 不再局限于传统的对话界面,而是能够实际登录网站并执行具体任务,成为名副其实的“数字助理”。

在初步的功能测试中,Codex for Chrome 展现了令人瞩目的表现,尤其在处理复杂任务时。尽管在执行如整理浏览器标签页等看似简单的操作时,偶尔会遇到识别不准或执行偏差的情况,但其在面对更具挑战性的任务时,则显露出强大的处理能力。
具体而言,在信息搜集方面,该插件在整合来自苹果、华为、小米等主流手机品牌旗舰型号的相关信息时,表现出极高的效率。此外,在生成内容选题、调用 Deepseek 进行辅助创作,以及自动化生成 AI 新闻日报的表格等一系列多步骤、高复杂度的任务中,Codex for Chrome 都超出了预期,有效提升了生产力。

尽管 Codex for Chrome 在任务处理上潜能巨大,但目前的版本仍有优化空间。现阶段的测试反馈表明,该工具在精准识别网页元素方面仍有提升的余地。因此,专家建议当前阶段用户可将其视为一位“半自动助手”。在处理非敏感性日常事务时,它能显著解放用户精力,但在涉及核心隐私或高安全等级的任务时,全程的人工监督和二次核实依然是必要的。
Codex for Chrome 的出现,为 AI 介入网页操作提供了一种新的可能性。其核心优势在于能够执行网页内的具体指令,这使得 AI 能够直接参与到实际的工作流程中,而非仅仅提供信息或建议。其输入形式主要为用户与浏览器插件交互,输出则体现在浏览器页面的内容变化、信息整合或自动化生成报告等形式。对于普通用户而言,上手门槛主要在于理解其权限设置和任务指令的清晰表达。
可以预见,随着 AI 算法的不断进化和对网页交互的理解日益精进,这种“AI 接管浏览器”的模式,有望重塑我们与海量互联网信息的互动方式,带来更高效、更智能的上网体验。