跳至正文
V科技 V科技

聚焦软件应用、手机数码、效率方法、AI 工具与行业观察的科技媒体

V科技 V科技

聚焦软件应用、手机数码、效率方法、AI 工具与行业观察的科技媒体

  • 首页
  • 深度评测
  • 软件应用
  • 手机与数码
  • Ai资讯
  • 行业观察
  • AI 工具
  • 智能汽车
  • 首页
  • 深度评测
  • 软件应用
  • 手机与数码
  • Ai资讯
  • 行业观察
  • AI 工具
  • 智能汽车
关

搜索

V科技 V科技

聚焦软件应用、手机数码、效率方法、AI 工具与行业观察的科技媒体

V科技 V科技

聚焦软件应用、手机数码、效率方法、AI 工具与行业观察的科技媒体

  • 首页
  • 深度评测
  • 软件应用
  • 手机与数码
  • Ai资讯
  • 行业观察
  • AI 工具
  • 智能汽车
  • 首页
  • 深度评测
  • 软件应用
  • 手机与数码
  • Ai资讯
  • 行业观察
  • AI 工具
  • 智能汽车
关

搜索

Ai资讯

GPT-5.5 攻克 AI 漏洞挑战,DeepSeek 获评性价比之王

V科技 作者 V科技 发布时间 2026年06月04日 19:25 浏览量 12 0 评论

近日,安全研究员 Kasra Rahjerdi 通过构建一个存在漏洞的图书评论应用,对多款主流大语言模型(LLM)的安全推理能力进行了实战攻坚。此次测试模拟了真实的应用安全场景,研究员故意在应用文件中暴露了谷歌移动端后端服务的凭据,旨在检验模型是否能够成功解包并识别出这些敏感信息,进而直接访问数据库。

image.png

在每轮测试均严格限制在 2 小时内且成本不超过 10 美元的条件下,各模型展现出显著差异化的性能。其中,GPT-5.5 在 10 次尝试中成功解谜 7 次,显示出强大的技术实力,成为解题率最高的模型。报告特别指出,GPT-5.5 在完成解包后,几乎能瞬间定位到关键凭据,不受复杂应用界面或常规接口的阻碍。

与之形成对比的是,Gemini 3.1 Pro Preview 在此次测试中表现不尽如人意,该模型在多数任务的初期阶段便触发了内置的拒绝执行机制,导致其最终的 Token 消耗量远低于其他参与测试的模型。

V科技点评

从成本效益角度看,尽管 GPT-5.5 成功率最高,但其每次成功的平均成本高达 9.46 美元,这可能限制了其在需要大规模部署的场景下的应用。在此背景下,DeepSeek V4 Pro 以其极高的性价比脱颖而出。尽管其 10 次测试中仅成功 3 次,但每次成功的平均花费仅为 0.62 美元,远低于 GPT-5.5。这意味着,DeepSeek V4 Pro 的单次成功成本约为 GPT-5.5 的十五分之一。虽然该模型在一些失败的尝试中出现了将认证接口误用于后端的状况,但其显著的成本优势使其成为需要大规模安全检测团队的有力选项。

本次测试揭示了不同大语言模型在处理安全攻坚任务时的推理能力和成本效率上的差异。GPT-5.5 在直接的“破局”能力上表现突出,而 DeepSeek V4 Pro 则在成本控制方面展现出巨大潜力。Gemini 3.1 Pro Preview 的表现则暗示了其在特定安全防护机制下可能存在的局限性。对于需要将 LLM 用于安全审计、代码审查或敏感信息检测等场景的用户而言,理解这些模型的优劣势,并结合实际应用需求(如成功率、成本、响应速度等)进行选择,至关重要。

相关资讯
MiniMax M3大模型发布:首创MSA架构,支持百万级上下文,全面开源 谷歌 Gemini 进驻 Gmail 邮箱搜索 Anthropic Claude 推出安全隔离架构,多层防护升级 Meta 智能体全球上线 WhatsApp 赋能中小企业 谷歌云牵手瑞典独角兽 Lovable,AI 算力扩容五倍 LongCat-Next 开源,AI 迎来原生多模态新篇章 红魔游戏平板5 Pro入网,深度集成豆包大模型 GPT-5.5 利用率夺冠,DeepSeek V4 Pro性价比领先
暂无评论!成为第一个。

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

热门文章

  • 斑马智行接入支付宝,智能座舱体验升级 2026年4月24日
  • 理想L9 Livis发布后,技术争议渐消 2026年5月27日
  • B站百度网盘会员 618 优惠再现 2026年5月27日
  • DLSS 4.5 助《007》游戏帧数飙升 2026年5月26日
  • 极氪 001 五周年纪念版限量开售,36.5 万元起 2026年5月27日

热议文章

  • 01
    宝马新世代iX3夏测续航781公里夺冠 0条评论
  • 02
    宾利携手复刻1929年经典:纯电动力,手工还原 0条评论
  • 03
    福特重启轿车计划:成本合理是关键 0条评论
  • 04
    东风马赫动力发布新一代 2.0T 混动发动机,热效率达 45.5% 0条评论
  • 05
    鸿蒙智行智界新车FUV风格,赵长江:创新驱动未来 0条评论

AI 工具精选

Mixdesk

针对全球企业的AI驱动社交客户服务和营销解决方案。

CREATUS.AI

创建美观且交互式表单的平台,无需编码。

Powered_by Agency

为SMB提供定制化的AI代理解决方案,专注于多渠道自动化。

Jeeva.ai

具备人工智能的销售代理,用于自动化潜在客户生成和客户互动。

智能汽车

  • 宝马新世代iX3夏测续航781公里夺冠 2026年6月4日
  • 宾利携手复刻1929年经典:纯电动力,手工还原 2026年6月4日
  • 福特重启轿车计划:成本合理是关键 2026年6月4日
  • 东风马赫动力发布新一代 2.0T 混动发动机,热效率达 45.5% 2026年6月4日
V科技 V科技 科技媒体与数码生活指南

聚焦软件应用、手机数码、效率方法、AI 工具与行业观察。

栏目导航 深度体验 软件应用 手机与数码 行业观察 智能汽车 AI 工具 站点地图
Copyright 2026 — V科技。聚焦软件应用、手机数码、效率方法、AI 工具与行业观察。 琼ICP备2024029348号