跳至正文
V科技 V科技

聚焦软件应用、手机数码、效率方法、AI 工具与行业观察的科技媒体

V科技 V科技

聚焦软件应用、手机数码、效率方法、AI 工具与行业观察的科技媒体

  • 首页
  • 深度评测
  • 软件应用
  • 手机与数码
  • Ai资讯
  • 行业观察
  • 值得买 / 推荐
  • AI 工具
  • 首页
  • 深度评测
  • 软件应用
  • 手机与数码
  • Ai资讯
  • 行业观察
  • 值得买 / 推荐
  • AI 工具
关

搜索

V科技 V科技

聚焦软件应用、手机数码、效率方法、AI 工具与行业观察的科技媒体

V科技 V科技

聚焦软件应用、手机数码、效率方法、AI 工具与行业观察的科技媒体

  • 首页
  • 深度评测
  • 软件应用
  • 手机与数码
  • Ai资讯
  • 行业观察
  • 值得买 / 推荐
  • AI 工具
  • 首页
  • 深度评测
  • 软件应用
  • 手机与数码
  • Ai资讯
  • 行业观察
  • 值得买 / 推荐
  • AI 工具
关

搜索

Ai资讯

阿里巴巴南开共研视频压缩新突破

V科技 作者 V科技 发布时间 2026年04月25日 17:09 浏览量 5 0 评论

阿里巴巴通义实验室与南开大学的合作成果——LLaVA-Scissor——近期面世,这项新技术致力于攻克视频大模型在处理海量帧数据时面临的效率瓶颈,为视频理解与推理带来了革新性的解决方案。

LLaVA-Scissor 提出的核心在于其创新的基于图论的 SCC (Strongly Connected Components) 压缩算法。该算法通过深入分析视频 token 间的相似性,构建起一张复杂的相似性图谱,并从中精确识别出语义高度相关的 token 集合。通过用每个集合中的代表性 token 来取代整个集合,LLaVA-Scissor 能够大幅削减 token 总量,从而显著提升模型的推理速度和处理能力。

image.png

为了进一步优化压缩效果,LLaVA-Scissor 采用了精妙的两步时空压缩策略。首先,在空间维度上,技术能够精准识别单帧图像内部的语义关联区域,进行初步的 token 整合。随后,在时间维度上,它能有效地剔除不同帧之间重复或冗余的信息,确保最终压缩后的 token 序列能够以最紧凑的形态,同时包含丰富的时序和空间信息,全面覆盖视频内容。

image.png

实际测试结果充分印证了 LLaVA-Scissor 的强大实力。在多项关键视频理解基准测试中,该技术在低 token 保留率下的表现尤为抢眼。例如,在视频问答任务中,即使 token 保留率仅为 50%,LLaVA-Scissor 仍能与原始模型保持相当的性能水平。而在更具挑战性的 35% 和 10% token 保留率场景下,其性能优势更是超越了其他现有压缩方法。在处理长视频时,LLaVA-Scissor 同样展现出优异的能力,在 EgoSchema 数据集上,以 35% 的 token 保留率实现了 57.94% 的准确率。

V科技点评

LLaVA-Scissor 的诞生标志着视频大模型压缩技术迈上了一个新台阶,它不仅解决了现实应用中的效率难题,更为未来视频内容的高效处理和深度理解铺平了道路,有望在人工智能领域掀起新的浪潮。

LLaVA-Scissor 的技术突破,预示着视频大模型将在效率与性能之间找到更佳的平衡点,从而加速其在更多实际场景中的落地应用。

相关资讯
阿里通义千问发布文生图新模型Qwen-Image ChatGPT用户数激增至7亿 OpenAI年收入达120亿美元 微量虚假数据即可显著增加人工智能有害输出 谷歌安全工具发现二十个新漏洞 ChatGPT新功能上线,实用性优先 智谱GLM-4.5驱动Zread.ai提效 Perplexity被指控规避限制 爬取网站内容 通义千问开源200亿参数图像生成模型
暂无评论!成为第一个。

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

热门文章

  • 斑马智行接入支付宝,智能座舱体验升级 2026年4月24日
  • 学生购买MacBook可享教育优惠吗 2026年4月23日
  • vivo X300 FE 搭载骁龙8+与6500mAh电池,模块化影像系统亮相 2026年4月24日
  • 王心凌演唱会被观众催促脱衣,本人回应现场情况 2026年4月24日
  • 相机之外的摄影新选择 2026年4月23日

热议文章

  • 01
    同档最强小平板!OPPO Pad Mini下周首销:3199元起–快科技–科技改变未来 0条评论
  • 02
    马斯克诉奥尔特曼案:开庭前已知信息盘点 0条评论
  • 03
    酒店预订提前,价格已超去年 0条评论
  • 04
    拯救者红魔红米新平板登场,OPPO加入战局 0条评论
  • 05
    英伟达市值重返五万亿美元 0条评论

AI 工具精选

Prodhub.ai

具备自动化、预测和洞察的产品管理解决方案,加快产品上市速度。

SkyWise

由人工智能驱动的个人天气顾问,具有聊天界面以获取定制天气更新。

HireHarmonyAI

基于AI的Chrome扩展,实现高效的LinkedIn招聘。

Astrology Works

提供个性化见解的人工智能占星网站,涵盖多种生活领域。

V科技 V科技 科技媒体与数码生活指南

聚焦软件应用、手机数码、效率方法、AI 工具与行业观察。

栏目导航 深度体验 软件应用 手机与数码 行业观察 值得买 / 推荐 AI 工具 站点地图
Copyright 2026 — V科技。聚焦软件应用、手机数码、效率方法、AI 工具与行业观察。