跳至正文
V科技 V科技

聚焦软件应用、手机数码、效率方法、AI 工具与行业观察的科技媒体

V科技 V科技

聚焦软件应用、手机数码、效率方法、AI 工具与行业观察的科技媒体

  • 首页
  • 深度评测
  • 软件应用
  • 手机与数码
  • Ai资讯
  • 行业观察
  • AI 工具
  • 智能汽车
  • 首页
  • 深度评测
  • 软件应用
  • 手机与数码
  • Ai资讯
  • 行业观察
  • AI 工具
  • 智能汽车
关

搜索

V科技 V科技

聚焦软件应用、手机数码、效率方法、AI 工具与行业观察的科技媒体

V科技 V科技

聚焦软件应用、手机数码、效率方法、AI 工具与行业观察的科技媒体

  • 首页
  • 深度评测
  • 软件应用
  • 手机与数码
  • Ai资讯
  • 行业观察
  • AI 工具
  • 智能汽车
  • 首页
  • 深度评测
  • 软件应用
  • 手机与数码
  • Ai资讯
  • 行业观察
  • AI 工具
  • 智能汽车
关

搜索

Ai资讯

MiniCPM-V 4.6 重新定义端侧多模态

V科技 作者 V科技 发布时间 2026年05月27日 12:16 浏览量 16 0 评论

面壁智能联合清华大学及 OpenBMB 开源社区,于5月11日发布了新一代端侧多模态大模型 MiniCPM-V4.6。该模型以其1.3B的参数量,在同等量级模型中展现出卓越的智能密度和跨平台适配能力,有效推动了端侧AI技术的部署与应用。

image.png

MiniCPM-V4.6系列推出了Instruct和Thinking两个版本,其性能表现已在全球多项评测中得到验证。在Artificial Analysis(AA)榜单上,MiniCPM-V4.6以13分的成绩,显著超越了同等参数量的阿里Qwen3.5-0.8B和谷歌Gemma4-E2B-it,甚至逼近了参数量更大的Qwen3.5-2B,确立了其在1B级别模型中的领先地位。无论是在通用图文理解、复杂的STEM数理推理,还是在OCR文档解析与视频时序理解等高阶任务上,该模型均展现出高度的智能水平,尤其Thinking版本在多图像推理与幻觉抑制方面表现突出。

为了解决端侧部署中常见的内存限制问题,MiniCPM-V4.6在推理速度和资源占用方面进行了深度优化。其运行内存需求被大幅压缩至6GB,这意味着包括主流智能手机、个人电脑及各类智能家居设备都能够实现流畅运行。在推理效率上,该模型基于vLLM框架,推理吞吐量是竞品的1.5倍。在处理3136²分辨率的超高清大图时,首响应延迟仅为75.7毫秒,比同类产品快2.2倍。此外,其文本生成能力单卡即可达到7013 token/s,图像处理能力为54.79张/秒(1344²分辨率),展现出惊人的吞吐效率。

MiniCPM-V4.6之所以能在有限的参数下实现高效能,得益于面壁智能与清华大学联合研发的LLaVA-UHD v4技术。这项技术通过重构ViT图像编码器和浅层压缩模块,将图像编码开销降低了50%,高分辨率浮点运算量减少了55.8%。同时,其创新的混合Token压缩机制支持4倍/16倍的混合压缩,允许模型在性能与速度之间进行灵活切换,这一技术已在快手推荐大模型OneRec中得到验证,并支撑了海量流量请求。

V科技点评

MiniCPM-V4.6的全面开源标志着其技术正在加速走向产业一线。开发者可以通过ms-swift、LLaMA-Factory等微调框架,在单张RTX4090显卡上完成全量微调,极大地降低了开发门槛。模型支持vLLM、Ollama等主流框架,并已在iOS、Android、HarmonyOS等平台上推出测试版本,为AI在多样化硬件终端上的普及奠定了基础。目前,该系列模型已成功应用于汽车、PC、智能家居及工业检测等多个领域,并与联想、吉利、上汽大众、小米、OPPO等行业头部企业建立了合作关系。

MiniCPM-V4.6的发布显著降低了端侧多模态大模型的应用门槛,预示着AI将不再局限于云端算力,而是会更深入地融入各类智能终端,成为人们日常生活中不可或缺的智能助手。

相关资讯
科技巨头反思:程序员比AI便宜? Uber 总裁质疑 AI 投入:Token 暴涨未带来实质回报 上海AI微短剧新政:千万资助,AI重塑出海版图 美国用户涌入小众浏览器,拒绝AI搜索 小米AI大模型全球双第一,加速智能化转型 豆包禁用拍题答疑,元宝高考期不答题 DuckDuckGo 告别 AI 搜索,用户激增 名创优品 Q1 营收亮眼,AI 投资增厚利润
暂无评论!成为第一个。

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

热门文章

  • 斑马智行接入支付宝,智能座舱体验升级 2026年4月24日
  • 江铃易至 EV3 纯电新车上市,配备 10.1 英寸悬浮屏 2026年5月26日
  • DLSS 4.5 助《007》游戏帧数飙升 2026年5月26日
  • OpenAI AI 成功反驳 Erdős 单位距离猜想 2026年5月26日
  • 卓驭科技布局线下渠道,首推终端直营模式 2026年5月26日

热议文章

  • 01
    iPhone 20外观迎20年来最大更新 0条评论
  • 02
    科技巨头反思:程序员比AI便宜? 0条评论
  • 03
    Uber 总裁质疑 AI 投入:Token 暴涨未带来实质回报 0条评论
  • 04
    小米 SU7 GT 周五开启交付,雷军舒淇将为首批车主直播 0条评论
  • 05
    特斯拉副总裁:Model S/X 未来或回归 0条评论

AI 工具精选

Mixdesk

针对全球企业的AI驱动社交客户服务和营销解决方案。

CREATUS.AI

创建美观且交互式表单的平台,无需编码。

Powered_by Agency

为SMB提供定制化的AI代理解决方案,专注于多渠道自动化。

Jeeva.ai

具备人工智能的销售代理,用于自动化潜在客户生成和客户互动。

智能汽车

  • 小米 SU7 GT 周五开启交付,雷军舒淇将为首批车主直播 2026年5月27日
  • 特斯拉副总裁:Model S/X 未来或回归 2026年5月27日
  • 东风奕派M8车顶“小蓝灯”:激光雷达可视化与情绪价值之辩 2026年5月27日
  • 姚明出任蔚来 ES9 首席体验官 2026年5月27日
V科技 V科技 科技媒体与数码生活指南

聚焦软件应用、手机数码、效率方法、AI 工具与行业观察。

栏目导航 深度体验 软件应用 手机与数码 行业观察 智能汽车 AI 工具 站点地图
Copyright 2026 — V科技。聚焦软件应用、手机数码、效率方法、AI 工具与行业观察。 琼ICP备2024029348号