OpenCV 5 携 DNN 引擎问世,原生支持大模型
OpenCV 5 发布:引入全新 DNN 引擎,原生支持大模型
OpenCV 团队于本周正式发布了 OpenCV 5。作为一款拥有二十多年历史的计算机视觉库,OpenCV 一直是诸多研究、应用及生产系统的基石,并在 GitHub 上获得了超过 86,000 颗星的认可。

OpenCV 5 带来了重大的现代化升级,核心亮点包括全新的 DNN 引擎,支持更广泛的 ONNX 格式,并在硬件加速、Python 集成、数据类型、3D 视觉功能及文档方面均有显著改进。此次更新旨在为用户提供更清晰、更面向未来的架构。
本次更新的重点功能包括:
- 下一代 DNN 引擎:基于图(graph-based)架构,支持算子融合(fusions),显著增强了 ONNX 支持(算子覆盖率提升至 80% 以上),并原生支持 Transformer 模型、视觉语言模型(VLM)及大型语言模型(LLMs)。
- 改进的语言支持与 API:提供更现代化的 Python 绑定,使用命名参数简化调用,引入规范的 0D/1D 张量及原生 FP16/BF16 支持。
- 性能与架构优化:核心代码更紧凑,弃用传统 C API,提供更精简的构建方式,并引入更清晰的硬件加速层,便于硬件供应商集成优化内核。
- 扩展的 3D 视觉能力:新增 ChArUco 标定板、多相机标定以及可视化功能。

OpenCV 5 的发布对于需要处理复杂 AI 模型、提升计算机视觉性能的开发者而言,具有重要的升级价值。其对大模型的原生支持以及优化的 DNN 引擎,将极大地便利相关 AI 应用的开发与部署。
OpenCV 5 正式发布,本次更新引入了全新的深度学习(DNN)引擎,并对多项核心功能进行了现代化升级,显著提升了性能和易用性。新版本在 ONNX 算子覆盖率方面取得重大突破,从 4.x 版本的不足 23% 跃升至超过 80%,为用户提供了更广泛的模型支持。
OpenCV 5 的主要亮点包括:现代化的 Python 支持和更新的语言绑定,允许用户通过命名参数而非猜测参数顺序来调用函数。核心引擎更加精简高效,弃用了传统的 C API,并采用了更清晰的硬件加速层设计,方便硬件供应商直接集成优化内核。API 也得到优化,支持规范的 0D/1D 张量,原生支持 FP16/BF16 数据类型,并加入了真正的日志记录机制。此外,3D 视觉能力得到增强,支持 ChArUco 标定板、多相机标定和可视化功能,文档也进行了现代化重构,提升了导航和阅读体验。

本次更新特别强调了下一代 DNN 引擎的进步,采用了基于图的架构,支持算子融合,并对 Transformer 模型、视觉语言模型(VLM)和大型语言模型(LLMs)提供了原生支持。这对于需要进行复杂 AI 推理和模型部署的开发者而言,将带来显著的性能提升和更强的模型兼容性。
对于依赖 OpenCV 进行计算机视觉开发的开发者而言,OpenCV 5 的全面升级,特别是对大模型和 ONNX 的支持,使其在应对现代 AI 任务时更具竞争力。其更快的核心、更简洁的 API 和优化的硬件加速能力,预示着在性能和开发效率上都有所提升,值得关注和升级。