中国首发公有云大模型性能榜,日调用量破140万亿
中国人工智能产业正经历前所未有的飞速发展,作为衡量大模型性能和计费的核心指标,Token(词元)的调用量呈现爆炸式增长。最新数据显示,截至 2026 年 3 月,我国日均词元调用量已突破 140 万亿次。这一惊人数字不仅比 2024 年初增长了千倍,甚至在 2025 年底到 2026 年初的短短三个月内,增幅也超过了 40%,预示着国内大模型应用正处于一个高速扩张的关键时期。
为了应对日益增长的产业需求并提供客观的选型依据,中国信息通信研究院人工智能研究所等机构将于 6 月 16 日在北京举办“高质量 Token 服务研讨会”。届时,备受期待的全新版本“公有云大模型 Token 服务性能监测平台”将正式上线,并首次公开发布权威的监测报告。该平台将针对当前市面上主流大模型服务平台,在 Token 吞吐率、时延等关键性能指标上进行客观、量化的评估。
本次大会还将发布一套全新的“Token 服务”系列标准,旨在为我国人工智能底层算力和运力服务设定清晰的技术性能界限。会议将汇聚国内顶尖科研机构、领先大模型厂商、运营商以及应用方代表,共同探讨如何构建一个更高效、更具成本效益的词元服务生态系统,并分享相关主题的深度见解。
除了公布性能测评结果,大会还将成立“高质量 Token 服务特别研究组”,并启动“高质量 Token 服务能力攀登计划”。这些举措旨在汇聚行业内的核心力量,全力推动国内公有云大模型服务在质量和稳定性方面实现显著提升。此外,大会还将举行权威的颁证仪式,为首批通过“可信 AI-高质量 Token 服务评估”的优秀企业颁发官方认证。通过解读行业标准并展示标杆企业的实践,信通院希望能够引导整个大模型产业克服性能瓶颈,为各行各业的数字化转型提供更为稳固的智能基础。
对于大模型服务而言,吞吐率和时延是直接影响用户体验和应用效率的关键性能指标。高吞吐率意味着模型能够处理更多并发请求,适用于大规模用户场景;而低时延则能保证交互的流畅性,对于实时性要求高的应用如智能客服、内容生成等至关重要。此次性能监测平台的上线,将为用户在选择和部署大模型服务时提供重要的参考维度,帮助其找到最适合自身业务需求的高效解决方案。