摩尔线程发布首个全链路自研代码大模型MusaCoder
摩尔线程发布国产首个GPU底层算子生成大模型 MusaCoder
摩尔线程近日宣布正式发布并开源了名为 MusaCoder 的代码大模型,该模型专为 GPU 底层算子生成而设计。值得注意的是,MusaCoder 是业界首个完全在国产全功能 GPU 基础上完成端到端训练与验证的开源代码模型,标志着国产人工智能算力领域的一项重要技术突破。
MusaCoder 的诞生离不开摩尔线程自研的“夸娥”智算集群,该集群基于 MTT S5000 GPU 构建,并完成了模型的完整后训练(Post-training)流程。这一实践证明了国产硬件在承载复杂大模型全链路开发任务上的可靠性和高效性,为行业构建从底层硬件到上层模型训练的完整自主化范式提供了宝贵经验。

在性能评测方面,MusaCoder 展现出了强大的竞争力。在 KernelBench 的严苛测试中,MusaCoder-27B-RL 模型取得了 93.2% 的 Overall Pass 率和 88.60% 的平均分,其代码生成与处理能力已超越了 Claude Opus 4.7、DeepSeek-V4 Pro、GLM-5.1 和 Kimi K2.6 等多款国际主流 SOTA 代码模型,性能表现位居行业前列。
此次 MusaCoder 的开源,不仅是摩尔线程在模型研发上的技术积累,更是其完善国产算力生态布局的关键一步。摩尔线程近年来持续在底层生态建设上发力,已成功适配 DeepSeek、Qwen、MiniMax 等主流大模型,并推出了配套的开源算子开发工具。MusaCoder 的发布将进一步赋能开发者,让他们能够更便捷地利用国产算力底座,加速算子开发和模型训练,充分释放国产全功能 GPU 的计算潜力。
MusaCoder 作为一款专攻 GPU 底层算子生成的 AI 模型,其输入形式主要为自然语言描述或半结构化的代码需求,输出则为高效的 GPU 算子代码。这大大降低了开发者直接编写底层算子的门槛,尤其对于需要针对特定硬件优化性能的场景,如高性能计算、自动驾驶、图形渲染和科学计算等,MusaCoder 的应用前景广阔。其强大的性能表现意味着开发者可以更快地获得高质量的代码,从而加速产品迭代和性能提升。
代码模型是 AI 开发流程中的核心“引擎”,其性能和自主可控程度直接关系到整个 AI 产业的健康发展。摩尔线程通过全栈自研路径打造的 MusaCoder,为国内 AI 研发提供了更具自主性的工具选择,对于构建更加稳固和可信赖的国产人工智能底层技术体系具有深远意义。