腾讯混元Hy3发布并开源 核心技术大幅革新
腾讯混元大模型Hy3 preview发布并开源:底层架构升级,多项能力实现突破
近期,腾讯正式发布并开源了其最新的大语言模型——混元Hy3 preview。作为混元基础设施经过全面重建后的首个重要成果,Hy3 preview在模型架构、能力表现以及实际应用落地等方面均展现出显著的进步,标志着腾讯在人工智能领域持续发力的重要一步。
Hy3 preview采用了先进的快慢思考融合混合专家架构,这一设计旨在优化模型的推理效率与质量。模型总参数量达到295B,其中激活参数为21B,并支持高达256K的超长上下文长度。在设计理念上,Hy3 preview遵循了能力体系化、评测真实性和性价比追求三大实用原则,致力于提供更强大、更可靠、更具成本效益的大语言模型解决方案。

在模型性能方面,Hy3 preview在多项权威评测中取得了令人瞩目的成绩。尤其是在复杂推理、指令遵循、上下文学习、代码生成以及智能体(Agent)能力方面,模型均实现了显著的提升。在FrontierScience Olympiad、IMO Answer Bench、清华求真书院数学博资考等严苛的评测场景下,Hy3 preview均表现出色,验证了其在理解和解决复杂问题上的潜力。
值得关注的是,Hy3 preview在代码生成与智能体能力上的突破尤为突出。在SWE-Bench Verified、Terminal-Bench 2.0、BrowseComp、WideSearch等行业领先的基准测试中,模型已达到第一梯队水平。这意味着Hy3 preview能够稳定支持复杂的多步工作流和工具编排,为开发者和企业构建更高级别的智能应用提供了坚实的基础。
在用户交互层面,Hy3 preview通过引入用户反馈建模和RLHF(Reinforcement Learning from Human Feedback)优化,有效减少了事实性错误,提升了意图理解的精准度,并在共情与对话体验方面取得了长足进步,使得模型在与用户进行自然语言交互时更加流畅和人性化。

目前,Hy3 preview已开始在腾讯旗下的多款产品中进行落地应用,包括元宝、CodeBuddy、WorkBuddy、QQ、腾讯文档等。同时,其接入范围也在逐步扩大,将服务于微信公众号、和平精英等更多场景。此外,Hy3 preview还展现了良好的兼容性,能够与OpenClaw等主流开源智能体框架无缝集成。
为推动AI技术的普及与发展,腾讯将Hy3 preview的模型权重与代码在GitHub、HuggingFace、ModelScope、GitCode等主流开源平台上公开发布,并支持vLLM、SGLang等推理框架。腾讯云也同步上线了API服务与Token套餐,个人版最低月费仅为28元,相较于上一代模型,推理成本得到了大幅下降,进一步降低了AI技术的应用门槛。

腾讯混元Hy3 preview的发布及其开源举措,不仅标志着腾讯在自研大模型领域迈出了坚实的一步,也预示着AI技术将在更多实际场景中发挥更重要的作用。此次架构的全面升级和多项能力的显著突破,预示着大语言模型在复杂任务处理、代码生成以及人机交互等方面的应用前景将更加广阔,并有望加速AI技术的民主化进程。