Liquid AI 开源 LFM2.5,端侧大模型迎突破
Liquid AI 开源 LFM2.5-8B-A1B,重塑端侧大模型能力
人工智能初创公司 Liquid AI 于今日正式发布并开源了其最新的端侧大模型 LFM2.5-8B-A1B。该模型专为消费级硬件上的工具调用和复杂的指令遵循任务而设计,旨在实现极低的计算成本下的推理性能大幅提升,从而赋能本地设备更强大的智能处理能力。
关键技术与架构亮点
LFM2.5-8B-A1B 采用了先进的稀疏混合专家(MoE)架构,整体参数量达到 8.3B。其核心优势在于“稀疏性”设计,使得在处理每个 Token 时仅激活约 1.5B 参数。这一技术创新极大地降低了模型运行的计算需求,使其能够流畅地部署于智能手机和笔记本电脑等常见的本地设备上,为用户带来更私密、更高效的 AI 体验。

长文本处理与逻辑推理的突破
相较于其前代产品,LFM2.5 在处理能力上实现了显著飞跃。其上下文窗口从原先的 32K 词元大幅扩展至 128K,预训练数据量也从 12T 增至 38T,极大地增强了模型对长篇内容的理解和生成能力。作为一款纯推理模型,它能够生成显式的思维链,辅助用户理解推理过程。此外,模型优化后的词表能够更高效地处理包括中文、阿拉伯文在内的九种语言,进一步拓宽了其应用范围。
克服长推理挑战与强化安全性
为应对长文本推理中常见的逻辑死循环和信息“幻觉”问题,Liquid AI 在模型训练过程中引入了创新的两阶段强化学习(RL)机制。通过偏好优化,模型在长链路推理中大幅减少了“死循环”现象的出现。同时,内置的防幻觉奖励机制能够有效识别并拒绝回答超出其知识库范围的问题,确保了输出信息的准确性和可靠性。
在实际性能表现上,LFM2.5-8B-A1B 展现出惊人的爆发式增长。该模型在逻辑推理和反幻觉基准测试中的得分远超前代,甚至在指令遵循能力上已能媲美参数量更大的模型。其在工具调用方面尤为突出,默认输出高效的 Python 函数调用,并支持通过系统提示词灵活切换为 JSON 格式。发布当日,该模型已获得 llama.cpp、MLX、vLLM 和 SGLang 等主流推理生态的全面支持。硬件实测显示,在 M5 Max 芯片上,其解码速度可达每秒 253 字节,而在手机端也能实现约每秒 30 字节的速度,兼顾了端侧运行的私密性与高效率。
LFM2.5-8B-A1B 的发布标志着端侧大模型在复杂指令遵循和工具调用方面迈出了重要一步,尤其适合需要本地化、低延迟AI应用场景,但其大规模部署和用户友好度仍需进一步观察。