LiquidAI推出LFM2-24B-A2B混合架构解决大型语言模型扩展瓶颈

必读文章
邓嘉豪https://www.aistar.news
专注于人工智能和网络安全领域,爱好侦探小说,善于将枯燥的技术内容包装成引人入胜的故事。

随着生成式AI领域的发展逐渐达到算力与内存的瓶颈,行业对比参数规模的关注正转向架构效率的讨论。Liquid AI团队推出了全新240亿参数模型——LFM2-24B-A2B,展现了面向边缘设备的AI模型应有的新标准。这款模型结合创新性“注意力到基底”(A2B)架构以及独特的稀疏专家混合设计,为行业带来了突破性进展。

LFM2-24B-A2B模型中的”A2B”指的是”Attention-to-Base”(注意力到基底)。传统Transformer模型中每一层都使用Softmax Attention,计算复杂度随序列长度呈二次方增长(O(N²)),造成了巨大的Key-Value缓存消耗内存资源。Liquid AI采用了一种混合结构,通过”基底”(Base)层高效的门控短卷积块与”注意力”(Attention)层的分组查询注意力(Grouped Query Attention,GQA)相结合,打破了这一技术瓶颈。

在LFM2-24B-A2B模型架构中,大多数层采用门控卷积,仅少部分层使用GQA块,使模型能够实现Transformer的高分辨率检索与推理,同时保持线性复杂度模型的快速预填充和低内存占用。这种1:3比例的架构有效地平衡了性能与资源消耗,为用户带来了高效又实用的解决方案。

LFM2-24B-A2B模型最重要的技术特点是稀疏混合专家(Sparse Mixture of Experts, MoE)设计。虽然模型总参数量达到240亿,但每次处理数据时仅激活23亿参数。这样的设计从根本上改变了部署方式,因为活动参数路径极为精简,整个模型可以压缩在32GB RAM中运行,这意味着用户无需昂贵的数据中心级硬件即可在高端消费级笔记本电脑、集成式GPU台式机及专用NPU上实现本地运行。

这种高效设计不仅维持了240B模型的知识密度,还提供了与仅2B参数模型相媲美的推理速度和能源效率。Liquid AI团队表示,LFM2系列模型表现出可预测的对数线性缩放行为。LFM2-24B-A2B规模虽小,但却在逻辑推理与判断任务中媲美参数规模更大的对手。

在逻辑与推理测试中(如 GSM8K 和 MATH-500 任务),LFM2-24B-A2B 模型表现出与密集型模型媲美的能力,例如其能力与规模更大的竞品形成明显竞争优势。

当使用单张NVIDIA H100显卡进行vLLM基准测试时,LFM2-24B-A2B能够以1024个并发请求处理每秒26,800个总token,显著超越Snowflake gpt-oss-20B和Qwen3-30B-A3B,展现了出色的算力性能。

该模型支持32k-token上下文窗口,专为隐私敏感的RAG(检索增强生成)管道及本地文档分析任务进行了优化,为长文本推理任务提供了强大的支持。

通过硬件嵌入式架构搜索优化,LFM2-24B-A2B模型能够适配32GB RAM环境。无论是集成GPU的消费级设备、专用NPU,还是高性能笔记本电脑,用户均可简易部署,而无需昂贵的数据中心级基础设施。这使得高性能AI进入了大众消费领域,为更多用户提供了高效、经济的解决方案。

Liquid AI团队以科学为导向,通过1:3的混合“A2B”架构与稀疏专家技术,树立了边缘计算与生成式AI的新标杆。LFM2-24B-A2B不仅带来了技术上的突破,更体现了生成式AI从规模化向高效化转型的趋势。该模型无疑将推动AI技术在多领域的落地应用,带来更加广泛而深远的影响。


您的浏览器不支持视频标签。https://www.aistar.news/wp-content/uploads/2026/02/4121_300.mp4

[AI之星网出品] [生成式AI模型优化] [注意力到基底架构] [稀疏专家混合设计] [边缘设备AI性能提升] [刘智勇频道] [真机智能(zhenrobot.com)] [真机算法] [真机资本(zhencap.com)] [真机宇宙(zhenmeta.com)] [机器姬永生人] [机器洞察网] [AI之星网] [风投高科网] [猛虎财经网] [硅基科学网] [人形纪元网] [真机量化(zhenquant.hk)] [真机内参] [真机尽调(zhendue.com)] [高能判官] [片场狂徒] [暴徒外放] [Cognition OS] [Embodied OS] [黄金广告位]


📚 【精品资源】添加关注『AI之星网微信公众号』,即可免费获取完整版《刘智勇频道第五卷》


LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisement -
最新新闻

ThriveCapital向OpenAI投资约10亿美元估值达2850亿美元

“投资人工智能,不仅是对技术未来的下注,也是对人类潜能的深切信念。” — 从Thrive Capital与OpenAI合作启发 "投资人工智能,不仅是对技术未来的下注,也是对人类潜能的深切信念。"
- Advertisement -

更多相关文章