LiquidAI推出LFM2-24B-A2B混合架构解决大型语言模型扩展瓶颈

随着生成式AI领域的发展逐渐达到算力与内存的瓶颈，行业对比参数规模的关注正转向架构效率的讨论。Liquid AI团队推出了全新240亿参数模型——LFM2-24B-A2B，展现了面向边缘设备的AI模型应有的新标准。这款模型结合创新性“注意力到基底”（A2B）架构以及独特的稀疏专家混合设计，为行业带来了突破性进展。

LFM2-24B-A2B模型中的”A2B”指的是”Attention-to-Base”（注意力到基底）。传统Transformer模型中每一层都使用Softmax Attention，计算复杂度随序列长度呈二次方增长（O(N²)），造成了巨大的Key-Value缓存消耗内存资源。Liquid AI采用了一种混合结构，通过”基底”（Base）层高效的门控短卷积块与”注意力”（Attention）层的分组查询注意力（Grouped Query Attention，GQA）相结合，打破了这一技术瓶颈。

在LFM2-24B-A2B模型架构中，大多数层采用门控卷积，仅少部分层使用GQA块，使模型能够实现Transformer的高分辨率检索与推理，同时保持线性复杂度模型的快速预填充和低内存占用。这种1:3比例的架构有效地平衡了性能与资源消耗，为用户带来了高效又实用的解决方案。

LFM2-24B-A2B模型最重要的技术特点是稀疏混合专家（Sparse Mixture of Experts, MoE）设计。虽然模型总参数量达到240亿，但每次处理数据时仅激活23亿参数。这样的设计从根本上改变了部署方式，因为活动参数路径极为精简，整个模型可以压缩在32GB RAM中运行，这意味着用户无需昂贵的数据中心级硬件即可在高端消费级笔记本电脑、集成式GPU台式机及专用NPU上实现本地运行。

这种高效设计不仅维持了240B模型的知识密度，还提供了与仅2B参数模型相媲美的推理速度和能源效率。Liquid AI团队表示，LFM2系列模型表现出可预测的对数线性缩放行为。LFM2-24B-A2B规模虽小，但却在逻辑推理与判断任务中媲美参数规模更大的对手。

在逻辑与推理测试中（如 GSM8K 和 MATH-500 任务），LFM2-24B-A2B 模型表现出与密集型模型媲美的能力，例如其能力与规模更大的竞品形成明显竞争优势。

当使用单张NVIDIA H100显卡进行vLLM基准测试时，LFM2-24B-A2B能够以1024个并发请求处理每秒26,800个总token，显著超越Snowflake gpt-oss-20B和Qwen3-30B-A3B，展现了出色的算力性能。

该模型支持32k-token上下文窗口，专为隐私敏感的RAG（检索增强生成）管道及本地文档分析任务进行了优化，为长文本推理任务提供了强大的支持。

通过硬件嵌入式架构搜索优化，LFM2-24B-A2B模型能够适配32GB RAM环境。无论是集成GPU的消费级设备、专用NPU，还是高性能笔记本电脑，用户均可简易部署，而无需昂贵的数据中心级基础设施。这使得高性能AI进入了大众消费领域，为更多用户提供了高效、经济的解决方案。

Liquid AI团队以科学为导向，通过1:3的混合“A2B”架构与稀疏专家技术，树立了边缘计算与生成式AI的新标杆。LFM2-24B-A2B不仅带来了技术上的突破，更体现了生成式AI从规模化向高效化转型的趋势。该模型无疑将推动AI技术在多领域的落地应用，带来更加广泛而深远的影响。

您的浏览器不支持视频标签。https://www.aistar.news/wp-content/uploads/2026/02/4121_300.mp4

[AI之星网出品] [生成式AI模型优化] [注意力到基底架构] [稀疏专家混合设计] [边缘设备AI性能提升] [刘智勇频道] [真机智能(zhenrobot.com)] [真机算法] [真机资本(zhencap.com)] [真机宇宙(zhenmeta.com)] [机器姬永生人] [机器洞察网] [AI之星网] [风投高科网] [猛虎财经网] [硅基科学网] [人形纪元网] [真机量化(zhenquant.hk)] [真机内参] [真机尽调(zhendue.com)] [高能判官] [片场狂徒] [暴徒外放] [Cognition OS] [Embodied OS] [黄金广告位]

📚 【精品资源】添加关注『AI之星网微信公众号』，即可免费获取完整版《刘智勇频道第五卷》

NightRaven February 25, 2026 At 11:20 am

AIGC技术的发展真是让人惊叹，高效设计不仅让未来更智能，也让创造力有了更广阔的天地！

_黑曜极*光_ February 25, 2026 At 12:40 pm

用单张显卡跑出这样的效果，简直是硬件和算法的最佳火花碰撞，未来霸榜技术界！

~青鸾Clo!ud- February 25, 2026 At 12:43 pm

硬件嵌入式架构优化搜出来的方案，看来聪明的不止是AI，还有做AI的工程师们！

Please enter your comment!

Please enter your name here

You have entered an incorrect email address!

Please enter your email address here

LEAVE A REPLY

ThriveCapital向OpenAI投资约10亿美元估值达2850亿美元

前Alphabet旗下机器人公司Intrinsic将并入谷歌

亚马逊AGI实验室负责人将离职

使用Asyncio模拟拜占庭容错算法并分析恶意节点与延迟

软件股反弹因Anthropic宣布新合作伙伴关系

MetaAI开源GCM工具提升GPU集群监控与硬件可靠性

特斯拉起诉加州车管局要求撤销FSD虚假宣传裁定

英伟达股价上涨8黄仁勋称6600亿美元资本支出可持续

改变2026冬奥会观赛方式的技术

英伟达股价涨8黄仁勋称6600亿美元资本支出可持续

NVIDIA发布C-RADIOv4整合多模型应对大规模视觉任务

英伟达股价上涨8黄仁勋称6600亿美元资本支出可持续

NVIDIA发布C-RADIOv4视觉骨干整合SigLIP2等支持大规模任务

如何构建具备混合检索和情景记忆的生产级AI系统

谷歌与微软提供高额合作推广AI50万美元难打动部分创作者

Waymo推出WaymoWorldModel自动驾驶新模拟器

英伟达股价上涨8黄仁勋称6600亿美元资本支出可持续

NVIDIA发布C-RADIOv4视觉骨干整合SigLIP2DINOv3SAM3

如何构建高质量AgenticAI系统实现混合检索与循环修复

美国电动车退缩加剧中国对全球市场控制

谷歌微软砸重金推广AI50万美元难打动部分创作者

高盛采用Anthropic的Claude自动化会计与合规岗位

英伟达支持的AI语音公司ElevenLabs融资后估值达110亿美元拟IPO

微软提拔销售高管以推动AI增长

微软称正打造AI内容授权应用商店

如何用Qrisp构建高级量子算法结合Grover搜索等

更多相关文章

友情链接

内部链接

特别关注

订阅新闻

LiquidAI推出LFM2-24B-A2B混合架构解决大型语言模型扩展瓶颈

LEAVE A REPLY Cancel reply

更多相关文章

友情链接

内部链接

特别关注

订阅新闻

LEAVE A REPLY