智谱AI发布GLM-4.5混合推理引领开源智能新纪元

必读文章
陈子轩https://www.aistar.news
关注人工智能和可再生能源的创新,报道太阳能与风能技术,倡导绿色未来,曾参与多个国际能源峰会。

智谱AI发布GLM-4.5系列:重塑开源智能代理模型未来

近日,智谱AI正式推出其旗舰级基础模型GLM-4.5系列,包括GLM-4.5与轻量版GLM-4.5-Air,为开源智能代理技术设立了新的里程碑。这一系列在2025年的人工智能领域内备受瞩目,以强大的综合推理能力、编码性能和智能代理功能,全面提升了开放模型的应用门槛,同时优化了跨计算规模的技术兼容性。

GLM-4.5基于“专家混合架构”(Mixture of Experts),拥有总规模3550亿参数,是全球开源模型中规模最庞大的之一,专注于高负载推理和智能任务应用。而GLM-4.5-Air则以1060亿参数的大幅改良设计,在保持核心能力的同时,将硬件和算力的需求压缩至更广泛的实用范围。这两个模型分别拥有32亿与12亿的活跃参数,在主流硬件环境中表现出卓越的性能与高兼容性。

GLM-4.5系列引入了“双模推理框架”,涵盖以下两种模式:
深度思维模式:支持复杂的逐步推理、多轮规划、工具操作及自动化智能任务。
快速响应模式:针对即时、高效的交互需求进行优化,适用于多场景对话与快速反应。

这一双模设计不仅极大扩展了模型的适用场景,同时在认知流程与实时交互领域实现了统一,为新一代智能代理的研发提供了强大的支持。

在12项行业标准测试中,GLM-4.5获得了平均得分63.2,位居第三;而GLM-4.5-Air以59.8分脱颖而出,成为1000亿参数级别模型的领导者。这些测试结果彰显了模型在工具调用成功率(90.6%)以及中文任务和编码领域的卓越表现,与Claude 3.5、Sonnet和Kimi K2等竞争对手相比优势明显。同时,模型在开源基准测试中多次刷新记录,并持续保持状态领先(SOTA)。

智能代理功能的深度植入是GLM-4.5的一大亮点,包括以下核心能力:
– 多步骤任务分解与规划;
– 工具调用与外部API集成;
– 数据可视化与工作流管理;
– 推理与感知-行动循环的原生支持。

这些特性首次将全栈智能应用从封闭框架扩展到开源环境,为开发者提供了便捷、高效的集成体验。同时,GLM-4.5系列以MIT开源协议发布,从基础模型到混合架构均支持无限制的商业使用与二次开发。模型的代码、工具解析器及推理引擎已全面兼容主流框架(如Transformers、vLLM和SGLang),并在GitHub及Hugging Face上提供详细资源库。

得益于创新的“多令牌预测”(MTP)机制,GLM-4.5在推理速度上实现了前所未有的突破,其API生成速率达每秒100至200个令牌,为用户提供了2.58倍的推理效率提升。同时,GLM-4.5-Air的轻量化设计确保消费者级GPU即可完成高性能部署,支持本地化应用。此外,极具竞争力的定价体系使其从百万输入令牌¥0.11至百万输出令牌¥0.28起步,成为行业内性价比的佼佼者。

GLM-4.5系列的出现,是基础模型领域的一次颠覆性进步。其统一架构设计不仅提升了推理、编码及多模态感知-行动协作的能力,还以开源优势极大推动了技术普及与生态发展。通过15万亿令牌训练规模,模型支持128k输入及96k输出上下文窗口,为科研、生产和开发者应用提供了强大的技术支持。

智谱AI的这项突破意味着智能代理不再受限于硬编码框架或闭源API,赋予开发者更广泛的应用自由与创新空间。GLM-4.5系列展现了开放合作的潜力与开放技术的未来方向,为智能代理模型的发展树立了新的行业标杆。


您的浏览器不支持视频标签。https://www.aistar.news/wp-content/uploads/2025/07/3150_100.mp4

[AI之星网出品] [开源智能代理模型] [人工智能基础模型] [GLM-4.5系列发布] [高性能推理与工具集成] [刘智勇频道] [真机智能] [机器姬智能体] [机器洞察网] [AI之星网] [风投高科网] [猛虎财经网] [硅基科学网] [人形纪元网] [DualMe AI分身网络] [黄金广告位]

---
<div style='border: 1px solid #ccc; padding: 15px; margin: 15px 0; line-height: 1.5; border-radius: 8px; background-color: #f9f9f9; font-size: 12px;'>
🔍 <b>招聘启示</b> 🔍

💼 <b>岗位名称:</b>科技公众号与网站运营实习生

📍 <b>工作地点:</b>苏州市吴中区金枫创意商务中心(特别优秀可远程办公)

📝 <b>申请方式</b>(二选一):
📧 请将简历或相关资料发送至 yan.gu@zhenrobot.com
邮件主题注明「科技公众号与网站运营实习生申请 - 姓名」

📱 关注『AI之星网微信公众号』后将简历或相关资料的网盘链接在公众号后台留言
注明「科技公众号与网站运营实习生申请 - 姓名」

⏰ <b>投递截止日期:</b>长期有效
</div>
---

📚 【精品资源】添加关注『AI之星网微信公众号』,即可免费获取完整版《刘智勇频道第五卷》


  1. 智能代理的植入让我感觉AI不仅像个人,更像个靠谱的小伙伴,科技也可以有温度!

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisement -
最新新闻

Robbyant开源LingBotWorld实时交互模拟与智能体AI模型

技术的未来并非止步于创造,而在于赋能更多创造者,让他们共同书写无限可能。 技术的未来并非止步于创造,而在于赋能更多创造者,让他们共同书写无限可能。 技术的未来并非止步于创造,而在于赋能更多创造者,让他们共同书写无限可能。
- Advertisement -

更多相关文章