初创公司发布Mercury首款商用级扩散语言模型上线

必读文章
邓嘉豪https://www.aistar.news
专注于人工智能和网络安全领域,爱好侦探小说,善于将枯燥的技术内容包装成引人入胜的故事。

硅谷新锐Inception推出了全球首个商用级扩散大型语言模型Mercury,这一里程碑式的成果标志着生成式人工智能(AI)领域的又一次重大飞跃。凭借革命性的技术架构,Mercury展示了在速度、成本效率以及文本和代码生成智能上的显著优势,重新定义了大型语言模型(LLM)的商业应用标准。

Mercury系列扩散大型语言模型通过突破性的性能,将AI技术提升至一个新高度。根据Inception的测试数据,其模型在常规NVIDIA H100 GPU硬件上实现了每秒生成超过1000个标记(token)的惊人吞吐量。这一成果不仅使Mercury运行速度较传统自回归LLM快了5至10倍,还打破了以往只有Groq、Cerebras等定制硬件才能支撑的性能上限。此举大幅降低了计算成本,为客户部署生成式AI解决方案提供了极高的可行性。

不同于现在广泛使用的基于自回归的LLM,Mercury采用了一种全新的扩散模型架构。传统自回归模型以逐字生成文本,计算成本高且存在延迟,尤其在复杂推理与错误修正任务中表现疲软。而扩散模型通过从粗略预测到逐步优化的“粗到精”过程,能够并行生成并更新多个标记,大幅提升了文本生成的逻辑性、连贯性和准确性。这项技术在生成图像、音频和视频领域已经取得了成功,然而在离散数据(如文本与代码)领域的应用一直未被攻克,直至Inception的首创性突破。

Inception推出的旗舰产品Mercury Coder表现尤为突出,其专为代码生成任务进行了优化,速度与性能双双领先行业标准。在开发者代码推荐赛场Copilot Arena中,Mercury Coder Mini脱颖而出,荣获亚军,并超越了广受好评的GPT-4o Mini和Gemini-1.5-Flash。更令人瞩目的是,其生成速度比GPT-4o Mini快近4倍,这种高效、高质的编码能力使其在标准编码基准测试中多次胜过市场上的顶尖模型。

Mercury 扩散模型以其高适配性著称,可无缝充当传统自回归模型的替代品,适用于检索增强生成(Retrieval-Augmented Generation)、工具集成以及基于代理的工作流程等多种场景。其并行优化策略保证了生成内容的精准性,尤其适合对速度与精确度要求极高的企业环境、API 整合及本地部署需求。

Mercury 的研发团队由一批来自斯坦福大学、加州大学洛杉矶分校(UCLA)和康奈尔大学的 AI 先锋组成,这些专家曾主导多个 AI 领域的开创性成果,包括图像扩散模型、Flash Attention 以及 Direct Preference Optimization 等技术。此次推出的 Mercury,不仅凝聚了团队丰富的学术研发背景,还展示了他们在前沿技术向商业应用转化中的非凡能力。

Mercury 的发布无疑标志着企业级 AI 性能迈入了新纪元,以极致的效率和成本效益拓宽了生成式 AI 的商业应用边界。Inception 成功将扩散模型引入文本与代码生成领域,掀起了一场技术与产业的变革,为新一代智能应用奠定了坚实的基础。

通过这次技术革新,Inception团队再次证明了他们在AI领域的领先地位,成为行业生态内不可忽视的中坚力量。


您的浏览器不支持视频标签。https://www.aistar.news/wp-content/uploads/2025/03/1835_100.mp4

[AI之星网出品] [斯坦福AI团队研发] [扩散模型技术应用] [大型语言模型商用突破] [代码生成效率提升] [机器姬][真机智能][机器洞察网][AI之星网][风投高科网][猛虎财经网][硅基科学网]

  1. Mercury肩负的不仅是技术使命,还有改变普通人生活方式的可能性,历史会记住这一天!

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisement -
最新新闻

Robbyant开源LingBotWorld实时交互模拟与智能体AI模型

技术的未来并非止步于创造,而在于赋能更多创造者,让他们共同书写无限可能。 技术的未来并非止步于创造,而在于赋能更多创造者,让他们共同书写无限可能。 技术的未来并非止步于创造,而在于赋能更多创造者,让他们共同书写无限可能。
- Advertisement -

更多相关文章