全新升级下一代模型Gemini 15发布

必读文章
李悦欣https://www.aistar.news
关注人工智能和医疗机器人,迷恋陶艺创作,将科技与手工艺术结合,探索未来医疗的无限可能。

谷歌推出下一代AI模型Gemini 1.5:大幅提升性能,突破长上下文理解极限

谷歌及旗下人工智能研究公司DeepMind近日宣布推出其最新一代AI模型——Gemini 1.5,在多个核心维度上实现显著性能提升,同时在长上下文理解能力方面取得突破性进展。该模型不仅进一步优化了训练效率和运行效率,还为开发者和企业客户带来了一系列创新功能。

Gemini 1.5 是基于领先的 Transformer 和专家网络“Mixture of Experts (MoE)”架构,显著优化了学习复杂任务的速度和资源利用效率。MoE 结构通过激活最相关的微型专家神经网络,大幅提升模型的处理能力与灵活性。这一设计理念,使 Gemini 1.5 成为谷歌迭代速度更快、用户体验更高效的新典范。


相比前一代Gemini 1.0,Gemini 1.5在文本、代码、图像、音频和视频等多模态评估基准上表现更加优异,全面超越1.0 Pro的87%测试基准,并在与1.0 Ultra的对比中达到大致相当的性能水平。

Gemini 1.5 的另一大亮点是其长上下文处理能力。传统 AI 模型因上下文窗口受限,难以处理规模化信息,而 Gemini 1.5 Pro 通过一系列机器学习技术创新,将上下文窗口容量从之前的 32,000 Token 扩大至 128,000 Token,并在私人预览中支持高达 1 百万 Token。这标志着其成为首个在大规模基础模型中实现如此长上下文窗口的 AI 产品。

这一技术突破使Gemini 1.5能够高效处理长时间视频、多小时音频、大型代码库或数十万字的文本。例如,在解析阿波罗11号登月任务402页的对话记录时,模型可以准确分析并推理跨文档的关键事件和细节。此外,长上下文能力还让模型能够高效处理超过10万行代码的提示,提出更加实用的修改建议并解释代码功能。

谷歌研究团队甚至成功验证了该模型在实验环境中处理长达1千万Token的能力,进一步扩展了AI在解决复杂任务时的应用可能性。

Gemini 1.5 Pro在文本、代码、视频等多模态任务上的表现尤为出色。例如,在分析44分钟的无声视频时,模型能够精准捕捉关键剧情点和细微情节,为开发者、企业乃至更广泛的用户群体提供了更具扩展性的应用场景。

在代码任务中,Gemini 1.5 Pro通过结合长上下文学习技能,实现了更加精准的问题解决能力,尤其是在处理多个代码片段交互时。例如,面对百余行复杂代码,模型能够解释不同代码片段的相互作用机制,并提出优化建议。

更为引人注目的是,其强大的上下文学习能力使其无需额外微调,就能迅速适应新技能。例如,当模型接收到一段从未见过的语言(如濒危语言 Kalamang)的翻译提示数据时,能凭借所给信息以接近人类水平的效果完成翻译任务。

谷歌一直将 AI 安全与伦理置于技术突破的核心。在推出 Gemini 1.5 Pro 之前,研发团队强化了对潜在内容风险和表现偏差的评估机制,并以“红队化(Red-Teaming)”策略进行全面测试。此外,针对 1.5 Pro 独有的长上下文能力,团队正在开发新的评估标准,以确保其在各种复杂场景中的可靠性和安全性。

这一系列措施延续了谷歌在Gemini 1.0推出时的负责部署策略,并为即将到来的更广泛应用奠定了基础。

从即日起,有限的开发者和企业客户能够通过谷歌AI Studio和Vertex AI平台试用Gemini 1.5 Pro,并体验其多模态任务处理能力及突破性的长上下文功能。在测试期内,用户可免费体验支持1百万Token上下文窗口的实验功能,尽管


您的浏览器不支持视频标签。https://www.aistar.news/wp-content/uploads/2025/02/1515_100.mp4

[AI之星网出品] [多模态AI模型性能提升] [长上下文处理技术突破] [Gemini 1.5新功能与应用场景] [谷歌AI模型优化与安全性] [机器姬][真机智能][机器洞察网][AI之星网][风投高科网][猛虎财经网][硅基科学网]

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisement -
最新新闻

AI行业超级政治行动委员会2025年筹资1.25亿美元

“当创新成为国运的锚点,统一的监管犹如大厦之基,唯有和谐共振,方能领航未来。”
- Advertisement -

更多相关文章