近日,谷歌宣布其最新的Gemini2.5Flash-Lite模型进入稳定版本(GA)。这可是目前速度最快、成本最低的模型,标志着谷歌在人工智能领域又有了重要进展!
Gemini 2.5 Flash-Lite 模型经过精心设计,在性能与成本之间实现了完美平衡,且毫不妥协质量表现,尤其擅长执行分类、翻译等对延迟敏感的任务。相较于Gemini 2.0 Flash-Lite和Gemini 2.0 Flash两款模型,Gemini 2.5 Flash-Lite具有最低的延迟特性。该模型在Gemini 2.5系列中提供最具竞争力的接入成本,输入 tokens每百万仅需0.1美元,输出 tokens价格为0.4美元每百万。音频输入成本较预览版更大幅降低40%。
在核心功能方面,该模型在数学、科学、编程、逻辑推理及多模态理解等任务中展现出更卓越的性能表现。此外还具备百万token上下文窗口、可控思维预算等特性,并支持代码执行、谷歌搜索信息校验、URL上下文解析等工具功能。目前所有功能均已集成至Gemini 2.5 Flash-Lite正式稳定版,面向所有用户全面开放。仍在使用预览版的用户需注意,该版本将于2025年8月25日停止服务。
Gemini2.5Flash-Lite的发布,体现了谷歌在人工智能技术上不断创新和优化的决心,给开发者提供了更高效且经济实惠的选择,未来肯定会在很多应用场景中发挥大作用。