响应快如闪电！谷歌发布 Gemini 3.1 Flash-Lite：首字提速 2.5 倍，算力成本再创新低_资讯

响应快如闪电！谷歌发布 Gemini 3.1 Flash-Lite：首字提速 2.5 倍，算力成本再创新低

作者：安安

 时间：2026-03-05 15:51:10

在人工智能赛道从“拼参数”转向“拼落地”的今天，谷歌再次投下了一枚深水炸弹。3月3日，谷歌正式推出 Gemini 3.1 Flash-Lite，这款号称“Gemini 3系列中速度最快、性价比最高”的轻量级模型，以令人咋舌的响应速度和近乎“骨折”的定价，重新定义了开发者大规模调用AI的成本边界。

“快”是第一标签：首字响应飙升2.5倍

对于追求实时交互的应用而言，延迟就是生命线。Gemini 3.1 Flash-Lite 此次最核心的突破便在于此。根据 Artificial Analysis 权威基准测试，与前代 2.5 Flash 相比，新模型的首字响应速度（Time to First Token）实现了 2.5 倍的爆发式增长。这意味着无论是搭建聊天机器人还是处理实时数据流，用户几乎感觉不到等待时间。

与此同时，模型的整体输出速度也同步提升了45%，实测输出速度高达每秒 363 tokens 。这一速度不仅是GPT-5 mini的5倍，更是Claude 4.5 Haiku的3.4倍。在同一任务测试中，2.5 Flash需要33分钟才能完成的工作，3.1 Flash-Lite仅用4分钟即可搞定，且正确率更高。

“省”到极致：把价格打到了“地板价”

在追求降本增效的当下，谷歌不仅给了开发者“跑车”般的速度，还附赠了“自行车”的油耗。

Gemini 3.1 Flash-Lite 的定价策略堪称激进：输入价格低至0.25美元/百万Token，输出价格为1.50美元/百万Token 。横向对比来看，这一价格仅为GPT-5 mini输出价格（2.00美元）的四分之一，更是比 Claude 4.5 Haiku（5.00美元）便宜了3倍多。用谷歌自己的话说，这是用“更大型模型的一小部分成本”，交付了“增强的性能” 。

“强”者越级：跑分干翻自家前辈

价格虽然“Lite”，但性能绝不“Lite”。Gemini 3.1 Flash-Lite 展现了惊人的“越级挑战”能力。

在最考验科学推理的 GPQA Diamond 测试中，它拿下了 86.9% 的高分，不仅碾压了同级别的 GPT-5 mini（82.3%），甚至将自家参数规模更大、价格更贵的 Gemini 2.5 Flash（82.8%）也甩在了身后。在多模态理解测试 MMMU-Pro 中，它同样以 76.8% 的成绩遥遥领先。

此外，该模型在事实准确性测试 SimpleQA Verified 中以 43.3% 的准确率形成断崖式领先，而在 Chatbot Arena 榜单上，它更是取得了 1432分的Elo评分，与 OpenAI 的旗舰推理模型 o3 打成平手。

会“思考”的模型：可调节的“思考层级”

除了硬核的跑分数据，Gemini 3.1 Flash-Lite 还带来了一项极具实用价值的新功能——“思考层级（thinking levels）” 。

这一机制允许开发者根据任务的复杂程度，灵活控制模型的“思考深度”。对于海量翻译、内容审核这类高频、成本敏感的基础任务，开发者可以调低思考深度，追求极致的速度和成本控制；而当面对生成用户界面、构建复杂数据看板或执行多步骤指令等高难度任务时，则可以调高思考层级，激发模型进行更深度的推理。这种“按需分配”算力的能力，被网友评价为“彻底改变了游戏规则” 。

落地场景：不仅是快，更是“万能打工人”

在实际演示中，Gemini 3.1 Flash-Lite 展现出了极强的场景适应能力。它可以在几秒内为一个空白的电商原型页面填充数百个包含名称、价格、分类的商品；能够结合实时天气预报接口和历史数据，动态生成可视化气象仪表盘；甚至可以构建处理多步骤任务的SaaS智能体，自动化处理客户工单。

目前，该模型已通过 Google AI Studio 的 Gemini API 向开发者提供预览版，企业用户也可通过 Vertex AI 平台接入体验。包括 Latitude、Cartwheel 在内的早期测试企业反馈称，该模型能以更大型模型的精度处理复杂输入，同时具备卓越的指令遵循能力。

当行业还在卷“谁更强”时，谷歌用 Gemini 3.1 Flash-Lite 划出了一条新赛道：谁能用最低的成本交付最高的质量，谁才是真正的赢家。对于全球数百万正在寻找“质价比”最优解的开发者来说，这道“闪电”来得正是时候。

分享到：

能说会唱还会耍宝！小米发布 MiMo-V2-TTS 大模型：方言、情感信手拈来

 2026-03-20
小米自研输入法曝光：内置大模型，支持“系统级”AI纠错

 2026-04-01
国内首款鸿蒙人形机器人亮相

 2025-11-03
疫情当下，化工业IT部门如何为企业赋能？

 2022-11-01
中国跨境电商的春天还有多远？

 2022-10-28
AI配音革命来了！腾讯黑科技让机器秒变金牌说书人

 2025-09-01

热门标签

能说会唱还会耍宝！小米发布 MiMo-V2-TTS 大模型：方言、情感信手拈来

小米自研输入法曝光：内置大模型，支持“系统级”AI纠错

国内首款鸿蒙人形机器人亮相

疫情当下，化工业IT部门如何为企业赋能？

中国跨境电商的春天还有多远？

AI配音革命来了！腾讯黑科技让机器秒变金牌说书人

Trae2.0重磅发布—一个具备上下文工程能力的系统

AI 提示词管理工具 AI Gist 正式上线

物流机器人时代要来了？！

字节跳动 AI 编程工具 TRAE 2.0 即将发布，新增语音交互功能

AI导游重塑文旅及物流消费体验

魔镜洞察

拜特科技

奇墨科技

致远互联

滴普科技

关于Tech技术加

快速导航

热门推荐

关注我们

微信在线客服

电话： +86 15618587198