DeepSeek-V3.1正式发布：国产大模型迈向Agent时代的新里程碑_资讯

DeepSeek-V3.1正式发布：国产大模型迈向Agent时代的新里程碑

信息科技

作者：安安

 时间：2025-08-25 10:56:20

谷歌芯片首秀(1)

2025年8月21日，国内人工智能企业深度求索（DeepSeek）正式推出了新一代大语言模型DeepSeek-V3.1。此次发布被视为该平台“迈向Agent时代的第一步”，在模型架构、推理效率和智能体能力等方面实现了显著突破。

01 混合推理架构，思考模式自由切换

DeepSeek-V3.1引入了创新的混合推理架构，使得单一模型同时支持“思考模式”与“非思考模式”。用户现在可以通过官方App与网页端的“深度思考”按钮，根据需求自由切换两种模式。思考模式致力于更深入、准确的推理，而非思考模式则追求更快的响应速度。这种设计让用户能够根据任务需求，在速度与精度之间灵活选择。

02 思维链压缩，效率大幅提升

经过思维链压缩训练，V3.1-Think在输出token数减少20%-50% 的情况下，各项任务的平均表现与前代R1-0528模型持平。在AIME 2015、GPQA、liveCodeBench等多项评测中，V3.1-Think保持了与R1-0528相当的性能水平，但token消耗量显著降低。效率提升意味着更快的响应速度和更低的计算成本。

03 智能体能力增强，工具使用更精准

通过后训练优化，DeepSeek-V3.1在工具使用与智能体任务中的表现有了较大提升。在编程智能体测试中，包括代码修复（SWE）与命令行终端环境下的复杂任务（Terminal-Bench）测试，V3.1相比之前的DeepSeek系列模型有明显提高。搜索智能体方面，在复杂搜索测试（browsecomp）与多学科专家级难题测试（HLE）上，V3.1性能已大幅领先R1-0528。

04 上下文扩展，支持128K超长文本

DeepSeek-V3.1的上下文窗口已从64K扩展到128K tokens，处理长文本能力大幅增强。128K上下文长度相当于约400页书籍的内容，使得模型能够处理更长的文档、更复杂的代码库以及更深入的多轮对话。这一升级让DeepSeek-V3.1在长文档摘要、代码库分析等需要大量上下文的任务中表现出色。

05 API升级与生态兼容性提升

DeepSeek API已同步升级，deepseek-chat对应非思考模式，deepseek-reasoner对应思考模式，且上下文均已扩展为128K。API Beta接口支持了strict模式的Function Calling，以确保输出的Function满足schema定义。同时，增加了对Anthropic API格式的支持，用户可以轻松将DeepSeek-V3.1的能力接入Claude Code框架。

06 模型开源，采用MIT许可证

DeepSeek宣布V3.1 Base模型与后训练模型已在Hugging Face与魔搭平台同步开源。V3.1的Base模型在V3的基础上额外训练了840B tokens。该模型采用UE8M0 FP8 Scale参数精度，对分词器及chat template进行了较大调整，与DeepSeek-V3存在明显差异。值得注意的是，此次开源采用MIT许可证，这是一个极为宽松的开源协议，允许自由商用。

07 专为国产芯片优化，推动算力生态

DeepSeek-V3.1采用了UE8M0 FP8 Scale参数精度，这一设计专门针对国产芯片优化。官方明确表示，这是为“即将发布的下一代国产芯片”量身定制的技术规范与设计标准。分析认为，这可能指的是华为昇腾910C芯片。此前，DeepSeek R2已经使用华为昇腾910B芯片替代了NVIDIA H100 GPU，使输出成本从每百万token 2.19美元降至0.27美元，降幅接近90%。

08 价格调整，9月6日起执行新标准

DeepSeek宣布将于北京时间2025年9月6日凌晨起，对API接口调用价格进行调整。调整内容包括执行新版价格表并取消夜间时段优惠。在9月6日前，所有API服务仍按原价格政策计费。官方表示，为更好地满足用户的调用需求，已进一步扩容API服务资源。

分享到：

Infosys高亮：引起互动的传播才能成就业务增长

 2022-11-01
HuggingFace推出小型智能机器人，五小时销售额超百万，299 美元起购

 2025-07-15
阿里夸克AI眼镜开启预售：支持支付宝“看一看”支付

 2025-10-27
马斯克罕见称赞谷歌：最有可能成为AI行业领先者，但xAI也不差！

 2025-08-14
官宣！第八届CDIE最靓“男神&女神”亮相！

 2022-10-28
「大模型 + NoETL = 万数皆可问！」3.14 上海，与头部企业共探 Chat 问数的落地之道

 2025-03-14

热门标签

01 混合推理架构，思考模式自由切换

02 思维链压缩，效率大幅提升

03 智能体能力增强，工具使用更精准

04 上下文扩展，支持128K超长文本

05 API升级与生态兼容性提升

06 模型开源，采用MIT许可证

07 专为国产芯片优化，推动算力生态

08 价格调整，9月6日起执行新标准

Infosys高亮：引起互动的传播才能成就业务增长

HuggingFace推出小型智能机器人，五小时销售额超百万，299 美元起购

阿里夸克AI眼镜开启预售：支持支付宝“看一看”支付

马斯克罕见称赞谷歌：最有可能成为AI行业领先者，但xAI也不差！

官宣！第八届CDIE最靓“男神&女神”亮相！

「大模型 + NoETL = 万数皆可问！」3.14 上海，与头部企业共探 Chat 问数的落地之道

Trae2.0重磅发布—一个具备上下文工程能力的系统

AI 提示词管理工具 AI Gist 正式上线

物流机器人时代要来了？！

字节跳动 AI 编程工具 TRAE 2.0 即将发布，新增语音交互功能

AI导游重塑文旅及物流消费体验

魔镜洞察

拜特科技

奇墨科技

致远互联

滴普科技

关于Tech技术加

快速导航

热门推荐

关注我们

微信在线客服

电话： +86 15618587198