大模型厂商MiniMax近日宣布正式开源生产级办公文档引擎Office Skills,基于MIT协议,旨在让AI生成的Word、Excel、PPT和PDF真正达到“直接交付”标准。这一动作标志着AI办公从“生成可用”向“专业交付”的关键跃迁。
底层重构:XML层面“手术”替代传统库
针对传统Python库在处理复杂格式时的“静默丢弃”问题,MiniMax在技术选型上采取硬核路线。
在Excel处理上,团队摒弃了openpyxl,选择直接在XML层面进行“手术级”操作——通过解压、修改特定节点再重包的方式,确保数据透视表、VBA宏和复杂公式原封不动。Word处理则弃用轻量级的python-docx,转而采用微软官方维护的.NET OpenXML SDK,实现了对嵌套表格、页眉页脚及修订追踪的完美支持。
PDF与PPT方面,MiniMax采用“双引擎”拆分策略:PDF封面由HTML+CSS渲染保证设计感,正文由ReportLab负责稳定性;PPT则预设四套视觉“配方”,确保风格全局统一。
自进化机制:AI学会“自我纠错”
Office Skills的核心亮点是一套名为Execute → Evaluate → Fix的自进化机制。当AI生成文档失败时,系统会自动捕捉结构、公式或版式上的错误,并将其沉淀为修复案例进行迭代。
这种机制让AI在处理真实办公场景时越跑越稳——无论是高端Omakase的日料菜单,还是投行级别的金融报表,AI不再只给出“Demo”,而是交付逻辑闭环、格式合规的最终成品。
M2.7模型在GDPval-AA评测中的ELO得分达到1495,为开源模型最高。在包含40个复杂Skills(单个超2000 Token)的场景下,模型仍能保持97%的指令遵循率。
从“提示词工程”到“SOP封装”
此前,MiniMax已推出Expert2.0功能,实现从“提示词工程”向“自然语言定义SOP”的范式转变。用户无需配置复杂的Skill或MCP协议,仅通过自然语言描述任务目标,系统即可自动完成工具编排与能力配置。
同步上线的MaxClaw云端助手,则解决了本地部署门槛问题,为订阅会员提供50G专属云存储及预置专家级Skill,打通飞书、钉钉、Telegram等主流IM渠道。
行业意义:办公Agent告别“草台班子”
随着Office Skills的开源,办公Agent赛道正从“草台班子”时代迈向专业化交付。这套能力让AI能够自主处理500张电商图片的分类归档、跨源检索20所北美名校校招信息、逐版对比药品管理法条例差异等复杂任务。
MiniMax内部甚至已让M2.7参与优化自身——模型自主运行“分析失败轨迹→规划改动→修改代码→运行评测”的迭代循环超100轮,最终让评测集效果提升30%。当一个模型开始学会自己迭代自己,AI办公的齿轮已然换上了自动挡