OpenAI震撼发布了大型多模态模型GPT-4,支持图像和文本的输入,并生成文本结果。OpenAI老板Sam Altman直接开门见山地介绍说:这是我们迄今为止功能最强大的模型!
GPT-4在性能表现上,OpenAI直接甩出一句话:在各种专业和学术基准上和人类相当!而且不只是发布GPT-4这么简单,OpenAI这次还有一系列大动作:
1、ChatGPT Plus:集成GPT-4的ChatGPT升级版
2、发布GPT-4的API
3、公布技术论文 * 公开System Card
不仅如此,传闻的“必应早就用上了GPT-4”在今天也得到了微软方面的证实:没错!确实是这样!
正如之前传言,GPT-4 是一个大型多模式模型,能够处理文本和图像输入,并提供准确的文本响应。实验结果表明,GPT-4 在各种专业测试和学术基准测试中的表现与人类表现相当。例如,它通过了模拟律师考试,分数在考生中排名前 10%,而 GPT-3.5 分数在考生中排名后 10%。
在 6 个月的时间里,OpenAI 使用对抗性测试程序和从 ChatGPT 中获得的见解迭代调整 GPT-4,在真实性和可控性方面取得了有史以来最好的结果。“我们花了6个月的时间使用我们的对抗性测试程序,以及在ChatGPT身上累积的经验教训来迭代调整GPT-4,从而在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果。”OpenAI称。“我们的 GPT-4 训练运行(至少对我们而言!)前所未有地稳定,成为第一个我们能够提前准确预测其训练性能的大型模型。”
在过去两年中,OpenAI 重建了其整个深度学习堆栈,并与 Azure 合作从头开始为其工作负载设计了一台超级计算机。一年前,OpenAI 在 GPT-3.5 训练期间首次尝试运行这个超级计算系统,此后发现并纠正了错误,完善了其理论基础。这些改进的结果是训练 GPT-4 前所未有的稳定性,使 OpenAI 能够准确预测其训练性能,使其成为第一个实现这一壮举的大型模型。OpenAI 表示,它将继续专注于可靠的扩展和改进其方法,以帮助实现更强大的预测性能和未来规划,这对安全至关重要。
OpenAI 正在通过 ChatGPT 和 API发布 GPT-4 的文本输入功能。对于图像输入功能,OpenAI 正在与其他公司合作以提高可用性。OpenAI 还开源了 OpenAI Evals,这是一个用于自动 AI 模型性能评估的框架。OpenAI 表示,这是为了让任何人都能识别其模型中的缺陷并帮助进一步改进它们。
有趣的是,GPT-3.5 和 GPT-4 之间的差异很微妙。当任务复杂性达到某个阈值时,差异就会出现,此时 GPT-4 被证明更可靠、更具创造性,并且能够处理更细微的指令。OpenAI 在各种基准测试和一些为人类设计的模拟上进行了实验,以了解两种模型之间的差异。
另外,微软营销主管在 GPT-4 发布后第一时间表示:「如果你在过去六周内的任何时候使用过新的 Bing 预览版,你就已经提前了解了 OpenAI 最新模型的强大功能。」是的,微软的新必应早就已经用上了GPT-4。OpenAI 内部也在使用 GPT-4,因此 OpenAI 也在关注大型语言模型在内容生成、销售和编程等方面的应用效果。OpenAI 还使用 GPT-4 辅助人们评估 AI 输出,这也是 OpenAI 对其策略的第二阶段。OpenAI 既是 GPT-4 的开发者,也是使用者。
部分来源:机器之心、量子位
您想入驻成为Tech+技术加大咖?获取更多数字化案例&研究报告?寻求合作?赶紧扫码咨询,同时您也可扫码申请加入企业数字化精英社群,链接10000+优质CXO资源、参与高质高频线上线下活动、精准对接创新技术、发现职业新机遇.......