OpenAI 发布o1系列模型,推理能力大幅提升 OpenAI发布最新版大模型OpenAI o1系列,o1回应用户问题之前会花更多时间思考再做出反应,推理能力大幅提升,尤其在解决科学、编码、数学和类似领域的复杂问题能力大幅提升。此次发布两个版本,OpenAI o1-preview和OpenAI o1-mini。在绝大多数推理能力较强的任务中,o1的表现明显优于GPT-4o。此次发布的版本为早期版本,还不具备ChatGPT的许多实用功能,例如浏览网页获取信息以及上传文件和图片。o1在尝试解决问题时会使用思路链,推理过程增加引入了reasoning tokens。通过强化学习,o1会训练其思路链并改进其使用的策略,同时能够识别和纠正错误,将棘手的步骤分解为更简单的步骤,能够在当前方法不起作用时尝试不同的方法,这个过程极大地提高了模型的推理能力。o1模型引入了reasoning tokens,模型使用这些reasoning tokens进行“思考”,分解对提示的理解并考虑多种生成响应的方法。生成reasoning tokens后,模型会生成输出,即可见的回答,并从其上下文中丢弃reasoning tokens。 OpenAI神秘新模型“草莓”将于两周内发布,建议关注后续发布进程。9月11日消息,OpenAI计划在未来两周内将Strawberry(草莓)作为ChatGPT服务的一部分发布。有网友发现ChatGPTPro会员已上线,售价200美元/月,推测或为即将上线的“草莓”而准备。与ChatGPT现有服务不同,Strawberry将作为ChatGPT的一个独立产品提供。Strawberry与其他模型的最大区别在于它能够在响应之前”思考“10-20秒,而非立即回答。目前更多关于“草莓”的细节被曝光:(1)只支持文本,没有图像功能;(2)专为复杂问题设计,无需思维链提示;(3)不仅能解决数学和编程问题,在商业任务上也表现更佳;(4)使用限制和更高定价。