逻辑推理能力堪比博士生，OpenAI发布全新AI模型系列： o1

逻辑推理能力堪比博士生，OpenAI发布全新AI模型系列： o1 - 大模型或许进入新阶段

余生H 2024-10-17 15:01:06 阅读 53

个人是真的很兴奋，逻辑推理一直是大模型不擅长的部分，经常会出现自我矛盾和简单错误。一直在想着如何构建一个专注于逻辑推理的模型，然后外挂一个高效的知识库，肯定无敌。但没想到O1横空出世了

效果还有待实测，其实我个人是不建议花太多精力在安全性等方向的，AI或许没那么危险。

推荐下我的解密边读边解文：解密OpenAI o1是如何让LLMs获得逻辑推理能力的 - CoT * RL-CSDN博客

OpenAI发布全新AI模型系列:o1

2024年9月12日,OpenAI宣布推出新一代AI模型系列o1,这是一种专注于复杂推理能力的全新模型。以下是o1的主要特点和信息:

核心特性

1. 增强推理能力: o1模型经过训练,能够在回答问题前进行更深入的思考,类似人类的思维过程。

2. 卓越的科学和数学能力: 在物理、化学、生物等领域的基准测试中,o1的表现堪比博士生水平。在国际数学奥林匹克竞赛(IMO)的资格考试中,o1正确解决了83%的问题,远超GPT-4o的13%。

3. 优秀的编程能力: 在Codeforces竞赛中,o1达到了89百分位的成绩。

4. 安全性提升: 通过新的安全训练方法,o1能更好地理解和应用安全规则。在一项严格的"越狱"测试中,o1-preview得分84分(满分100),远高于GPT-4o的22分。

产品线

1. o1-preview: 主力模型,具备强大的推理能力和广泛的知识储备。

2. o1-mini: 专为编程优化的小型模型,速度更快,成本更低(比o1-preview便宜80%)。

使用方式

- ChatGPT Plus和Team用户可立即在ChatGPT中使用o1模型。

- ChatGPT Enterprise和Edu用户将于下周获得访问权限。

- 符合条件的API开发者可以开始在API中使用这些模型进行原型开发。

- OpenAI计划未来向所有ChatGPT免费用户开放o1-mini的访问权限。

OpenAI表示,这只是o1系列的早期预览版本。他们计划继续改进模型,添加网页浏览、文件和图像上传等功能,以增强其实用性。同时,OpenAI也将继续开发和发布GPT系列模型。

这一发布标志着AI技术在复杂推理任务方面取得了重大突破,有望在科研、编程和数学等领域带来显著影响。

原文地址，如果需要翻译，可以留言，本文仅仅是简要的介绍和个人想法 //https://openai.com/index/introducing-openai-o1-preview/

icon-default.png?t=O83A

http://xn--https-kt3b//openai.com/index/introducing-openai-o1-preview/%E2%80%8B

思考快与慢

不知道你发现过没有，反正我发现，有时候我说话的时候，比思考会快很多，很多话像不经过大脑就冒出来了，这时候虽然在侃侃而谈，但经常会忽略别人的感受。后面我也不怎么爱说话了，直到看了一些书，懂了些东西，其中就包括一本书《思考快与慢》

关于这本书

《思考，快与慢》是心理学家丹尼尔·卡尼曼（Daniel Kahneman）于2011年出版的一本书。书中探讨了人类思维的两种主要模式：系统1和系统2。

系统1：快速、直觉、自动化的思维模式。这种思维方式快速而不费力，通常在面对简单问题或需要快速反应时运作，例如识别面孔或完成简单的数学运算。

系统2：慢速、理性、需要努力的思维模式。这种思维方式用于解决复杂问题，需要深入分析和推理，例如制定计划或解决复杂的数学问题。

卡尼曼在书中探讨了这两种思维模式如何影响我们的决策和判断，以及它们可能带来的偏见和错误。通过一系列心理学实验和研究，作者揭示了人类思维中的各种认知偏差，并讨论了这些偏差如何影响个人和社会决策。

我的尝试

最近我一直在用多个模型来模拟思考的过程，参考这本书的简单成功：直觉系统-理性系统，搭建一个能自我反思的系统：多个llm+内存记忆+裁决者+rag。但是没想到O1突然出现了，它能够自我反思，而且数据面的表现很惊人，具体效果待后续实测。真的很兴奋

智能究竟是什么

新模型的表现优异就在逻辑推理方面，我觉得这才是智能的真正体现。

今天上班的路上，我想了很多，就将一个简单的：

知识（有限的设定）

1+1 = 2， 2+1 =3 .... 9+1 = 10 , 101 = 100 + 10 +1 ，11 * 3 = 11 + 11 + 11

智能（无限的推理）

12313131321 + 12313131 = ？？

真正的智能应该是有非常高的推理能力的，就像学了乘法表，就能计算所有的数学四则运算。学会了部分物理公式，就能推导出很多的定理，然后根据结果思考它的真实表现。这才是真的智能啊！！

冷静

不要恐惧

AI没有想象中那么糟糕，人总是会有危机感，因为我们无法知道别人的想法，总是觉得不踏实，不要恐惧，自在的踏入雨夜、进入未来：福兮祸之所倚，祸兮福之所寄。万事万物都有两面性，只是现在的你，或与没发现：所获之物都是有代价的，人生或许就是获取享受和失去

机遇

一个超强的逻辑模型如果出现，那必能创造一系列的新事物，尤其是给它与现实交互的能力之后，这相当于给死气沉沉的现在一针强心针，毕竟A股基金表现已经那么糟糕了。

思考

人类的角色在人类社会中是不可或缺的，要相信自己，努力尝试和学习新事物，它就能为你所用，不要迷信别人口中的“科技”，相信你掌握的科技！

最后，祝大家都能在新时代找到自己的节奏和大道，更好的了解自己、享受生活。

不要忘了休息哈~做个眼保健操吧，后续我体验后会出代码例子等，希望别让我失望！

2Cy

YU.H

午休前、摸鱼急书

上一篇：人工智能发展的几点建议

下一篇：用亚马逊AI代码开发助手Amazon Q Developer开发小游戏（下篇）

本文标签

OpenAI发布全新AI模型系列： o1 - 大模型或许进入新阶段逻辑推理能力堪比博士生

声明

本文内容仅代表作者观点，或转载于其他网站，本站不以此文作为商业用途
如有涉及侵权，请联系本站进行删除
转载本站原创文章，请注明来源及作者。