逻辑推理能力堪比博士生,OpenAI发布全新AI模型系列: o1 - 大模型或许进入新阶段
余生H 2024-10-17 15:01:06 阅读 53
个人是真的很兴奋,逻辑推理一直是大模型不擅长的部分,经常会出现自我矛盾和简单错误。一直在想着如何构建一个专注于逻辑推理的模型,然后外挂一个高效的知识库,肯定无敌。但没想到O1横空出世了
效果还有待实测,其实我个人是不建议花太多精力在安全性等方向的,AI或许没那么危险。
推荐下我的解密边读边解文: 解密OpenAI o1是如何让LLMs获得逻辑推理能力的 - CoT * RL-CSDN博客
OpenAI发布全新AI模型系列:o1
2024年9月12日,OpenAI宣布推出新一代AI模型系列o1,这是一种专注于复杂推理能力的全新模型。以下是o1的主要特点和信息:
核心特性
1. 增强推理能力: o1模型经过训练,能够在回答问题前进行更深入的思考,类似人类的思维过程。
2. 卓越的科学和数学能力: 在物理、化学、生物等领域的基准测试中,o1的表现堪比博士生水平。在国际数学奥林匹克竞赛(IMO)的资格考试中,o1正确解决了83%的问题,远超GPT-4o的13%。
3. 优秀的编程能力: 在Codeforces竞赛中,o1达到了89百分位的成绩。
4. 安全性提升: 通过新的安全训练方法,o1能更好地理解和应用安全规则。在一项严格的"越狱"测试中,o1-preview得分84分(满分100),远高于GPT-4o的22分。
产品线
1. o1-preview: 主力模型,具备强大的推理能力和广泛的知识储备。
2. o1-mini: 专为编程优化的小型模型,速度更快,成本更低(比o1-preview便宜80%)。
使用方式
- ChatGPT Plus和Team用户可立即在ChatGPT中使用o1模型。
- ChatGPT Enterprise和Edu用户将于下周获得访问权限。
- 符合条件的API开发者可以开始在API中使用这些模型进行原型开发。
- OpenAI计划未来向所有ChatGPT免费用户开放o1-mini的访问权限。
OpenAI表示,这只是o1系列的早期预览版本。他们计划继续改进模型,添加网页浏览、文件和图像上传等功能,以增强其实用性。同时,OpenAI也将继续开发和发布GPT系列模型。
这一发布标志着AI技术在复杂推理任务方面取得了重大突破,有望在科研、编程和数学等领域带来显著影响。
原文地址,如果需要翻译,可以留言,本文仅仅是简要的介绍和个人想法 //https://openai.com/index/introducing-openai-o1-preview/
http://xn--https-kt3b//openai.com/index/introducing-openai-o1-preview/%E2%80%8B
思考快与慢
不知道你发现过没有,反正我发现,有时候我说话的时候,比思考会快很多,很多话像不经过大脑就冒出来了,这时候虽然在侃侃而谈,但经常会忽略别人的感受。后面我也不怎么爱说话了,直到看了一些书,懂了些东西,其中就包括一本书《思考快与慢》
关于这本书
《思考,快与慢》是心理学家丹尼尔·卡尼曼(Daniel Kahneman)于2011年出版的一本书。书中探讨了人类思维的两种主要模式:系统1和系统2。
系统1:快速、直觉、自动化的思维模式。这种思维方式快速而不费力,通常在面对简单问题或需要快速反应时运作,例如识别面孔或完成简单的数学运算。
系统2:慢速、理性、需要努力的思维模式。这种思维方式用于解决复杂问题,需要深入分析和推理,例如制定计划或解决复杂的数学问题。
卡尼曼在书中探讨了这两种思维模式如何影响我们的决策和判断,以及它们可能带来的偏见和错误。通过一系列心理学实验和研究,作者揭示了人类思维中的各种认知偏差,并讨论了这些偏差如何影响个人和社会决策。
我的尝试
最近我一直在用多个模型来模拟思考的过程,参考这本书的简单成功:直觉系统-理性系统,搭建一个能自我反思的系统:多个llm+内存记忆+裁决者+rag。但是没想到O1突然出现了,它能够自我反思,而且数据面的表现很惊人,具体效果待后续实测。真的很兴奋
智能究竟是什么
新模型的表现优异就在逻辑推理方面,我觉得这才是智能的真正体现。
今天上班的路上,我想了很多,就将一个简单的:
知识(有限的设定)
1+1 = 2, 2+1 =3 .... 9+1 = 10 , 101 = 100 + 10 +1 ,11 * 3 = 11 + 11 + 11
智能(无限的推理)
12313131321 + 12313131 = ??
真正的智能应该是有非常高的推理能力的,就像学了乘法表,就能计算所有的数学四则运算。学会了部分物理公式,就能推导出很多的定理,然后根据结果思考它的真实表现。这才是真的智能啊!!
冷静
不要恐惧
AI没有想象中那么糟糕,人总是会有危机感,因为我们无法知道别人的想法,总是觉得不踏实,不要恐惧,自在的踏入雨夜、进入未来:福兮祸之所倚,祸兮福之所寄。万事万物都有两面性,只是现在的你,或与没发现:所获之物都是有代价的,人生或许就是获取享受和失去
机遇
一个超强的逻辑模型如果出现,那必能创造一系列的新事物,尤其是给它与现实交互的能力之后,这相当于给死气沉沉的现在一针强心针,毕竟A股基金表现已经那么糟糕了。
思考
人类的角色在人类社会中是不可或缺的,要相信自己,努力尝试和学习新事物,它就能为你所用,不要迷信别人口中的“科技”,相信你掌握的科技!
最后,祝大家都能在新时代找到自己的节奏和大道,更好的了解自己、享受生活。
不要忘了休息哈~做个眼保健操吧,后续我体验后会出代码例子等,希望别让我失望!
2Cy
YU.H
午休前、摸鱼急书
声明
本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。