读AI新生:破解人机共存密码笔记02进化
躺柒 2024-06-16 15:43:00 阅读 88
进化
1. 人工智能的标准模型
1.1. 机器优化人类提供的固定目标
1.1.1. 是一条死胡同
1.1.1.1. 当你走进死胡同时,你最好掉头返回,找出走错的地方
1.2. 问题不在于我们可能无法做好构建人工智能系统的工作,而在于我们可能太“成功”了
2. 智能
2.1. 我们称之为“大脑”的那一小堆几磅重的粉灰色胶状混合物是如何感知、理解、预测和操纵一个难以想象的浩瀚世界的?
2.1.1. 我们朝着解释大脑如何工作迈出的每一步,也同时是迈向在人工制品中创造大脑能力的一步,即迈向人工智能的一步
2.2. 智能是什么
2.2.1. 答案不在智商测试中,甚至不在图灵测试中,而是在我们的感知、我们的需求和我们所做的事情这三者之间的简单关系中
2.2.2. 如果一个实体是智能的,它就会根据它的感知来做事情,而它所做的事情是为了满足它的需求
3. 进化的起源
3.1. 大肠杆菌
3.1.1. 它的动作不会以任何方式依赖于它的环境
3.1.2. 它不会做任何决定,只是执行一种固定的行为,进化将这种行为植入了它的基因,但这并不是全部
3.1.3. 根据它感知到的情况(葡萄糖浓度不断升高),它所做的事情(游向葡萄糖)很可能满足它的需求(得到更多的葡萄糖)
3.1.4. 进化在大肠杆菌的基因中所建立的机制,就像在你的基因中所建立的机制一样
3.1.4.1. 通过这种机制,细菌的行为会随着它对环境的感知而变化
3.1.4.2. 进化事先不知道葡萄糖在哪里,也不知道你的钥匙在哪里,所以把找到葡萄糖和钥匙的能力放到生物体中,简直近乎完美
3.2. 动作电位
3.2.1. 这是一种电信号,大约10亿年前首次在单细胞生物体内进化出来
3.2.2. 后来,多细胞生物进化出一种叫作神经元的特殊细胞,这些细胞利用动作电位在生物体内快速传递信号,速度高达每秒120米(即每小时270英里)
3.2.3. 神经元之间的连接叫作突触
3.2.3.1. 突触连接的强度决定了有多少电刺激从一个神经元传递到另一个神经元
3.2.3.2. 动物通过改变突触连接的强度来学习
3.3. 最初,神经元形成了神经网络,这些神经网络分布在整个生物体中,用于协调各种活动
3.3.1. 水母之所以能优雅地推进是因为它们拥有神经网络,但水母根本没有大脑
3.4. 大脑中每个状态转换的“周期时间”只有几毫秒,虽然比电子电路速度慢,但是比大多数生物过程快得多
3.4.1. 我们对神经元和突触的生物化学知识以及大脑的解剖结构了解很多,但是认知水平的神经实现:学习、认知、记忆、推理、计划、决定等,对绝大多数人而言仍然是猜想
3.5. 在意识领域,我们确实一无所知
3.5.1. 人工智能领域没有人致力于让机器拥有意识,也没有人知道从哪里开始,而且没有任何行为是以意识为前提的
3.5.2. 所有关于机器神秘地变得有意识并憎恨人类的那些好莱坞电影情节其实都没有抓住要点
3.5.2.1. 重要的是能力,而不是意识
4. 奖励系统
4.1. reward system
4.2. 这是一个由多巴胺介导的内部信号系统,它将积极的和消极的刺激与行为联系起来
4.2.1. 它有内置的学习方法,因此随着时间的推移,我们的行为在获得奖励方面会变得更加高效
4.2.2. 它类似于人工智能领域开发的强化学习方法,对此我们有非常坚实的理论基础
4.3. 大脑的奖励系统就像大肠杆菌寻找葡萄糖的机制一样,是提高进化适应性的一种方式
4.3.1. 在寻求奖励方面更高效的生物体(例如寻找美味的食物、避免疼痛、进行Xin活动等)更有可能延续它们的基因
4.4. 某些获得奖励的方法可能会降低一个人基因延续的可能性
4.4.1. 如果直接用电流刺激你的奖励系统,你可能会不停地进行自我刺激,直到死去
4.5. 奖励信号和进化适应性之间的不一致并不只影响孤立的个体
4.5.1. 如果一个物种找到了一个生态位,但这个生态位满足其奖励系统的方式不利于进化适应性,那么这个物种就可能会灭绝
4.5.2. 除了这种意外的失败,生物体学习在自然环境中将奖励最大化,通常会提高它们延续自己的基因和在环境变化中生存下来的机会
5. 进化的加速器
5.1. 学习不仅对生存和繁衍有好处,还加速了进化
5.2. 学习不会改变一个人的DNA(脱氧核糖核酸),而进化则是一代又一代地改变DNA
5.3. 学习和进化之间的联系是由美国心理学家詹姆斯·鲍德温(James
Baldwin)和英国生态学家康威·劳埃德·摩根(Conwy Lloyd Morgan)在1896年分别提出的,但当时并未被人们普遍接受
5.4. 鲍德温效应
5.4.1. 进化可以选择创造一种依靠本能生存的生物体,或者创造一种依靠适应性生存的生物体
5.4.2. 前者的每一个反应都是预先确定的,而后者则可以通过学习来确定采取何种行动
5.4.3. 计算模拟表明鲍德温效应是真实存在的
5.5. 如果依靠适应性生存的生物体能够在学习中生存,那么学习能力就构成了进化的捷径
5.5.1. 文化的影响只会加速这一过程,因为有组织的文明不仅会在个体生物体进行学习的时候保护它,还会传递个体本来需要自己学习的信息
5.6. 内置的学习机制充其量只能粗略暗示特定行为在长期进化适应中产生的结果
5.6.1. 如果有一种导致生物体逃离潜在配偶、奔向捕食者的学习机制,那么它不会持续很久
5.7. 神经元具有学习和解决问题的能力,这在动物王国中非常常见
5.8. 进化并不真的在乎你是否拥有大脑或是否可以产生有趣的想法
5.8.1. 进化只把你当作一个智能体(agent),即某种会行动的东西
5.8.2. 逻辑推理、有目的的计划、智慧、机智、想象力和创造力等有价值的智力特征,可能是使智能体变聪明的必要条件,也可能不是
6. 一个人的理性
6.1. 从古希腊哲学的早期开始,智能的概念就与感知、推理和成功行动的能力联系在一起
6.2. 逻辑推理法
6.2.1. 在给出真实前提的情况下,人们通过逻辑推理可以得出真实的结论
6.3. 赌博在推广亚里士多德关于不确定性的建议中起了核心作用
6.3.1. 16世纪60年代,意大利数学家杰罗拉莫·卡尔达诺(Gerolamo Cardano)以掷色子游戏为主要例子,第一个提出了在数学上精确的概率论
6.3.2. 对赌局进行评估不能根据期望的货币价值,而是要根据预期的效用
6.3.2.1. 效用即对一个人有用或有益的属性,这是一种内在的、主观的数量,与货币价值有关,但与货币价值不同
6.3.3. 与货币金额不同的是,各种赌局和奖品的效用价值是无法被直接观察到的,只能从个人表现出的偏好中被推断出来
6.4. 效用理论的公理基础
6.4.1. 20世纪中叶,约翰·冯·诺依曼(John von Neumann,一位伟大的数学家,计算机领域标准的“冯·诺依曼体系结构”就是以他的名字命名的)和奥斯卡·摩根斯坦(Oskar Morgenstern)发表了效用理论的公理基础
6.4.2. 只要个体表现出的偏好满足任何理性主体都应该满足的某些基本公理,那么这个人所做的选择必然可以被描述为最大化期望效用函数
6.4.2.1. 理性个体的行为是为了最大化期望效用
6.4.3. 公理:传递性:如果你喜欢A甚于B,喜欢B甚于C,那么你喜欢A甚于C
6.4.4. 公理:单调性:假设买一种彩票可能得到奖品A,买另一种彩票可能得到奖品B,你喜欢奖品A甚于奖品B,并且你只可以选择这两种彩票,那么你会更倾向于选择得到奖品A的概率最高的彩票,而不是得到奖品B的概率最高的彩票
声明
本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。