2024年5月31日下午1点30分,中国科学院大学人文学院2024年第9期“科学与人文”讲座在中国科学院大学玉泉路校区人文楼教一2教室举行。北京理工大学薛少华副教授在题为“人工智能的具身—通用悖论”的学术讲座中,深入探讨了“具身通用人工智能”的概念及其实现的可能性和挑战。中国科学院大学人文学院苏湛副教授主持了本次讲座。
讲座开始,薛老师首先阐释了“具身通用人工智能”的基本概念。他指出,通用人工智能的定义一直是人工智能研究中的模糊领域。尽管通用人工智能长期以来没有统一的定义,但研究者通常将其视为一种能够执行广泛智能任务的系统。通用人工智能的追求是多样且复杂的,受到资本、技术及权力结构的深刻影响,形成了一种几乎是神话般的“圣杯”追求。
此外,薛老师详细介绍了“具身”这一概念,强调了物理身体与环境的互动是实现高级智能的关键。具身人工智能不仅理解信息,还能物理地与环境互动。这种互动能够解决人工智能系统的一些根本限制,特别是在处理现实世界问题时具有环境适应性和应用广泛性。现有的人工智能模型,尤其是大型语言模型如GPT系列,不仅能够基于现有数据生成文本、图像和音频,还能够通过“提示工程”理解并满足用户的具体需求,并在提供个性化体验方面展现出惊人的能力。但大型语言模型也面临一些困境,特别是在数据增长与模型效能提升之间不存在比例关系。另一方面,大语言模型在模拟世界方面,受到语言限制——人类很多知识无法用语言表达。
接着,薛老师引用了图灵的模仿游戏、冯•诺依曼体系架构,以及麦卡洛克和皮茨的神经元数学模型,来说明这些理论和方法如何为现代人工智能研究提供理论基础。
在讲座的第二部分,薛老师通过“随机鹦鹉”的比喻来解释当前人工智能的操作原理,如GPT系列能够生成语言和内容,但往往缺乏真正的理解和深度。这些系统更像是在庞大的数据池中找到最有可能的响应,而非真正理解语言。接着,薛老师介绍了辛顿的计算理念——“具身化的可朽计算”。这一概念强调软件与其承载的硬件之间的密切关联,类似于人类智慧与身体的不可分割性。在这种理念下,软硬件不再是分离的存在,而是必须共同进化和适应。辛顿认为,未来的计算将分为两种类型:一种是生物计算,这种方式可能带有生物体的偏见,并采用“知识蒸馏”式的知识传递;另一种是数字计算,它通过“权重共享”方式实现知识的精确传播。
之后,薛老师详细介绍了人工智能生成内容(AIGC)的技术基础。他特别提到GPT模型继承了转换器模型的自注意力机制和位置编码,这些都是其能够有效生成文本的关键技术。自注意力机制允许模型在生成文本时更加关注于文本中重要的部分,而位置编码则帮助模型理解单词在句子中的相对位置。
尽管生成式人工智能技术带来了许多创新,薛老师也指出了伴随这些进步而来的新问题。例如,在人机对齐的理想和现实之间,仍存在一些难以逾越的障碍。如何确保人工智能系统在遵循人类价值和伦理的同时,还能保持其操作的独立性和创造性,是一个需要持续研究和解决的问题。
薛老师还探讨了生成式人工智能在视频模型和世界模拟方面的应用。他提到了“恐怖谷”现象,这是一个在人工智能生成的图像和视频中常见的问题,当生成的内容接近真实,但仍有细微差异时,可能引起人类观察者的不适感和心理抵触。世界模拟器的概念也被提及,这是一种试图全面模拟复杂世界环境的技术。
在第三部分,薛老师介绍了四种意识理论,并提出人工意识的实现是一个引人注目的议题。他详细探讨了实现人工智能意识的多个方面,包括意识测定的难点、大模型的应用实践等。
在讲座的第四部分,薛老师引入了“电子游戏中的世界模拟”作为一种方案,用于测试和发展通用人工智能。他解释说,通过在控制的虚拟环境中进行模拟和试错,人工智能可以在没有现实世界风险的情况下学习和适应。这一点尤其在进行复杂决策和学习环境适应性时显得尤为重要。
最后,在具身—通用悖论部分,薛老师讨论了具身人工智能与通用的追求之间相互冲突的原因,详细回顾了当下的具身人工智能的研究现状,并介绍了吉布森环境等具体的技术概念。
在讨论环节,同学们就情感投射和通用人工智能的“通用”相关争论进行了提问,薛老师给出了详细的解释。最后,讲座在热烈的掌声中结束。
【图文/包傲日格乐】
【主讲人简介】
薛少华,北京理工大学教育学院副教授,科学技术与社会研究所副所长,中国人民大学哲学与认知科学交叉平台研究员,厦门大学游戏哲学研究中心研究员。若干人工智能、社交机器人等相关的参政咨询与报告被全国政协、北京市政协等采纳,目前主持国家社科基金1项。