AI智能总结
桑基韬1,2于剑1,21(北京交通大学计算机学院北京100044)2(交通数据分析与挖掘北京市重点实验室(北京交通大学)北京100044)(jtsang@bjtu.edu.cn) ChatGPT: A Glimpse into AI’s Future Sang Jitao1,2and Yu Jian1,21(School of Computer and Information Technology,Beijing Jiaotong University,Beijing100044)2(Beijing Key Laboratory of Traffic Data Analysis and Mining(Beijing Jiaotong University),Beijing100044) AbstractChatGPT has been a significant breakthrough and drawn widespread attention. ChatGPT’s role in AIdevelopment and its future impact is examined in this paper. We first introduce ChatGPT’s exceptional dialoguegeneration capabilities, enabling it to handle nearly all natural language processing tasks and be applied as a datagenerator, knowledge mining tool, model dispatcher, and natural interaction interface. We then analyze ChatGPT’slimitations in factual errors, toxic content generation, safety, fairness, interpretability, and data privacy, and discussthe importance of clarifying its capability boundaries. After that, we analyze the concept of truth and explain whyChatGPT cannot distinguish truth from falsehood from the non-equivalence of three references. In discussing AI'sfuture, we analyze mid-to-short term technological trends and the long-term development path from the relationshipbetween perception, cognition, emotion, and behavioral intelligence. Lastly, we explore ChatGPT’s potential impacton cognitive cost, education, Turing Test understanding, academia’s opportunities and challenges, informationcocoons, energy and environmental issues, and productivity enhancement. Key wordsChatGPT;AI development;dialogue generation;technical challenge;trustworthy AI;social impact 摘要在人工智能领域,ChatGPT作为一种重要的技术突破,引起了广泛的关注.本文将探讨ChatGPT在人工智能发展中的地位及其对未来AI的影响.首先,介绍了ChatGPT所展现出的优秀对话生成能力,使其几乎可以胜任所有自然语言处理任务,并将作为数据生成器、知识挖掘工具、模型调度员、自然交互界面在各种场景得到应用.接着,分析了其在事实错误、毒害内容生成、安全性、公平性、可解释性、数据隐私等方面的局限,并讨论了作为辅助人类工具的ChatGPT明确能力边界和提高能力范围的重要性.然后,从概念经典表示对“真”定义进行了分析,并从概念三指不等价的角度阐释性了ChatGPT无法区分真假的原因.在论述AI未来时,从拓展应用、克服局限、探索理论分析了中短期技术趋势,并从感知、认知、情感、行为智能四个层面的关系讨论了长期发展路径.最后,探讨了ChatGPT作为认知智能的代表,对包括认知成本、教育要求、图灵测试认识、学术界的机遇与挑战、信息茧房、能源环境问题和生产力提升等方面可能产生的影响. 关键词ChatGPT;人工智能发展;对话生成;技术挑战;可信AI;社会影响 中图法分类号TP391 2022年11月30日 ,OpenAI公 司 发 布 了 一 款 名为ChatGPT的软件.该软件在发布后的5天内,用户数量就超过了100万,2个月内活跃用户数更是突破了1亿,成为了迄今为止增长速度最快的应用软件.该 软 件 几 乎 可 以 完 成 自 然 语 言 处 理 的 所 有 任 务 , 因此在营销、客服、教育、娱乐、咨询、翻译等行业有着广阔的应用前景.这一成功也激励了OpenAI首席执行官Sam Altman,他于2023年2月24日发表了一篇 名 为“Planning for AGI and Beyond”的 文 章 , 认 为AGI(artificial general intelligence,通用人工智能)是AIsystems that are generally smarter than humans, 需 要 为AGI的到来做准备①. AGI会是AI的未来吗?本文将对此进行讨论. 这种模型在处理语言生成问题方面具有天然的优势.所以ChatGPT可以处理以前不同赛道的语言处理任务,比如翻译、问答、摘要、扩写、写作、润色、代码生成、语句分析、段落理解等. 当然,ChatGPT能够实现如今顺畅自然的人机对话,不仅源于其对GPT语言生成技术路线的持续发展,还依赖于算法、算力和数据等多方面的支持.由于ChatGPT并 未 开 源 , 也 没 有 发 布 论 文 透 露 具 体 细节,我们只能基于OpenAI已公开的GPT系列技术发展路线来推测这些能力背后的潜在原因.图1展示了部分ChatGPT已展现出的能力及其背后主要技术原因的对应关系.值得关注的是,ChatGPT许多能力背后的原因仍在探索过程中.关于上下文学习的能力,有学者认为模型从提示词(prompt)提供的示例中确定了待解决任务的自然语言指令(instruct),从而在无需微调模型的情况下提升了问题回答的质量[2].关于任务涌现和多任务迁移能力,一方面,有学者认为指令学习、大规模预训练和数据集多样性共同促进了模型在新任务的泛化能力[3].例如,通过在大量不同类 型 和 指 令 任 务 上 进 行 微 调 , 模 型 学 习 到 了 一 定 程度 的 通 用 能 力 , 从 而 能 够 泛 化 到 未 见 过 的 指 令 和 场景.另 一 方 面 , 不 同 任 务 的 划 分 具 有 一 定 的 主 观 性 ,其 本 质 上 都 可 以 建 模 为 统 一 的 自 然 语 言 生 成 任 务.大 型 预 训 练 语 言 模 型 通 过 学 习 大 量 训 练 数 据 , 掌 握了 丰 富 的 语 言 知 识 和 多 种 任 务 之 间 的 共 性 , 进 而 利用这些共性来提高不同任务的性能.然而,一些问题仍然没有明确答案,例如:何种模型规模和训练数据量阈值可以产生任务涌现能力?涌现能力与模型规模 和 训 练 数 据 量 之 间 的 量 化 关 系 如 何 ? 同 时 , 其 他 1ChatGPT的“能”:生成 比尔盖茨将ChatGPT誉为自1980年现代图形桌面 环境GUI问 世 以 来 最 具 革 命 性 的 科 技 进 步.如 果说上一次让AI火出圈的AlphaGo所展现出的是在特定领域的“专”,这一次ChatGPT展现出的则是AI在广 泛 应 用 场 景 的“通 ”: 这 个 “通 ”以 正 常 人 都 会 、 都懂、都能体验的对话形式呈现,让AI——特别是自然语 言 处 理 技 术 进 入 主 流 用 户 群 , 孕 育 出 了 这 一 现 象级产品.具体而言,ChatGPT在对话过程中展现出了自然对话、多轮交互、上下文学习、思维链推理、实时 反 馈 在 线 纠 错 、 能 适 应 未 训 练 任 务 以及GPT-4中新出现的理解弦外之音的能力. ChatGPT背后的思想其实很简单:将所有语言任务 归 为 对 话 任 务 , 并 将 对 话 任 务 归 为 文 字 接 龙 的 生成 问 题.自 然 语 言 处 理 领 域 的 学 者 普 遍 认 为 ,ChatGPT展现出的优秀对话生成能力对传统研究方法产生了巨大挑战. 1)从目标上看,自然语言处理旨在让计算机能够以文字或语音的方式与人类进行有效 交 流 ; 而 对 话 是 人 类 日 常 生 活 中 最 基 本 的 交 流 方式,如果实现了人机自然对话,在一定程度上便达到了自然语言处理的核心目标. 2)从任务类型上看,自然语言处理可分为自然语言理解和自然语言生成两大类.在谷歌的T5模型[1]推出之后,两类任务统一为单项语言生成的文字接龙形式.自GPT-1起,OpenAI就一直坚持采用基于解码器结构的自回归语言模型, 料中的规律,能够学习到词汇、语法、乃至一定程度的上下文和常识知识.问题是:随着语料规模的不断增 加 和 统 计 规 律 的 持 续 积 累 , 模 型 所 建 立 的 世 界 表达分辨率越来越高、维度越来越丰富时,是否真的有可能学习到人类情感、道德观念等支撑整个世界运行的更复杂的暗知识? 一些能力,如在线纠错、理解弦外之音等,其背后的原因仍然有待发现. OpenAI首 席 科 学 家llya Sutskeve最 近 在 与 英 伟达首席执行官黄仁勋的访谈中对ChatGPT能力学习进行了解释:“ChatGPT通过学习文本中的统计相关性,获得了这个世界的一个压缩、抽象、可用的映射表达”.这让我们不禁思考:ChatGPT是否学到了人类文 字 符 号 世 界 的 暗 知 识(tacit knowledge)[4]. MichaelPolanyi在 他 的 认 识 论 著 作 中 曾 提 到 : “We can knowmore than we can say(我们所知者,远多于所能说者)”.可 以 确 定 的 是 : 机 器 学 习 模 型 通 过 统 计 海 量 符 号 语 在学术界积极探索ChatGPT能力背后的技术原因的同时,工业界已在欢迎这项新技术,并将其优秀的 对 话 生 成 能 力 融 入 各 种 应 用 场 景.根 据ChatGPT对 话 的 对 象 和 本 身 的 定 位 , 我 们 将 这 些 应 用 分成4个层次,如表1所示: 1)数据生成器.根据需求直接生成数据.此类应用 仅 输 入 用 户 需 求 , 利用ChatGPT的 生 成 能 力 返 回特定类型的数据.由于思路简洁且实现容易,数据生成 类 应 用在ChatGPT发 布 之 初 就 大 量 出 现.主 要 应用 场 景 包 括 对 话 生 成(客 服 、 虚 拟 数 字 人 )、 文 案 生成(法律文书、营销策划广告)和代码生成等.典型的成功案例包括写作助手Notion AI①、营销文案生成工具Jasper.ai②. 作为人类与其他模型间的连接,设计解决方案