您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[社会科学文献出版社&北京师范大学]:生成式人工智能产品发展报告(2024) - 发现报告

生成式人工智能产品发展报告(2024)

AI智能总结
查看更多
生成式人工智能产品发展报告(2024)

版权所有 社会科学文献出版社北京师范大学图书馆下载自皮书数据库,2025/05/19版权所有 社会科学文献出版社北京师范大学图书馆下载自皮书数据库,2025/05/19发的《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》也明确提出,教育领域需积极探索人工智能在线课堂、虚拟课堂、虚拟仿真实训、虚拟教研室、新型教材、教学资源建设、智慧校园等教育场景中的应用。①在此过程中,新一代生成式人工智能顺应了从弱人工智能向强人工智能转变的发展趋势,成为全球推行科技创新战略的焦点。首批11家国产大语言模型已经通过国家监管部门备案,②生成式人工智能的文本生成、语言理解、知识问答、逻辑推理等方面能力被证明在教育教学领域具有极大的应用潜力和价值。③(一)GAI 的发展历程近年来,生成式人工智能随着技术进步而迅猛发展。 2014年,生成对抗网络(GAN)的提出,推动了复杂数据分布的无监督学习; 2017年, Transformer架构引入注意力机制处理长序列数据,成为主流架构; 2022年,聊天生成预训练转换器( Chat Generative Pre-trained Transformer, ChatGPT)横空出世,生成式人工智 能( Generative AI, GAI)技 术 和“大 语 言 模 型”( Large LanguageModel, LLM)等概念也开始广为人知,发布5天后, ChatGPT注册用户超过百万,引起社会各界的广泛关注,人类也正式进入了GAI时代, GAI的浪潮持续推动技术与社会各领域产生重大变革; 2023年, OpenAI发布了GPT-4,进一步提 升 生 成 质 量 和 多 模 态 处 理 能 力; 2024年, OpenAI推 出 的GPT - 4o( GPT-4 Optimized)通过优化模型结构和训练方法,提高了生成质量和计算效率,标志着GAI在大规模应用中逐步走向成熟。④联合国教科文组织认为,351①②③④《科技部等六部门联合印发〈关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见〉》 , 《机器人技术与应用》2022年第5期,第2页。《11家AI大模型产品今日起将陆续上线,腾讯华为讯飞等也将开放》 ,经济观察网, 2023年8月31日, http:/ / www. eeo. com. cn / 2023 / 0831 / 603409. shtml。肖君、白庆春、陈沫、陆璐:《生成式人工智能赋能在线学习场景与实施路径》 ,《电化教育研究》2023年第9期,第57 ~ 63、 99页。Fiona Fui-Hoon Nah, et al. , “ Generative AI and ChatGPT: Appapplications, Challenges, andAI-human Collaboration,”Journal of Information Technology Case and Appapplication Research3(2023) : 277-304. 北京师范大学图书馆下载自皮书数据库,2025/05/19北京师范大学图书馆下载自皮书数据库,2025/05/19智慧学习蓝皮书GAI是一种根据自然语言对话提示词(Prompt)自动生成响应内容的人工智能技术。①国家互联网信息办公室将GAI定义为具有文本、图片、音频、视频等内容生成能力的模型及相关技术。(二)GAI 的多样化特征以大模型技术为核心的GAI不再仅限于传统的分析和建模功能,开启了AI在创作和创造方面的新纪元,这得益于其先进的算法与庞大的数据库,也使得其具备多种显著特征。首先, GAI模型规模庞大,通常包含百亿级别的参数和训练数据集,如GPT - 3的参数量达到了1750亿,训练数据量达到5000亿标记,这使得GAI能够利用大量语料库资料学习人类语言规则及其逻辑关系,生成符合人类语言习惯的新文本;其次, GAI展示出强大的技术能力,特别是在情景学习、思维链推理和多轮对话方面,能够将复杂问题分解为多个简单步骤,通过上下文感知提供连续对话的响应,并通过自然指令的学习不断强化自身能力;再次, GAI的训练方式也极为灵活,能够采用预训练加微调的灵活训练方式,解决深度学习模型在缺少大规模标注数据情况下的性能问题,预训练让其获得广泛的任务处理能力,而通过强化学习等方法进行微调则提升了GAI特定任务的内容生成质量和准确性;最后, GAI在多个领域展现出广泛的应用潜力,通过捕捉丰富的多领域知识, GAI能够处理和生成多种编程语言和自然语言文本,提供包括语言生成、翻译、文本摘要生成和代码生成等多项服务,其应用涵盖健康、医疗、教育、法律、金融和科学研究等领域,极大地推动了这些领域的智能化和自动化。③目前, GAI按输出结果可分为以下四类。一是生成式语言模型。生成式语言模型基于自然语言处理技术,通过学习大量文本数据中的语言规律和模式,生成新的连贯文本。这些模型通过捕捉文本中单词、短语和句子之间的关系,能够自动生成具有逻辑并语法正确的文①②③Miao F. C. , Holmes W. ,“ Guidance for Generative AI in Education and Research,”https:/ /unesdoc. unesco. org / ark:/ 48223 / pf0000386693.《生成 式 人 工 智 能 服 务 管 理 暂 行 办 法》 ,中 国 网 信 网,2023年7月13日,http:/ /www. cac. gov. cn / 2023-07 / 13 / c_1690898327029107. htm.刘邦奇、聂小林、王士进等: 《生成式人工智能与未来教育形态重塑:技术框架、能力特征及应用趋势》, 《电化教育研究》 2024年第1期,第13~20页。 版权所有 社会科学文献出版社版权所有 社会科学文献出版社②451 版权所有 社会科学文献出版社北京师范大学图书馆下载自皮书数据库,2025/05/19版权所有 社会科学文献出版社北京师范大学图书馆下载自皮书数据库,2025/05/19本。生成式语言模型的训练基于大规模的新闻文章、网页内容等文本数据集,通过学习这些文本数据中的语言结构和语义信息,形成对语言的理解,从而能够生成新的文本。 ChatGPT便是一个典型的生成式语言模型,它能够根据用户的输入生成自然流畅的对话内容,类似的产品还有文心一言、星火大模型等。这种模型可以应用于虚拟助理、智能客服和自动写作等场景,例如,用户输入一个问题, ChatGPT可以生成一个连贯且相关的回答,并根据提问者的追问不断修正答案。 2024年推出的GPT- 4o通过优化模型结构和训练方法,不仅大幅提升了生成质量和计算效率,还显著增强了多模态处理能力、上下文理解深度和个性化响应的准确性,使其在更广泛的应用场景中表现出色。二是生成式图片模型。生成式图片模型基于计算机视觉技术,通过学习大量图像数据中的特征和结构来生成新的图像。模型通过捕捉图像中的纹理、颜色、形状和物体之间的关系,能够生成具有视觉真实感 或艺术风格的新图像。生成式图片模型的训练通常基于大规模的图像数据集,如自然图像或艺术作品等,模型通过学习这些图像数据中的特征表示和统计规律,形成对图像的理解,从而能够生成新的图像。 MidJourney、 Stable Diffusion、 DALL-E、 PanGu-Draw、 Imagen、 Imagen 2、腾讯混元大模型以及华为的Pix Art-α等生成式图片模型,能够根据文本描述生成相应的图像。例如,输入“在火星上行走的一只猫” ,模型便可以生成一幅展示这一场景的图片。这种模型可以应用于课堂教学、广告设计、游戏开发和艺术创作等领域。三是生成式视频模型。生成式视频模型基于 深 度 学 习 和 计 算 机 视 觉 技术,通过学习视频数据中的帧序列和运动模式来生成新的视频。文生视频的研究始于图像生成,早期传统的图像生成技术主要依赖纹理合成、纹理映射等基于手工标注特征的方法,但这些传统方法难以生成复杂且自然的图像;生成对 抗 网 络( Generative Adversarial Networks,GANs )和 变 分 自 编 码 器(Variational Autoencoders, VAEs)的引入带来图像生成领域的重大转变,使得视频生成技术取得显著进步;随后,流模型和扩散模型等技术进一步增强了视频生成的细节和整体质量。生成式视频模型的训练基于大规模的视频数据集,模型通过学习这些视频中的时序信息和运动规律,形成对视频内容的理解,从而能够生成新的视频片段。 OpenAI推出了文生视频模型Sora,目前其能够根据用户指令生成时长一分钟的高质量视频, DeepMind的生成视频模型可以根551 北京师范大学图书馆下载自皮书数据库,2025/05/19北京师范大学图书馆下载自皮书数据库,2025/05/19智慧学习蓝皮书据几帧初始图像生成一个完整的视频。例如,输入几帧描述一个人跑步的图像,模型可以生成这个人连续跑步的完整视频。这种技术可以应用于视频编辑、虚拟现实和动画制作等领域。四是生成式声音模型。生成式声音模型基于深度学习和语音处理技术,通过学习大量音频数据中的频率、波形和音调来生成新的声音。模型通过捕捉音频中的时域和频域特征,能够生成具有自然听感的新音频。生成式声音模型的训练基于大规模的音频数据集,如音乐、语音和环境声音。模型通过学习这些音频数据中的特征表示和统计规律,形成对声音的理解,从而能够生成新的音频。 WaveNet、 Stable Audio Open、 MusicLM等生成式声音模型,都能够生成高质量的语音和音乐。例如,模型可以根据文本输入生成自然流畅的语音,应用于语音合成和智能语音助手等领域,此外,它还能生成逼真的音乐片段,用于音乐创作和声音设计。(三)GAI 作为新质生产力促进教育变革GAI的高智能性与多样性特征,将为新质生产力的发展提供强大驱动力。新质生产力作为当代最先进科技赋能的生产力,是在新技术、新产业和新模式驱动下形成的新的生产力形态,以人工智能技术造就的智能生产力为样态表征,呈现出主体劳动脑力化、劳动工具智能化、生产要素数字化的鲜明特征。①GAI通过其高效的算法,实现了数据的精细分析和供应链管理的数字化,突破了空间限制,优化了 资 源 配 置,提 升 了 劳 动 对 象 的 利 用 效 率;同时, GAI促进了创新驱动,以创新推动新质生产力的生成和产业结构的变革;此外, GAI还推动了智能装备和人工智能数字传感设备的应用,使得传统行业劳动者的技能通过技术改进得到显著提升,改进了新质劳动技能的应用能力。②GAI是新质生产力的重要组成部分,其发展也引起了国内外学术界的高度关注,研究者们通过探讨与实践GAI在教育领域的典型应用场景,进一步挖掘其在教育领域的潜力,为提升教育质量和培养创新型人才提供新的思①②肖峰、赫军营: 《新质生产力:智能时代生产力发展的新向度》 , 《南昌大学学报》(人文社会科学版)2023年第6期,第37 ~ 44页。郭晗: 《生成式人工智能助力新质生产力发展的价值意蕴、风险检视与制度构造》 ,《金融与经济》2024年第11期,第14 ~ 25页。 版权所有 社会科学文献出版社版权所有 社会科学文献出版社651 版权所有 社会科学文献出版社北京师范大学图书馆下载自皮书数据库,2025/05/19版权所有 社会科学文献出版社北京师范大学图书馆下载自皮书数据库,2025/05/19路, AI也从单纯的工具角色转变为教育者推动教育改革创新的可靠伙伴。图1生成式人工智能(GAI)在教育领域的应用GAI在教育领域展现出显著的应用潜力,涵盖教学、学习和教研等方面(见图1)。在教学方面, GAI可以实现智能备课、智能作业和智能答疑等,帮助教师高效生成教案、课件和情境图片,减轻备课压力,并提供即时的学生问题解答,极大地提升了教学效率和互动效果