您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[南财智库]:生成式人工智能行业发展与监管白皮书:中国AI治理的独立思考 - 发现报告
当前位置:首页/行业研究/报告详情/

生成式人工智能行业发展与监管白皮书:中国AI治理的独立思考

信息技术2023-08-15南财智库杨***
生成式人工智能行业发展与监管白皮书:中国AI治理的独立思考

1访问21财经App智库频道获取更多报告 http://m.21jingji.com/thinktank 人工智能白皮书2访问21财经App智库频道获取更多报告 http://m.21jingji.com/thinktank oMoNrMnOsOpRqOsNmQrMbR9R8OnPnNoMsReRnNwOlOpOsP7NnMmQMYnOoQwMsOsQ1访问21财经App智库频道获取更多报告 http://m.21jingji.com/thinktank1956 年,在美国汉诺威小镇的达特茅斯学院,“人工智能”的概念被首次提出。此后 60 余年,人工智能从屏幕上显示的代码逐渐转化成实践应用。但人工智能的规模化商用并非坦途,概念的火热一直以来未能助推技术突破与商业应用。时间来到 2022 年,生成式 AI 发展为人工智能发展再注入一针强心剂。先是 Dall-E2、Midjourney、Stable Diffusion 等文生图应用引起广泛关注,接着 ChatGPT 横空出世,被视为通用人工智能的起点和强人工智能的拐点。作为里程碑式的技术进步,ChatGPT 将引发新一轮人工智能革命。人工智能发展似乎找到了自己的主流叙事。不过,技术创新的同时也带来了监管难题。如何平衡发展与安全,中国正在摸索自己的 AI 治理路径。在此环境下,身处其中的行业创新者、技术使用者,以及作为受众的社会公众,又该如何理解生成式 AI 发展的现状与前景,应对可能的风险与挑战?在此背景下,本白皮书将通过分析生成式 AI 的发展现状、政策导向、实操中面临的风险,以及各国的监管路径,以期为未来的 AI 治理提供有益思路。前言preface 人工智能白皮书2访问21财经App智库频道获取更多报告 http://m.21jingji.com/thinktank 【联合出品方】 南财合规科技研究院 观韬中茂律师事务所 【总统筹】 王俊 王渝伟 【撰写】 王俊 冯恋阁 郑雪 王渝伟 杨欣如 周丹 钱雨晴 温泳珊 林婉娜 罗洛 【设计】 设计统筹 林军明 林潢 封面/图表 黎旭廷 版式设计 陈国丽 【校对】 黄志明 3目录CONTENT第一部分 发展:生成式AI治理的第一视角 /2 1.1 生成式 AI 相关概念 /31.2 生成式 AI 发展现状 /4 1.2.1 算力 /5 1.2.2 大模型 /5 1.2.3 生成式 AI 应用市场 /81.3 关于生成式 AI 的中国思考 /8 1.3.1 探索优化应用场景 /9 1.3.2 加强基础技术的自主创新 /10 1.3.3 推动公共训练数据资源平台建设 /11 1.3.4 豁免责任 /11第二部分 风险:生成式AI治理的底线思维 /13 2.1 知识产权侵权风险 /13 2.1.1 著作权侵权 /13 2.1.2 侵犯商业秘密 /14 2.1.3 不正当竞争和反垄断风险 /14 2.2 算法风险 /15 2.2.1 算法黑箱风险 /15 2.2.2 算法歧视风险 /15 2.2.3 算法决策风险 /15 2.2.4 信息失真风险 /16 2.3 数据安全与个人信息保护风险 /16 2.3.1 个人信息保护 /16 2.3.2 数据跨境风险 /18 2.3.3 数据安全风险 /192.4 伦理道德风险 /20第三部分 借鉴:欧美生成式AI治理的观察 /213.1 美国 /21 3.1.1 关于人工智能的立法概况 /21 3.1.2 关于生成式 AI 应用的风险治理框架 /24 3.2 欧盟 /26 3.2.1 关于人工智能的立法概况 /26 3.2.2 关于生成式 AI 应用的风险治理框架 /28 3.3 关于美国与欧盟风险治理框架的评析 /31第四部分 实践:中国关于生成式AI治理的独立思考 /32 4.1 关于生成式 AI 的立法概况 /324.2 关于生成式 AI 应用的风险治理框架 /334.3 关于商业化应用中生成式 AI 风险治理的思考 /341 人工智能白皮书2访问21财经App智库频道获取更多报告 http://m.21jingji.com/thinktank第一部分发展:生成式AI 治理的第一视角2022 年 11 月,OpenAI 推出的聊天生成预训练转换器(ChatGPT)的爆火,带来了人工智能的“iPhone 时刻”。 该产品以强大的文字处理和人机交互功能迅速风靡全球。数据显示,发布五天内其用户量就达到了 100 万,并在短短 2 个月内用户量破亿,取得现象级战绩。 以 ChatGPT 等大语言模型为标志的生成式 AI 的成功,带来了新的范式革命和广阔的商业前景,资本市场持续高涨的热情也足以彰显它的价值。不过,一个硬币总有正反两面,生成式 AI 技术在为经济社会发展带来新机遇的同时,也引发了诸多舆论争议,带来了虚假信息传播、个人信息权益侵害、数据安全、偏见和歧视等问题。 事实上,全球正在进入“生成式 AI 革命风暴”,随之掀起的是新一轮的 AI 监管潮。 欧盟领先一步,《人工智能法案》进入最终谈判阶段。 系列迹象表明,美国政府最近也在紧锣密鼓地推进监管工作:6 月 20 日,美国总统拜登就会见了 AI 专家和研究人员,讨论如何管理 AI 在就业、儿童权益、偏见和成见以及信息方面带来的机 3访问21财经App智库频道获取更多报告 http://m.21jingji.com/thinktank会和风险。美国政府正在考虑为这项快速发展的技术制定具有法律约束力的规定。中国人工智能法草案也将提请全国人大常委会审议。在 4 月发布《生成式人工智能服务管理办法(征求意见稿)》并向社会公众征求意见后,7月13日,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局正式发布《生成式人工智能服务管理暂行办法》(以下简称《办法》)。至此,中国率先交出一份答卷,也可以视为“生成式 AI 时代”下中国关于 AI治理的独立思考。《办法》彰显了中国对以生成式 AI 为代表的通用人工智能产业治理的基本态度1。与征求意见稿相比,《办法》不再以风险防控为主要导向,业内似乎可以打消此前的“踩刹车”顾虑。正式文件中大幅增加了促发展的内容,同时划定了底线。网信办在就《办法》答记者问时也提出,《办法》坚持目标导向和问题导向,明确了促进生成式 AI 技术发展的具体措施,规定了生成式 AI 服务的基本规范2。1.1 生成式AI相关概念 2022 年被认为是“生成式 AI 元年”,Dall-E2、Midjourney、Stable Diffusion 等文生图应用的出现引起广泛关注;12 月底,ChatGPT 的横空出世更是使得生成式 AI 的风头一时无两。自 1956 年概念的首次提出至今,人工智能技术已发展超 60 年。然而,时至今日,其仍未实现大规模应用。生成式 AI 的出现标志着人工智能进入了新纪元,机器开始能够模拟人类的创造性思维,并有望促进社会生产力的大幅跃进。 生成式 AI 技术,是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。 基于监督学习的方法差异,机器学习领域可以分为判别式(discriminative)和生成式(generative)两种典型模型:判别式模型是对条件概率建模,学习不同类别之间的最优边界,从而完成分类任务;生成式模型则面向类建立模型,计算基于类的联合概率,然后根据贝叶斯公式分别计算条件概率,进而根据输入数据预测类别。生成式AI更强调学习归纳后的演绎创造,通过模仿式、缝合式的生成创作,不断判别和进化,从而产生全新的内容,其本质是“创造未知世界”。 掀起本轮 AI 技术浪潮的正是后者。生成式 AI 技术以革新产业的面貌席卷了科技界,驱动了生产流程升级转型。1 [ 钱玉娟,参与制定者解读生成式 AI 新规:“发 展被 放到更重要的位置”,经济观察 报,https://www.8btc.com/article/6826106]2 [ 国家互联网信息办公室有关负责人就《生成式人工智能服务管理暂行办法》答记者问,http://www.cac.gov.cn/2023-07/13/c_1690898326863363.htm。] 人工智能白皮书4访问21财经App智库频道获取更多报告 http://m.21jingji.com/thinktank 根据技术实现及应用路径,生成式 AI 又可以进一步细分为数据层、算力层、模型层和商业化应用层。 数据层包括数据提供、数据分析以及标注等环节。生成式 AI 产品的诞生需要依托海量的数据资源。公开资料显示,GPT-3 模型的基础来自 8000 亿个单词的语料库(或 45TB 的文本数据),包含了 1750 亿个参数。“8000 亿”是 ChatGPT 的训练数据,“1750 亿”是它从这些训练数据中所学习、沉淀下来的内容。 算力层是AI训练的基础设施,包括数据中心、服务器,以及高性能的AI芯片。据华泰证券测算,训练一次 ChatGPT 模型(13 亿参数)需要的算力约 27.5PFlop/s-day,即以 1 万亿次每秒的速度进行计算,需要耗时 27.5 天;而 ChatGPT 单月运营需要算力约 4874.4PFlop/s-day3。模型层位于生成式AI的中游,是生成式AI得以实现的关键环节。生成式AI的成型得益于2014 年以来 GAN(生成对抗网络模型)、Transformer(转换器模型)、Diffusion(扩散模型)等模型的发展与融合。例如,基于多种底层的 AI 技术,OpenAI 公司经过多次迭代的 GPT-4 模型,谷歌对标 GPT-4 的大模型 PaLM 2 等,通过开放 API 调用,可以赋能各类垂直应用厂商。 商业化应用层则涵盖文本、音频、图片、影片的生成等,是产业链的最下游,但也是 AI 能否大规模应用、能否真正创造价值的关键。 根据 PitchBook 的统计数据,2022 年投资圈向生成式 AI 公司共投入 13.7 亿美元(折合人民币约 93.69 亿元),融资事件发生 78 起,接近此前 5 年的总和。据风投公司 NFX 统计,目前已有 550 家生成式 AI 公司相继入局,共筹集近 140 亿美元的资金4。互联网及传统 AI 大厂将从云服务、预训练模型提供等的基础层、中间层入手,创业公司则聚焦在下游的垂直应用。多数公司刚刚完成标准化产品输出,开始进入商业化探索的初级阶段5。1.2生成式AI发展现状在2023年过去的几个月里,算力基础设施看涨,各大公司抢滩大模型,类GPT商用化加速探索,整个产业链市场快速打开。据东吴证券预计,AIGC 在内容生成中的渗透率将快速提升,应用规模迅疾扩增,预计 2030年 AIGC 市场规模将超过万亿元人民币。3 [ 郭美婷、蔡姝越:AI 契约论④:AIGC 产业链发展车驰船快,风险暗礁“涌现”,21 世纪经济报道,https://m.21jingji.com/article/20230531/herald/42b574c1fc7895ac1ab3246dc2789c16.html]4 [ https://www.nfx.com/post/generative-ai-tech-market-map]5 [ 汉能投资,生成式 AI 开辟人工智能新纪元,AIGC 赛道风起云涌(上),https://www.36kr.com/p/2223151983822208] 51.2.1算力在 AI 大模型时代