您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国AIGC产业联盟&无界AI]:2023中国AIGC文生图产业自皮书 - 发现报告

2023中国AIGC文生图产业自皮书

AI智能总结
查看更多
2023中国AIGC文生图产业自皮书

中 国 A I G C 产 业 联 盟x无 界 A I 2024 年 1 月 · 杭州未来科技城 引言 “理性是人类独有的禀赋,艺术与科学总是在山脚下分手,最后又在山顶上相遇,AIGC 时代到来,期待看到人工智能与人类智慧在此消彼长中逐渐对齐,实现二者的双向奔赴与双向丰富。” “AIGC 可能复制人类文明的进化历程,从通用模型走向专用模型或行业模型。对于 AIGC,我们要以宏观叙事,从微观行事。” 长铗,无界 AI 创始人,著名科幻作家,连续三届中国科幻最高奖“银河奖”(2006~2008)得主 张媛,上海广播电视台 SMG 著名主持人、制作人 “从无中生有到言之有物,AIGC + 东方审美是人工智能传承和发展中华传统造型与造物观念的创新利器。” “未来的时代是科技的时代,是 AI 的大时代,AIGC 将显著提升生产效率,助力人人都是创作者成为现实,给经济带来新活力。” 吴太兵,万兴科技(300624.SZ)董事长 张光帅,教授,山东工艺美术学院人工智能设计研究中心主任、数字艺术与传媒学院副院长 “放飞每个个体的创意和想象,在 AIGC 时代遇见共同的美好。” “AIGC 未来要和各产业深度融合,必须先把制造业作为主攻方向。” “AIGC 时代将诞生前所未见的超级商业模式,过往的企业估值逻辑有望出现极大变化。” “AIGC 的出现,使今天人类社会信息符号的传递与分享成为了数字世界自驱进化的能量基因。” 刘兴亮,《刘兴亮时间》创始人,拥有数百万粉丝的知名数字经济学者 “对人工智能而言,图象信息真正可能被觉知而成为视觉,不同的视觉,即是不同的风格而已。而区分其特征并标注的还是人,因为人具有命名的能力,也是标注智能的方法。我们选择视觉的风格,就是营造文化的能力,人类就是在审美和选择中发展新一代的未来。” “每个人都可以用 AIGC 的思维、技术、工具对自己现有的工作和生活进行前瞻性构想、创新性应用、开拓性实践。” 中国电信研究院大数据与人工智能研究所副所长,科技部重点研发计划评审专家 沈华清,浙江大学设计艺术系副主任 “从 AIGC 到 AI AGENT,集合群体智慧共上新的台阶。” 目录 文生图通识篇 01从 AIGC 到 AI 文生图02AI 文生图的发展历程03主流 AI 文生图工具04AI 文生图的终局:AI 视频 产业实践篇 01AIGC 产业与就业影响02AIGC + 泛娱乐产业03AIGC + 影视与传媒04AIGC + 设计工具05AIGC + 营销06AIGC + 电商07AIGC + 服装模特与时尚设计08AIGC + 动漫与游戏09AIGC + 家装与建筑设计10产业实践的先决条件: AIGC 版权保护与流转11结论展望与产业图谱 文生图通识篇 文生图通识篇 01 节:从 AIGC 到 AI 文生图 文生图通识篇 01 节:从 AIGC 到 AI 文生图 人工智能生成内容(AIGC)风靡全球 AIGC,即 Artificial Intelligence Generated Content,人工智能生成内容。它是生成式 AI(Generative AI)技术所激发的新一轮内容创作者经济浪潮;让人人都可以简易、便捷、低成本地借助 AI 的力量完成文本、图片、视频、音频等多媒体内容的高效高质量生产;是对以短视频、自媒体等为代表的大规模 UGC(用户生成内容)经济的进一步范式升级,故称“AIGC”。AIGC 擅长制造和传播爆款内容,尤以图片、视频等视觉形态最为突出。所示 AI 图片皆为广泛影响网络的代表: 左图:2023 年索尼世界摄影奖落幕,AI 作品《虚妄记忆:电工》荣获创意类大奖;中图:2022 年由 OpenAI 与时尚 COSMO 杂志合作制作的首个 AI 杂志封面;右图:2022 年 9 月,由 Midjourney 生成的绘画作品《太空歌剧院》在美国科罗纳州博览会上获得艺术比赛一等奖。 AIGC 就在身边:新西湖、古良渚、古温州 AI“新西湖”全名为《新西湖繁盛全景图》,由人类画师与 AIGC 共同参与完成。主要用到三项主流的 AI 绘画技术:线稿上色(ControlNetLineart)、无限拓展(Outpainting)、建筑模型训练(Dreambooth & Lora)等。创作方将该作品的使用权无偿捐赠给杭州市贸易促进会、中国国际动漫节执行委员会、杭州西湖风景名胜区管委会、杭州万事利丝绸文化股份有限公司、杭州灵伴科技有限公司(Rokid)等多家单位和企业以共创、推广杭州文化,共享 AI 作品版权。 AI“古温州”,则以温州朔门古港遗址的资料为基础,以“千年商港,未来温州”为主题,借助 AI 工具为古港遗址勾勒出了一幅“东方威尼斯”繁华景象。2023 年 3 月 29 日,这幅图片刊登在温州日报,成为温州日报“商周刊·文博”板块元宇宙主题报道的靓丽一笔。 案例虽小,管中窥豹,可见一斑。从 2022 年至 2023 年,国内 AI 绘画产业正是从这样微小的案例开始了举世瞩目的产业应用浪潮,从最初的静态图片走向复杂、交互式的 AIGC 产业应用场景。 文生图通识篇 02 节:AI 文生图的发展历程 2022 遇见 AIGC 的序章:AI 文生图 由 aiwatch.ai 发布的《生成式 AI 年终数据报告》中提炼并量化出了 AIGC 文生图赛道的细分分支(备注:量化数据取自 2023 年 11 月份全球同类产品的流量访问数据,不含大公司产品)。市场份额从高到低依次为:图像生成(11亿)、图像编辑(1.6 亿)、设计助理(4849万)、Logo 生成(1890 万)、设计工具(928万)、艺术(605 万)、Avatars(460 万)。 AI 时代与互联网时代开源热度对比 曾经互联网时代靠着开源精神完成了一次次科技商业变革,如搭建网站、云计算、APP……每条曲线都见证了那个十年的飞速发展。而今天 AI 开源运动,出现即巅峰,项目的下载和引用正在以指数级速度蔓延…… 文生图通识篇 02 节:AI 文生图的发展历程 AI 文生图的艺术质量呈现出指数级进化速度 故事始于 2022 年春天,Disco Diffusion 的开源打开了 AI 绘画的浪潮之门—— 2022 年 4、5 月份:AI 绘画只擅长抽象之美或者色彩美学,以令人“眼花缭乱”的色彩涂抹构图向世人展示出 AI 艺术的别样魅力。这段时期人们常用的工具是 Disco Diffusion 以及 Midjourney 初代版本。 2022 年 6、7、8 月份:AI 绘画开始集中突破绘画的逻辑性和质量,可以逐步写实、产出具有艺术性的作品。这段时期以 Midjourney 为主要工具代表。 2022 年 9 月份:AI 绘画最重要开源力量 Stable Diffusion 成为社区大热门,且凭借成本低、高质量、高逻辑性、更强的通用绘制能力以及快速生成等优势迅速占领市场,AI 绘画的艺术质量和逻辑能力开始进入“飞轮式”发展,且 Midjourney 也开始引入其开源技术。 2022 年 10、11 月份:AI 绘画的第一个现象级潮流“二次元模型”横空出世,以 NovelAI 等开源产品和力量为突出代表,进一步蔓延到整个 Stable Diffusion 社区,更多的开源模型和产品加入到这个队伍中,生态力量开始形成。二次元模型的高质量性和现实影响力也令世人展开了对 AI 绘画版权的争议。11 月份,国内AI 绘画第一波大浪潮启动,抖音迅速推出的“抖音 AI 绘画(二次元)”流量成功辐射数以千万计网民,国内第一波千万级 AI 绘画用户群形成。 2022 年 12 月份:紧接着二次元浪潮,人们仿佛打开了“通往异次元的大门”,开始让三次元、2.5 次元照进 AI 绘画,于是新一波浪潮“ AI 真人模型”形成。传统互联网上充斥着大量由 AI 生成的“美女”、“真实场景”、“平行时空新闻”等新形态内容。与此同时,闭源力量 Midjourney 也几近 AI 绘画的艺术巅峰,各行业的大量设计师与内容工作者群体开始用 Midjourney 生成极高质量且满足现实生产需求的 AI 图片。2023 年至今:AI 绘画在极高质量、通用逻辑能力、细节完美度以及精准控制层面已经开始大范围“侵蚀”各行各业的生产与消费过程,各产业以及互联网都到处充斥着 AI 生成的内容。第一波 AI 大范围赋能产业的共识正逐步形成。Stable Diffusion 生态力量和 Midjourney 产品力成为当下人们唯二选择。 文生图通识篇 02 节:AI 文生图的发展历程 2023 年 AI 文生图“侵蚀”的商业版图:实用性 AI 绘画时代到来 面对 AI 绘画一年来指数级的进化速度,2023 年 AI 绘画正式开启“全面商用”时刻。从多样性的艺术维度冲击多样性的行业商业,在流量平台等虚拟内容经济的加持下,数以千万甚至上亿计的互联网用户群深受其影响。其中以“摄影模型”和“真人模型”等为代表的“真实世界模型”对现实世界的冲击最为显著,包含商业应用、泛娱乐消费甚至诸多负面影响。 上海师范大学影视传媒学院副教授戴菲:“看到 AI 做的特朗普被捕图,以假乱真,你会发现这里面没有任何曝光失误、构图失误。” 我们在 2022 年曾预测,2023 年数以亿计的 AIGC 内容将充斥着整个互联网,绝大多数网民在刷抖音或者小红书时都会在不知不觉中浏览到 AIGC 内容,占比可能达到 5~10%;以小红书平台为例,都会将疑似 AI 生成的内容打上“疑似包含 AI创作信息,请注意甄别真实度”的标签以供用户警惕。一时间,泛娱乐场景成为 AI 文生图商业化的“第一阵地”。 案例:网友用真人模型画出了“儿童版的马斯克”,并戏谑道“马斯克正在研制的抗衰老药方实验失败”。凭借极高的现实还原度和容貌特征,这样令人耳目一新的内容在全网病毒式蔓延,最后受到了马斯克本人的关注和回复:“我可能吃太多了。” 借助类似技术和模型,麦当劳在六一儿童节期间发起了“童趣滤镜,回到童年”的全民参与 AI 互动的营销事件:只需上传自己的一张自拍,便可一键变回小时候的模样。其大胆之创新,广受好评。 AI 文生图工具变迁之路:面对这万般变化,请掌握先进的生产力工具 AI 文生图模型阵营及简史 一切都始于 CLIP 开源,CLIP 是一个通过自然语言监督有效地学习视觉概念的神经网络。通过使用 CLIP 可将文本和图像连接在一起CLIP(Contrastive Language–Image Pre-training)是文本和图像对照的预训练模型,数据集使用的是 LAION-400M,包含 4 亿组从互联网上收集的文本图像对。文本编码器提取文本特征,图像编码器提取图像特征,两个放到一起对比相似度,从而让 AI“掌握”文本图像的匹配关系 开源之王 Stable Diffusion 的模型风格化细分及其生态占比 2022 年 8 月,AI 绘画最为重要的开源力量 Stable Diffusion 正式向全世界开放其模型代码、训练数据集、生产内容的版权归属协议。完全自由的开源运动激起了全世界开发者、创业者、产业公司和普通爱好者的热忱,在短短半个月时间内,SD 的谷歌搜索趋势彻底超越大名鼎鼎的DALL·E,成为人们谈论 AI 绘画不可规避的话题。SD 的开源也令 AI 巨头们倍感震惊。 SD 所基于的开创性的“潜在空间”(Latent Space)技术将扩散模型(Diffusion Model)再次推上新的台阶,是 AI 绘画走向大规模商用化的关键一步(如 latent 空间让快速生成高分辨率图像成为可能,对比之下,过往的 DALL-E2 和 Google Imagen 则是基于传统的 pixel 空间)。 “我们有 100 名员工,社区有 10 万人。这就是我们力量的来源,我们来自世界各地