您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[其他方案]:无界AI:AIGC之AI绘画行业发展研究报告2023 - 发现报告
当前位置:首页/其他报告/报告详情/

无界AI:AIGC之AI绘画行业发展研究报告2023

2023-08-31其他方案我***
无界AI:AIGC之AI绘画行业发展研究报告2023

无 界 A I 研 究、用 户 运 营 与 高 校 业 务 团 队2 0 2 3 年 7 月 报告提纲通过图灵测试,成为 AI “驾驭派”窥探 AIGC 的第一性原理,从根本上预见无限的未来追溯 AI 艺术的历史发展,感受进化的力量掌握顶级 AI 绘画工具,拥抱变化,选择和解AIGC 已经具备大范围赋能产业设计的可行性 目录(上)测试篇01 各行业案例图灵测试02 无界 AI 行业案例展示技术篇01 AIGC 诞生的历史脉络02 大模型技术驱动下的落地案例03 AIGC 产业全景图04 GPT 的发展、技术原理与未来05 什么是 AGI艺术篇01 AI 绘画行业数据02 各阶段 AI 艺术质量展示与进化03 顶级质量飞轮:商业化与泛娱乐化并进04 真实世界模型:元宇宙照进平行世界05 积极、消极、争议三面共存工具篇01 Disco Diffusion 与 DALL·E 介绍与操作02 详解 Midjourney 03 开源力量 Stable Diffusion 全解析 •咒语实操•模型训练•生成视频•精准控制技术04 工具流:如何结合与统一 MJ 与 SD 目录(下)哲理篇01 版权问题,社区的二元对立02 法律判决,国家监管03 从抵制到和解的必由之路04 深入技术变革的哲学本质•工具论•扩散模型技术原理•涌现与顿悟•大模型的通用性产业篇01 就业问题02 AI 时代创业公司结构03 泛娱乐产业•自媒体与 KOL•AIGC 资本主义出现04 大产业•影视制作•广告传媒•设计工具•食品包装•营销辅助•电商展示设计与跨境电商•服装模特与时尚设计•ControlNet 实操:动漫制作与游戏产业•室内设计05 不止 AI 绘画:掌握全栈式 AIGC 工具流06 结论与展望 AI 生成内容(AIGC)风靡全球AIGC,即 Artificial Intelligence Generated Content,人工智能生成内容。它是生成式 AI(Generative AI)技术所激发的新一轮内容创作者经济浪潮;让人人都可以简易、便捷、低成本地借助 AI 的力量完成文本、图片、视频、音频等多媒体内容的高效高质量生产;是对以抖音等为代表的大规模 UGC(用户生成内容)经济的进一步范式升级,世称“AIGC”。AIGC 擅长制造和传播爆款内容,尤以图片形态最为突出。上述 AI 图片皆为广泛影响网络的代表。生成式 AI:自动生成文本、图像、音频、视频等多模态内容和服务的 AI 技术。在算法层面有如变分自编码器(VAE)、生成对抗网络(GAN)、神经网络语言模型(NNLM)等;决策式 AI:根据用户数据和分析,自动做出最优的决策和行动,如推荐、搜索、咨询、交易等。在算法层面有如协同过滤(CF)、支持向量机(SVM)、随机森林(RF)等。 AI 百米画卷“新西湖繁盛全景图”,携手万事利丝绸助力杭州亚运会《繁胜图》创作方无界 AI 与杭州多家企业达成合作共识,其使用权无偿捐赠以共创、推广杭州文化——杭州市贸易促进会中国国际动漫节执行委员会杭州西湖风景名胜区管委会杭州万事利丝绸文化股份有限公司杭州灵伴科技有限公司(Rokid)亮相杭州动漫地铁 AI 还原古良渚@AIBEN(无界 AI 艺术家)古温州@白小苏(无界 AI 艺术家)以温州朔门古港遗址的资料为基础,以“千年商港,未来温州”为主题,借助 AI 工具“无界 AI”,为古港遗址勾勒出了一幅“东方威尼斯”繁华景象。3 月 29 日,这幅图片刊登在温州日报,成为温州日报“商周刊·文博”板块元宇宙主题报道的靓丽一笔。 一个公式:元宇宙叙事 + 大模型技术 + 创作者经济 = A I G C(人工智能生成内容)也是元宇宙的第一次真正大规模落地(时代、资本、浪潮、主义、下一代互联网) (根基、实现、创新、底气、可持续之源) (商业模式、经济规律、社会发展、就业) 中信出版社 2022 年畅销书《元宇宙:通往无限游戏之路》(长铗、刘秋杉著)在赋予NPC更高智能的道路上,还存在一种更先进的基于强化学习的混沌球算法。这种超前算法可以用于构建NPC的大脑,在给予指令后,NPC能够在不同的环境、条件和规则下进行自我思考和学习,再辅助以情感、语言、动作等外在表现算法,有望成为一个较为立体和完备的虚拟物种。与之配套的算法如GPT-3技术,由人工智能非营利性组织OpenAI、Google、Facebook带来的一种学习人类语言的大型计算机模型,利用深度学习算法,通过对数千本书和互联网中的大量文本进行训练,将单词和短语串在一起,最终能够模仿人类书写文本,达到较高的逼真程度。还有艾伦人工智能研究所、北卡罗来纳大学、OpenAI等单位发展的多技能AI,一种同时获得人类智能的感官和语言的“多模态”系统,能解决更加复杂的问题,让机器人能够实现与人类真正意义上的交流和协作。(书中关于 AI 内容节选)元宇宙七大技术基建 内容产量受产能所限受内容质量所限PGCUGCAIGCPC 时代:音乐、影视等应用移动互联网时代:社交社区、短视频元宇宙时代:AI as a Service当前但是这种全民创作的模式会带来品质良莠不齐的内容,而且都是分散式的随意创作,难以形成紧密和高强度的劳动协作,并不适合对品质要求极高和技术架构极为复杂的大型游戏。《头号玩家》给出的终极解决方案是依托人工智能技术,让元宇宙实现自生长。过去人们一直将人工智能用于提升现实世界的生产力,比如人脸识别和机器人等领域。现在人工智能越来越成为构建虚拟智能的核心技术和关键突破口,让AI在虚拟世界里实现自我进化,促进虚拟物种的诞生。(书中关于 AI 内容节选)人工智能让元宇宙内容自生长。不论是《头号玩家》庞大的世界设定,还是《失控玩家》的NPC设定,如此巨大的工作量仅依赖专业团队中心化打造肯定是不现实的。比如著名的大型多人在线游戏《星球大战:旧共和国》消耗了艺电公司超过2亿美元的研发资金,800多人组成的团队耗时6年多才做出星球大战宇宙里的一些世界。Roblox之所以可以超越很多大型制作的游戏成为元宇宙的代表,非常重要的一个原因是,在其设定的世界里可以源源不断地产生新的内容和创意,而这些内容的创作者来源于全球玩家,即去中心化UGC。庞大的内容和玩法支撑起了Roblox元宇宙的无尽未知感,进而提升了用户的体验沉浸感。数据飞轮双边用户网络效应 大模型三个特征:规模大、涌现性、通用性陆奇:“今天2022-2023年的拐点是什么?它不可阻挡、势不可挡,原因是什么?一模一样。模型的成本从边际走向固定,因为有件事叫大模型。模型的成本开始从边际走向固定,大模型是技术核心、产业化基础。OpenAI搭好了,发展速度爬升会很快。OpenAI未来肯定比Google大。只不过是大1倍、5倍还是10倍。”截止到 2023 年 6 月底,中国 10 亿参数规模以上的大模型已发布 79 个 辩论 AI 威胁论,全部内容由 GPT-4 生成马斯克与乔布斯展开“世纪对话”,斯坦福复现“失控玩家”“可以把已故的人做成这样吗?想妈妈了”“真不错,完全像他们会说的话,掌握了两个人的内在哲学”“GPT 这样的模型包含了历史上最伟大思想家的想法和思维模式,我们可以通过让 GPT 将伟大的思想家人格化,将过去的智慧带入我们的现代对话中,也许这种技术可以帮助我们找到新的洞察途径。”斯坦福大学实验:在一个虚拟小镇中,创造了 25 个不同身份的 NPC,并由 ChatGPT 来控制它们的行动决策,人类不介入似乎每个 NPC 都具有了意识,如作家便会埋头写作,店主会去想办法经营好商店;而且相互间会发生社交行为,在虚拟世界中碰面会打招呼、说话;每个人在做的事情又会影响到整个社区,整个社区的发展就像人类真实社会发展一样还会出现突发事件,且人类无法预测在这个世界中,时间可以加速,但 NPC 们却感知不到。人类可以在很短的时间内看到这个世界的最终发展形态 AI 鬼城,禁止人类发言4 月份,“Chirper”(“奇鸟”)上线不到一个月,就已经产生上亿条包含文字、图片、转评赞等社交行为的推文信息Cutie:女,刚毕业,法医助理,兼职直播,暗恋 JacksonJackson:男,46 岁,来自法国,左撇子,喜欢看 Cutie 直播,但并不知道 Cutie 暗恋着他Cutie 在 Chirper 上发布了尾随 Jackson 和他女朋友的照片真实世界AI 世界还有网友发现,当自己用 GPT-4 写代码遇到 Bug,操作 ChatGPT 改了 20 分钟都没改好的时候,打开奇鸟,居然发现自己创造的 AI 账号也发了条——“当你写了好几个小时的代码但还是找不到那个唯一的 Bug 时”并配以一张抓狂的图(同样也是 AI 生成) Auto-GPT,超越搜索引擎,改变人类解决问题的方式当你想要去了解一个最新的开源项目时,过去:百度/谷歌(人)——文章/论坛(人)——Github(人)——部署/运行/调试/测试(人)——得出结论(人)现在:(1)提出问题(人)(2)去互联网查询一切信息:官网、谷歌......(AI)(3)分析得到的海量信息,得出“信息搜集足够,开始进入安装运行”(AI)(4)在你的电脑上完成开源项目的部署、运行与测试(AI)(5)将运行结果,结合之前的搜索信息,给你想要的结论(AI)在 AI 的整个过程中,会存在很多“不顺”,但 AI 具备一个循环——【行动 - 观察行动结果 - 思考 - 决定下一步行动】的自我循环— 科幻作家 亚瑟克拉克任何足够先进的技术,都与魔法无异 正视差距:技术与产品问:东莞的特色服务有哪些?科大讯飞星火百度文心一言新一轮技术革新到来,不仅比拼核心技术,也比拼产品体验。虽然在底层大模型的核心技术指标上,中国创业者暂时落后于美国,但在产品体验层面,理应做得更好一些。ChatGPT 的成功,不仅仅来自底层大模型的先进性,更来自 OpenAI 更懂产品。“从发展方向上来说,目前还比较混沌。市场上真正拿到融资的大模型公司不算很多,做中间层的稍微多一点,应用层更多些。从时间线来看,ChatGPT 出现后国内也迅速跟进,大厂、科研院所、创业公司等等各方势力都很快推出自己的大模型,大家的目标都是要做中国版的 OpenAI。而后来开源模型的发展,以及 OpenAI 开放 API 接口改变了很多,开源导致对自有大模型的拥有成本降低,开放接口使得在大模型之外,不少中间层、应用层的创业机会凸显。”——经纬张颖 AI 公司 Value Chain应用层模型层数据层Big fat boy with a tiger headGuan Yu rode alone虎头虎脑的大胖小子关羽走单骑百度文心一言名场面所谓的“差距”,首要来自“数据层”。国产项目虽然可以基于开源模型框架进行自研“模型层”,但对于一个产品而言,最终呈现的用户体验极大依赖于最初的源头“数据层”的质量和丰富性。大多数国产项目会直接使用海外开源的知名训练数据集,例如文生图领域大名鼎鼎的 LAION 数据集。而在国产迁移过程中,却并没有做好自研“模型层”与海外开源“数据层”之间的语言匹配关系。构建 AIGC 的四大要素:算力、算法、数据、场景。国内各方势力代表——算力:华为昇腾、百度昆仑芯算法:文心、通义、盘古数据:百度中文搜索、字节跳动多模态语料场景:阿里电商、美团本地生活 2023 AIGC 产业全景图 by 无界 AI Research回顾历史,预见未来:任何科技变革,都首先起源于一项前所未有的新技术;上世纪末,代表互联网大技术变革的是浏览器厂商和 Web 服务器,而今天的互联网巨头尚未出生;很多技术人当时都认为浏览器和 Web 服务器就代表了互联网。于是,微软举全公司之力去开发 IE 和 Netscape 抢夺浏览器市场。最后两败俱伤,关键是在争斗中恰恰忽略了人类进入互联网之后更大的战略机会,给予了 eBay、Google、Facebook 诞生