您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[头豹研究院]:2022年中国AIGC行业研究报告: 蓄势待发,数字内容的工业革命(摘要版) - 发现报告
当前位置:首页/行业研究/报告详情/

2022年中国AIGC行业研究报告: 蓄势待发,数字内容的工业革命(摘要版)

信息技术2023-04-06头豹研究院机构上传
2022年中国AIGC行业研究报告: 蓄势待发,数字内容的工业革命(摘要版)

1©2022 LeadLeowww.leadleo.com报告提供的任何内容(包括但不限于数据、文字、图表、图像等)均系头豹研究院独有的高度机密性文件(在报告中另行标明出处者除外)。未经头豹研究院事先书面许可,任何人不得以任何方式擅自复制、再造、传播、出版、引用、改编、汇编本报告内容,若有违反上述约定的行为发生,头豹研究院保留采取法律措施、追究相关人员责任的权利。头豹研究院开展的所有商业活动均使用“头豹研究院”或“头豹”的商号、商标,头豹研究院无任何前述名称之外的其他分支机构,也未授权或聘用其他任何第三方代表头豹研究院开展商业活动。头豹研究院2022年中国AIGC行业研究报告:蓄势待发,数字内容的工业革命(摘要版)企业标签:视觉中国、昆仑万维、中文在线行研赋能产业创新发展2022 China AIGC Industry Research2022年中国AIGCの業界研究 2©2022 LeadLeowww.leadleo.comwww.leadleo.com400-072-5588◼行业背景:热点事件◼定义及内涵◼发展历程◼分类及应用现状Chapter1行业综述研究报告| 2022/12 3©2022 LeadLeowww.leadleo.comAIGC系列研究报告| 2022/12www.leadleo.com400-072-5588AIGC是基于人工智能技术自动生成数字内容,如文本、图谱、音视频等;与PGC和UGC模式相比,AIGC的优势在于能够突破人力创作的限制,在保证一定质量水平的同时,最大程度地降低创作门槛及释放内容生产力◼AIGC行业综述——定义与内涵来源:A16Z,头豹研究院PGC、UGC和AIGC的产能及生产效率AIGC(AI-GeneratedContent,人工智能生成内容)是指基于人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术,可以生成常见的如图像、文本、音频、视频等内容。AIGC是继PGC和UGC后全新的内容生成形态,是元宇宙的重要基础设施◼PGC和UGC分别被产能和质量所限制,AIGC在保证一定质量水平的同时,最大化地释放内容生产力PGC主要由专业化团队生产较高质量的内容用以商业变现,为保证质量水平,PGC需要投入大量的研发成本,以爱奇艺为例,2021年内容采购成本达207亿元,占总营收的比例高达68%。UGC模式则将用户和创作者一体化,创作者即为用户本身,虽然该模式降低了生产门槛,内容产能大幅上升,但内容质量良莠不齐,例如抖音、快手等短视频平台。尽管UGC在一定程度上突破了PGC的创作瓶颈,但仍然无法满足元宇宙高质量、高产量、多样化的内容需求AIGC能够突破人工限制,带来元宇宙所需的丰富多元的内容。AIGC通过AI技术自动或辅助生成内容的生产方式,在AI工具帮助下,所有人都可以成为创作者,通过输入指令使AI自动生成内容,让AI去完成冗杂的代码、绘图、建模等任务,在保证一定质量水平的同时,最大程度地降低创作门槛及释放内容生产力,不断拓宽元宇宙内容边界,形成持续膨胀的元宇宙内容库PGCUGCAl辅助生成AlGC受AI技术成熟度所限受内容质量所限受产能所限内容产量单一用户体验小范围多用户体验大范围多用户体验元宇宙多用户体验生产效率 4©2022 LeadLeowww.leadleo.comAIGC系列研究报告| 2022/12www.leadleo.com400-072-5588按照生成内容的不同,AIGC的应用可分为文本生成、图像生成、音频生成、视频生成和虚拟人生成五大类别,其中当前AIGC的应用以文本生成和图像生成为主◼AIGC行业综述——分类及应用现状来源:量子位,头豹研究院AIGC的分类及应用情况文本生成非交互式文本交互式文本闲聊机器人,如Siri,天猫精灵等结构化写作,如新闻播报,有较强的规律非结构化写作,如剧情续写,需要一定创意和个性化辅助性写作,如推荐相关内容,帮忙润色等文本交互游戏,如AIdungeon等语音克隆,如克隆演员的声音进行配音等文本生成特定语音,如生成虚拟人歌声/播报等乐曲/歌曲生成,如作曲及编曲,自动填词等图像编辑图像自主生成创意图像生成,如随机按特定条件生成画作利用工具软件编辑图像,如去除水印,提高分辨率等功能性图像生成,如营销海报,logo等视频属性编辑,如删除特定主体,生成特效,跟踪剪辑等视频自动剪辑,如对特定片段进行检测及合成视频部分编辑,如AI换脸等虚拟人生成数字虚拟人视频生成数字虚拟人实时交互音频生成图像生成视频生成较为广泛地实际应用,技术细节仍待进一步提升底层技术原理基本明确,预计1-2年内规模化应用底层技术原理仍待完善,增长可期注:的分类及应用情况AIGC 5©2022 LeadLeowww.leadleo.comwww.leadleo.com400-072-5588◼产业链图谱◼上游:自然语言处理技术◼上游:智能算法模型◼中游:商业模式及案例◼下游:应用场景Chapter2产业链分析研究报告| 2022/12 6©2022 LeadLeowww.leadleo.comAIGC系列研究报告| 2022/12www.leadleo.com400-072-5588AIGC产业链上游为基础设施层,主要为提供NLP技术、智能算法模型以及数据库的厂商;中游为内容生产层,主要为通过AIGC生成文字、图像、音视频等内容的厂商;下游为应用层,主要涉及传媒、电商、影视等行业的厂商◼AIGC产业链分析——产业链图谱来源:头豹研究院AIGC产业链图谱上游·基础设施下游·应用场景教育金融社交传媒......电商医疗直播工业影视互联网中游·内容生产文字图像NLP技术◼NLP技术是实现人与计算机之间通过自然语言进行交互的手段娱乐算法与模型数据素材音频视频虚拟人◼AIGC生成文字主要被应用于文案的撰写、既定格式的文本撰写以及风格改写◼AIGC生成音频在地图导航被广泛应用,用户可根据喜好随时切换播报声音◼AIGC生成视频是根据文本内容输出相应的视频内容,当前该技术尚未成熟◼基于视觉、语音、文本生成技术,AIGC打造虚拟主播,用于直播、新闻播报等领域对象识别Stable Diffusion 模型DALL-E 2 模型JasperAI 文字生成工具图片素材/版权图库业务数据文本内容素材◼为AIGC模型训练提供海量丰富的素材语义理解分析决策语言生成◼AIGC生成图像在新闻媒体等平台被广泛使用,可有效避免潜在的版权纠纷风险◼扩散模型使AIGC能够通过文本描述生成各种图像◼AIGC以其真实性、多样性、高效性的特征,有效帮助企业提高内容生产效率,提供更加丰富多元、动态且可交互的内容,或将在传媒、电商、影视、娱乐等数字化程度高的行业率先取得重大创新发展 7©2022 LeadLeowww.leadleo.comAIGC系列研究报告| 2022/12www.leadleo.com400-072-5588自然语言处理(NLP)技术使计算机能够识别和提取人类语言中的特征与意图,并将计算机的非语言格式数据转换成人类可理解的语言格式,使计算机能够和人类进行自然语言交互,赋能AIGC根据人的语言指令生成相应内容◼AIGC产业链分析——上游:自然语言处理技术来源:头豹研究院NLP技术核心任务、语言生成步骤和应用场景语法化语言生成内容确定参考表达式生成文本结构句子聚合•决定文本所包含的信息•确定需要传达的信息后,合理组织文本顺序•将多个信息合并到一个句子中•在各种信息之间添加连接词•识别内容所属领域(如医学),并使用该领域的词汇•输出结构良好的完整句子情感分析互联网存在大量的信息,这些信息抒发的情感大致可分为正面和负面的,NLP技术可被用来快速了解用户的情感状态语音识别计算机可识别、理解用户的语音输入信息,并能够从中提取特征值,且能够将用户的语音信息转化为文字信息聊天机器人NLP技术赋予聊天机器人感知上下文的能力,能够理解复杂的人类语言,与用户进行对话并执行相关指令机器翻译识别输入文本的语言及语义,自动生成其他语言版本的文本。机器翻译的准确率在近年大幅提高,部分企业(如youtube)已可做到视频机器翻译四大应用场景自 然 语 言 理 解(NLU):使计算机和人一样具备正常人的语言理解能力,能够识别和提取语言中的意图自 然 语 言 生 成(NLG):将计算机的非语言格式数据转换成人类可以理解的语言格式,如文章、报告等两大核心任务自然语言生成六大步骤◼NLP技术使计算机系统能够和人类进行自然语言交互,赋能AIGC根据人的语言指令自动生成目标内容NLP技术是实现人与计算机之间通过自然语言进行交互的桥梁,融合了语言学、计算机学、数学等学科,使得计算机可以理解人类的自然语言,完成信息提取并进行自动翻译、分析和处理等任务。由于人类语言的复杂性和多样性,NLP技术成熟度一直以来都被视为人机交互落地及场景应用层面的瓶颈。自2018年Transformer模型的问世,其多任务并时处理和大规模训练的能力大幅提升AI的智能化水平,为当前AIGC的高速发展夯实了扎实的技术基础 8©2022 LeadLeowww.leadleo.comAIGC系列研究报告| 2022/12www.leadleo.com400-072-5588AIGC商业模式主要根据用户需求自动化生成相应的文本、图像、音视频等内容,主要应用在AI写作、AI绘图、对话式AI等领域;受技术限制,AIGC尚未能够精准满足用户的多种复杂需求,主要作为辅助性工具使用,大部分AIGC平台或软件以免费使用为主,少量业内先进企业的平台采用付费模式◼AIGC产业链分析——中游:商业模式及案例来源:文心·一格,Phenaki,MetaAI,头豹研究院AIGC的商业模式及案例场景描述工业元宇宙应用价值业务场景商业模式描述代表案例自动文本生成文字创作AIGC生成文字主要被应用于文案的撰写、既定格式的撰写以及风格改写。用户通过输入一段对于目标文章的描述或要求,系统将会自动抓取数据,根据指令进行创作◼Jasper是一款利用AI为博客文章、社交媒体帖子及网页等平台生成文字内容的软件,该软件可以满足用户的各种文字需求,包括拟写博取眼球的标题,改写现有的文字内容以避免剽窃等图像创作用户输入文字描述,计算机根据文字内容自动生成图像作品;目前在新闻媒体等平台被广泛使用,不仅大幅降低了创作成本,同时避免了潜在的版权纠纷风险◼依托于百度旗下自研的飞桨和文心跨模态模型,文心·一格是可根据用户文本实现“一键生图”功能的“AI艺术和创意辅助平台”。左图为文心·一格根据输入文本信息“分析师在喝水”自动生成的图像文本生成图像音频剪辑基于语言模型和语音库,计算机进行大量的训练后,可用指定的声音说出任何话。用户输入文字描述,设定特定的语境、音色、情感等条件,计算机则根据指令生成相应的音频◼百度地图导航可切换不同明星甚至卡通人物的语音提示;Podcast.ai基于撰写好的文本,使用乔布斯的声音与电台主持人进行了一场长达20分钟的对话文本生成音频视频创作根据用户输入的文本内容,计算机生成相应的视频。当前该技术仍处于试验阶段,在连贯性与语义理解的准确性方面仍存在明显的缺点◼Google推出AI视频生成模型Phenaki,其能够根据文本内容生成可变时长视频的技术,在公布的DEMO中,Phenaki用时2分钟生成一段基于几百个单词组成的前后逻辑连贯的视频文本生成视频 9©2022 LeadLeowww.leadleo.comAIGC系列研究报告| 2022/12www.leadleo.com400-072-5588元宇宙背景下,全球加速数字化演进进程,各行业对于数字内容的需求急剧增长。AIGC以其真实性、多样性、高效性的特征,有效帮助企业提高内容生产效率,或将在传媒、电商等数字化程度高的行业率先取得重大创新发展◼AIGC产业链分析——下游:应用场景来源:中国通信院,头豹研究院AIGC应用场景全景图AIGC应用场景剧本生成数字复活已故演员高难度动作合成演员角色年龄跨越虚拟物理场景合成替换“