AI智能总结
4 目录 大模型和AI应用高速发展 AI推动内容丰富,创作降本增效 AI与算法应用推动营销效率提升 1.1大模型发展及产业近况 u大模型的发展开启AIGC时代(第四次AI浪潮),技术是AI每次革命性发展的起点,商业应用与落地则是AI发展的加速器。u大模型的数量及能力均不断上升,AIGC应用爆发具有技术基础;技术爆发后迎来商业加速,应用热度上升。u随着人工智能技术的飞速发展,大模型(包括开源模型及闭源模型)的数量和能力都在显著增长,为AIGC(人工智能生成内容)应用的爆发提供技术基础。当前大模型厂商凭借自身模型基础,扩充应用场景构筑自有生态。海外风险投资公司Y Combinator统计,全球AIGC融资热度在2024年加速上升, 从侧面显示其商业价值逐步受到关注。 1.2多模态模型对内容生产模式的影响 u多模态模型能够提供更加全面的认知能力和丰富的交互体验,拓宽AI处理复杂任务的应用范围是其通用人工智能的重要路径之一。例如,OpenAl的Sora模型推出使得全球多模态大模型的发展得到关注。uAI生产力提升将改善传统工作流程。大模型应用或将影响人机交互方式和机器原有的决策能力,以上两方面的提升将对原有内容生产力再次释放,结合对产业上下游链条和生态合作方式,进而改变整体数字管理体系。uAIGC以内容生成为核心,结合商业应用的不断迭代,最终指向数字工作作业模式及治理模式的改变。 1.3各模态发展进程 1.4文本与图片生成逐步普及 u目前AIGC相关应用中普遍围绕文本与图片生成两项功能与产品应用场景进行适配。 u针对各类型使用场景可主要归纳为两种形态: Ø信息生成:围绕工作场景,用户可借助AI生成所需的文本、图片等内容信息,也可生成办公文档、辅助计算,缩短工作时长,提高效率。Ø内容总结:借助浏览器AIGC插件总结文字、视频等内容,提升阅读效率,聚焦核心信息,并以标签形式提炼,助力工作提效。 1.5图片生成发展历程 u在GAN、Transformer和扩散模型等技术和开源的不断升级,AIGC技术在图像领域的定位逐渐由工具向生产力升级,实用性和商业性增强,降低绘制的技术门槛和二次编辑开发成本,应用于艺术创作、美术设计、营销创意、视觉插画、泛娱乐内容等多领域。 u2023年AIGC相关图片应用正式开启“全面商用”时刻。从多样性的艺术维度冲击多样性的行业商业,在流量平台等虚拟内容经济的加持下,互联网用户群开始将AI应用融入日常场景。早期AIGC应用以独立软件为主并产生出部分破圈产品吸引流量,随着生成技术的不断提升部分硬件厂商逐步将相关技术嵌入至产品本身。 1.5图片生成发展历程 uAI生成作为图片生成工具降低用户绘制或拍摄门槛,有助于图片内容端持续繁荣。据EVERYPIXEL估算,截止到2023年8月份,AI生成的图像超过过去150年人类拍摄的所有照片数量。u从历史发展规律推演,AIGC创作者经济时代也必然会催生对生成式 AI版权的需求,因为新经济的形成和运作离不开对新生产要素的确权。例如,当前的互联网数字经济对数字版权的需求催生以视觉中国为代表的数字版权内容平台。u未来针对AI生成图片及相关版权问题将成为用户及相关平台的关注之一。 1.6视频生成发展历程 uAI文本生成和图像生成相继走向成熟,Sora发布加速视频生成相关技术发展,自身展示该领域较为确定性技术范式,将Diffusion Transformer(DiT)推向主流应用,大量视频生成凭借DiT路线并取得成功。单纯基于语言模型的路线是业界关注的另一条路径,可以更好地融合不同的模态,且可扩展性强,未来可能会有新的进展。uAIGC已经加速迈入视频生成阶段。2024年可实现根据文本提示生成初版短视频,2025年有望实现根据文本生成初版长视频,并在视频制作环节真实使用落地。u视频生成正在由检索生成、局部生成走向依靠自然语言提示词的全量生成,生成内容更加灵活丰富,应用空间广阔。 1.7视频生成发展基础 u视频生成模型发展在技术确立下,算力将驱动模型快速进步,稳定性、可控性、丰富度将持续提升,解锁更多应用空间:Ø训练侧,视频模型发展遵循Scaling Law,需要在Scalable的模型架构上增加数据和算力来提升模型能力。Ø推理侧,算力成本的下降和充足的供给来支撑下游的应用和商业化。以0penAl Sora的实践成果来看,继续增加模型的数据量和相应的参数规模(Scale up)依然是AI发展的核心路线,算力支持是模型进步的必要能力。scale提升后可以涌现出更多高级特性。 1.8视频制作流程及行业现状 uAIGC视频生成工具可对视频生产流程进行重塑,由传统视频制作范式进化到“提示交互式”场景,以用户提示为基础,将生成结果与用户反馈相结合不断迭代,进而生成最终结果。u“提示交互式”相比传统范式具有三方面的重塑:1、压缩制作过程2、提升创意和剪辑自由度3、节省制作成本和时间。u传统制作与AIGC工具在行业发展中相互合作共同磨合。2024年9月18号,Runway和狮门影业开启合作;2024年9月24日,詹姆斯·卡梅隆官宣加入Stability.AI,成为董事会成员。 1.9 AI应用产品形态 u目前大模型已从早期的技术驱动转向生态驱动,商业落地大致可分为软、硬件两种形态,相信未来产业会出现大幅升级甚至重构C端软件形态亦可进一步分为”AI+”(原生应用) 和“+AI”(原有核心业务增强/赋能)。u近期大模型厂商在智能体领域的战略动向,预示着未来用户可能从过往APP使用模式转向与智能体互动的方式;智能体相比APP自身更轻量化,在场景定制化与对原APP进行智能化升级等方面更具优势。 1.9 AI应用产品形态 uAPP内AI嵌入式应用在现有互联网生态中结合度以及用户接受程度更好更具有发展优势。u从现有APP应用场景,可分为AI工具和AI社交/娱乐两大赛道;包含有场景聚焦型APP与多场景覆盖的综合型APP。uQuestMobile数据显示,2024年6月,月活跃用户规模在100万以上的APP占比达13.1%,10-50万量级、10万以下量级占比分别为27.6%、55.3%。 1.10生成AI多领域加速落地 目录 大模型和AI应用高速发展 AI推动内容丰富,创作降本增效 AI与算法应用推动营销效率提升 2.1我国互联网发展优势显著 u海量数据及用户多元化需求,驱动场景应用不断迭代以求满足当前需求。中国自身具备海量数据及旺盛的互联网使用需求,驱动AIGC应用场景快速发展。在消费端中国的互联网使用量约为美国互联网使用量的两倍,其主要原因可划分为两点:1、网民数量上的绝对优势;2、快速提升的移动网民渗透率。仅2023年上半年,中国移动互联网接入流量已达1423亿GB。中国较美国在数据体量上的优势,未来将持续扩大。 u互联网红利充分释放,需求与消费持续回暖,根据《中国网络视听发展研究报告(2024)》报告:Ø网民规模方面继续保持增长态势,将近11亿人;Ø社交、视频娱乐用户规模庞大,网络视听用户使用率高达98.3%;Ø泛娱乐领域用户时长均实现了增长,线上消费强劲。 2.2互联网应用场景现状 u我国数字经济规模蓬勃发展,互联网大盘流量同步稳定增长。2024年上半年,围绕数据要素、数字经济、数字社会等领域,国家发布多项政策,推动数字经济高质量发展。国家统计局数据显示:2024年上半年,信息传输、软件和信息技术服务业增长11.9%;实物商品网上零售额同比增长8.8%,占社会消费品零售总额25.3%。 u在互联网各个应用场景中,移动视频、移动社交占据近6成的移动互联网用户时长,其中移动视频时长占比仍在进一步增长。QuestMobile数据显示,2023年9月,五大新媒体平台(抖音、快手、微博、小红书、B站)去重活跃用户规模10.88亿,全网渗透率达88.9%,新媒体平台用户规模持续攀升,内容对于流量的驱动作用进一步提升。 2.3网络视听市场高速发展 u短视频用户规模持续增长。截止2022年12月短视频用户规模达10.12亿,在网络视听市场中占比最高。与2021年相比各类用户群里对短视频使用率均有所上升,短视频进一步向各类网民群体渗透。 u短视频人均单日使用时长超2.5小时。2019年人均单日使用时间综合视频与短视频时间近似,随后几年保持20%增速,逐渐与其他各类网络视听细分应用拉开差距。QuestMobile发布《2022中国移动互联网报告》显示,抖音、快手两大短视频App月活分别为7.26亿、5.13亿,远超同期长视频平台。 2.4内容产业供需两端变化 u内容产业供给端持续繁荣,变现规模与内容大盘数据呈现向上发展趋势,创作积极性明显提升,互联网广告、直播电商规模整体呈增长趋势。内容产能和商业变现实现双提升。u内容行业催生新职业群体,以精细化分工赋能产业。内容生态发展催生大批新职业,衍生出更多就业机会,同时加速行业内部的分工细化。2024年7月30日,人力资源和社会保障部会同国家市场监督管理总局、国家统计局正式增设网络主播为国家新职业。u随着数字基础设施的不断完善以及AIGC等新技术对内容生产的颠覆,红人新经济生态将加速对传统产业的升级与改造,在充分发挥现有平台、流量和商业增长优势的同时,延伸服务场景,将现有的互联网人口红利升级为数字经济驱动下的数字化红利。 2.5内容创作方式逐步变革 u随着互联网环境及技术的发展,为适配不同的社会背景及用户需求,多种内容创作方式顺势而生,经历从PGC、UGC到AIGC的演变历程。u在具备一定内容生产基础条件如通讯技术、硬件设备等,AIGC相比其他内容生产形式,其覆盖基础素材到最终产品的一体化流程。AI技术将有内容生产相结合,从成本与创作门槛等方面为突破口,吸引新创作者的同时提高原有产量。u内容生产将不再只是专业内容创作者才可实现,我国10亿多互联网用户均有可能简单、快速的进行包含但不限于:文字、图片或长、短视频等多种形式内容的创作。2023年,发文创作者数量同比增长16%、开播账号数量同比增长83%;内容发布规模同比增长46%。 2.6视频创作或将迎来革新 u2023年以视频为媒介的内容形式渗透率进一步提升,视频化浪潮不可阻挡,需要图文互为补充、共同发展。uAl生成视频的成本远低于各类现有视频内容的制作成本。局部应用已经开始:对于制作质量要求较低、制作方式和内容较为模板化的短剧行业,已经出现AI短剧生成的应用。u模型的性能仍是制约商业应用的主要因素,产出效果与可控性尚未达到商业级标准。为实现商业化,需要专业的提示词技巧和后续的处理步骤。随着未来模型性能的提升,预计相关产品和交互方式将得到进一步优化,从而在模型和产品两个层面提高可控性。 u2024年将成为AI视频的应用元年,未来3-5年更多应用场景将随着模型能力提升和推理成本下降逐步解锁。 2.7 AI参与部分视频制作流程 u海外本土原创微短剧成本高达15万至30万美元,而采用“AI翻译+校对字幕+AI配音”的国内微短剧,1分钟的技术成本约50元,加上换脸技术后,总成本可降至10万元人民币以内,效果显著。u目前,长短视频等产业正将AIGC应用于内容制作。微短剧《柒两人生》使用虚拟拍摄技术使特效周期缩短了10个月,实现生产成本减半。细类模型的整合运用可以令高品质短剧单集成本下降到1000元左右,制作时间缩短到一周1集,显著实现降本增效。 2.8 AI技术助力微短剧制作 uAI技术应用于“文生剧本”环节,将导演创意变成剧本和分镜头脚本,承担传统编剧的工作职能;“文生图像”“图生视频”和“文生视频”环节,从艺术风格、画面主体、场景设置、画面景别等维度,将文字提示转换成视觉画面,并取代传统视频拍摄、表演、制作等多个工种;最后是“文生音频”环节,文生配音和文生配乐的方式简化传统配乐、配音的工作内容。u在传统影视当中,奇幻和科幻两大赛道受制于CG特效的高成本和长周期,虽然有着坚实的观众需求基础,但发展受限。而AI的加入,让奇幻短剧的整个