AI智能总结
本周观点: 一、Gen-2震撼发布,生成式AI的下一步 Gen-2震撼发布,视频生成式AI新突破。我们认为Gen-2的横空出世是具有里程碑的意义,寓意着多模态人工智能技术实现了从AI文生图到AI文生视频的跨越。相较于Gen-1,Gen-2模型功能强大,在Gen-1的基础上添加了新功能,例如文生视频。图+文字生成视频等功能。Gen-28种工作模式全面助力多模态。此8种模式分别为文字转视频、文字+图片转视频、图像到视频、程式化、故事板、面具、渲染、自定义。 二、模型产品快速迭代,多模态AI技术涌现 从商业模式来看,Runway是一个AI native tools工厂,从产品特征来看,Runway定位于专业、协作、快、很多AI Magic Tools。依托于AI技术快速发展,Runway短时间内不断推出应用于产品的新模型框架,Latent Diffusion、Stable Diffusion、Gen-1、Gen-2图像视频编辑软件,时间点分别为2021年、2022年、2023年2月和2023年3月。Runway市场定位清晰,流量潜力巨大,收费方式是个人专业版12美元/月,团队版28美元/月;多模态百花齐放,Text to Video(文生视频)技术快速发展,相应的技术储备厂商分别为谷歌和META。 三、AI强势进军影视,多模态开启新纪元 我们认为多模态尤其是AI生成视频技术是全新的AI创作方式,同样是解放生产力的双手。例如任何人都可以借助Runway等公司在专业广告、产品摄影、传媒、电影制作等场景里打开创作空间。目前,Runway已经应用在电影制作中,例如《瞬息全宇宙》,此外Runway的客户还包括传媒集团CBS、MBC,广告公司Assembly等。同时,我们认为多模态有望赋能千行百业例如教育、金融、建筑、遥感信息化等领域。此外我们认为多模态虽然技术强大,但仍具备挑战,对以下方面提出更高技术要求,例如人工智能技术实现了从AI文生图到AI文生视频的跨越。 四、投资建议 我们认为多模态的出现会持续引领AIGC的潮流,边缘侧相关产品及应用侧有望打开海量空间,因此推荐以下5条投资主线。 1、边缘信号侧,受益标的包括海康威视、大华股份、当虹科技、科大讯飞等; 2、边缘芯片侧,受益标的包括云天励飞、国芯科技、寒武纪、海光信息等; 人工智能技术实现了从AI文生图到AI文生视频的跨越3、边缘算力侧,受益标的包括首都在线、优刻得、网宿科技、光环新网、新炬网络等; 4、多模态应用端,受益标的包括福昕软件、金山办公、万兴科技、华建股份、广联达、航天宏图、中科星图等 5、传媒类公司,受益标的包括神州泰岳、三七互娱、昆仑万维等元宇宙、数字人、游戏、出版等相关标的。 投资建议 重申坚定看好云计算SaaS、能源IT、金融科技、智能驾驶、人工智能等景气赛道中具备卡位优势的龙头公司,积极推荐以下七条投资主线:1、信创:国产数据库领军太极股份,国产WPS龙头厂商金山办公(与中小盘组联合覆盖),国产服务器龙头中科曙光,“中国芯”海光信息。其他受益标的还包括:1)信创软件:中国软件、用友网络、星环科技、海量数据、麒麟信安等。2)信创硬件:中国长城、龙芯中科、拓维信息、神州数码等。2、新能源IT:重点推荐新能源SaaS龙头国能日新、配网调度先头兵东方电子、能源互联网唯一标的朗新科技(通信组联合覆盖)。3、金融科技:重点推荐证券IT恒生电子,此外宇信科技、长亮科技、同花顺均迎景气上行。4、智能驾驶:重点推荐智能座舱龙头德赛西威(汽车组联合覆盖)、座舱+驾驶OS龙头中科创达、此外高精度地图领军四维图新为重点受益标的。5、人工智能:重点推荐智能语音龙头科大讯飞。6、网络安全:重点推荐商密+自研芯片三未信安,新兴安全双龙头奇安信+深信服,安恒信息作为细分新兴安全龙头也将深度受益,其他受益标的包括:启明星辰、美亚柏科等。7、云计算SaaS:重点推荐企业级SaaS龙头用友网络、办公软件龙头金山办公(与中小盘联合覆盖)、超融合领军深信服。 风险提示 市场系统性风险、科技创新政策落地不及预期、 中美博弈突发事件。 1.本周热点:Runway AI生成视频,多模态引领新纪元 一、Gen-2震撼发布,生成式AI的下一步 Gen-2震撼发布,视频生成式AI新突破。我们认为Gen-2的横空出世是具有里程碑的意义,寓意着多模态人工智能技术实现了从AI文生图到AI文生视频的跨越。 相较于Gen-1,Gen-2模型功能强大,在Gen-1的基础上添加了新功能,例如文生视频。图+文字生成视频等功能。Gen-28种工作模式全面助力多模态。此8种模式分别为文字转视频、文字+图片转视频、图像到视频、程式化、故事板、面具、渲染、自定义。 二、模型产品快速迭代,多模态AI技术涌现 从商业模式来看,Runway是一个AI native tools工厂,从产品特征来看,Runway定位于专业、协作、快、很多AI Magic Tools。依托于AI技术快速发展,Runway短时间内不断推出应用于产品的新模型框架,Latent Diffusion、Stable Diffusion、Gen-1、Gen-2图像视频编辑软件,时间点分别为2021年、2022年、2023年2月和2023年3月。Runway市场定位清晰,流量潜力巨大,收费方式是个人专业版12美元/月,团队版28美元/月;多模态百花齐放,Text to Video(文生视频)技术快速发展,相应的技术储备厂商分别为谷歌和META。 三、AI强势进军影视,多模态开启新纪元 我们认为多模态尤其是AI生成视频技术是全新的AI创作方式,同样是解放生产力的双手。例如任何人都可以借助Runway等公司在专业广告、产品摄影、传媒、电影制作等场景里打开创作空间。目前,Runway已经应用在电影制作中,多模态大有可为,例如《瞬息全宇宙》,此外Runway的客户还包括传媒集团CBS、MBC,广告公司Assembly等。同时,我们认为多模态有望赋能千行百业例如教育、金融、建筑、遥感信息化等领域。此外我们认为多模态虽然技术强大,但仍具备挑战,对以下方面提出更高技术要求,例如数据收集、数据对齐与标注、边缘硬件、边缘算力。 四、投资建议 我们认为多模态的出现会持续引领AIGC的潮流,边缘侧相关产品及应用侧有望打开海量空间,因此推荐以下5条投资主线。 1、边缘信号侧,受益标的包括海康威视、大华股份、当虹科技、科大讯飞等; 2、边缘芯片侧,受益标的包括云天励飞、国芯科技、寒武纪、海光信息等; 3、边缘算力侧,受益标的包括首都在线、优刻得、网宿科技、光环新网、新炬网络等; 4、多模态应用端,受益标的包括福昕软件、金山办公、万兴科技、华建股份、广联达、航天宏图、中科星图等 5、传媒类公司,受益标的包括神州泰岳、三七互娱、昆仑万维等元宇宙、数字人、游戏、出版等相关标的。 投资建议:重申坚定看好能源IT、云计算SaaS、金融科技、智能驾驶、人工智能等景气赛道中具备卡位优势的龙头公司,积极推荐以下七条投资主线: 1、信创:国产数据库领军太极股份,国产WPS龙头厂商金山办公(与中小盘组联合覆盖),国产服务器龙头中科曙光,“中国芯”海光信息。 2、新能源IT:重点推荐新能源SaaS龙头国能日新、配网调度先头兵东方电子、能源互联网唯一标的朗新科技(通信组联合覆盖)。 3、金融科技:重点推荐证券IT恒生电子,此外宇信科技、长亮科技、同花顺均迎景气上行。 4、智能驾驶:重点推荐智能座舱龙头德赛西威(汽车组联合覆盖)、座舱+驾驶OS龙头中科创达、此外高精度地图领军四维图新为重点受益标的。 5、人工智能:重点推荐智能语音龙头科大讯飞。 6、网络安全:重点推荐商密+自研芯片三未信安,新兴安全双龙头奇安信+深信服,安恒信息作为细分新兴安全龙头也将深度受益,其他受益标的包括:启明星辰 、美亚柏科等。 7、云计算SaaS:重点推荐企业级SaaS龙头用友网络、办公软件龙头金山办公 、超融合领军深信服。 2.本周热点内容 2.1.Gen-2震撼发布,生成式AI的下一步 Gen-2震撼发布,视频生成式AI新突破。一家名为Runway的人工智能创业公司宣布了一款新的文本生成视频(Text-to-video)AI模型,名为Gen-2,文本生成视频也就是用户可以输入一个描述,然后系统自动生成任何风格的对应视频。根据官网的描述,Gen-2为一个多模式人工智能系统,可以生成带有文本、图像或视频剪辑的新颖视频。我们认为Gen-2的横空出世是具有里程碑的意义,寓意着多模态人工智能技术实现了从AI文生图到AI文生视频的跨越。 今年2月,Runway提出了首个AI编辑模型Gen-1。Gen-1可以在原视频的基础上,编辑出客户需求的视频。其中包括粗糙的3D动画、手机拍出来的摇摇晃晃的视频,Gen-1都可以升级出不可思议的效果。 Gen-1具有4大主要功能:1、程式化:,将文本提示的风格转移到视频的每一帧; 2、故事板,通过输入图像改变视频每一帧的风格;3、面具,隔离视频中的主题,并使用简单的文本提示对背景进行修改;4、自定义,保持视频背景的不变,直接修改视频的主体。 Gen-1属于AI文本+视频的模式。Gen-1模型并不支持文本提示语生成视频,必须提供一个初始视频,然后可以叠加文字提示语或叠加图片提示,生成新的视频。使用极其便捷,只需在官网输入框上传一个视频外加简单提提示语即可。 Gen-2功能升级,多模态的下一站。相比于Gen-1模型,Gen-2模型功能强大,在Gen-1的基础上添加了新功能,例如文生视频。图+文字生成视频等功能,此外在分辨率、内容和图型渲染等方面取得更优异的成绩。 8种工作模式全面助力多模态。此8种模式分别为文字转视频、文字+图片转视频、图像到视频、程式化、故事板、面具、渲染、自定义。 1、文字转视频。与文生图具有异曲同工之妙,客户仅通过文本即可完成任何风格视频。例如下图输入“傍晚的阳光透过纽约市阁楼的窗户窥视”。 2、文字+图片转视频。客户通过输入图片和文本提示即可生成相关视频,例如官网所示,输入一张图片与一段文字“一个男人走在街上的低角度镜头,周围酒吧的霓虹灯照亮了他”。 4、程式化。延续了Gen-1的风格,将任何图像或提示的风格转移到视频的每一帧。 5、故事板。同样延续了Gen-1的风格,将模板完成完全风格化和动画的渲染。 6、“面具”。延续Gen-1的风格,隔离视频中的主题并使用简单的文本提示对其进行修改。例如下图将白色的狗转变为“斑点狗”,原理类似图层分离。 7、渲染。延续Gen-1的风格。通过应用输入图像或提示,将无纹理渲染变成逼真的输出,我们认为视频输出具有真实感。 8、自定义。延续Gen-1功能,通过自定义相关模型改变原有视频,并输出客户自定义效果的视频,我们认为其具有高保真度。 2.2.模型产品快速迭代,多模态AI技术涌现 5月5日,AI初创公司Runway从一家云服务提供商融资至少1亿美元,估值达15亿美元,这也是Runway上一轮融资后估值的三倍。Runway是2018年成立的一家AI视频编辑软件供应商,20-22年公司陆续完成A、B、C三轮融资,C轮由Felicis领投5000万美元。Runway以“AI +视觉创作”为载体,随着AI技术迭代,快速推出了30多个图像视频编辑工具,已有不少在业界成为爆款。目前,公司已经开发了Latent Diffusion、Stable Diffusion、Gen-1、Gen-2图像视频编辑软件。 从商业模式来看,Runway是一个AI native tools工厂,始终基于AI新技术的前沿边界,寻找视频和图像编辑的全新方法,他们借助云计算和AI的力量塑造普及化的内容创作工作流,未来有望成为新一代内容平台。从产品特征来看,Runway定位于专业、协作、快、很多AI Magic Tools,致力于塑造以合作为中心的自动化创作工具,关键是ML驱动和云原