根据提供的文字内容,以下是针对传媒行业AI应用的总结:
主要观点
技术架构与适配性
- 技术架构:研究框架分为“通用大模型”和“行业小样本”,强调大模型对垂直应用的适配性和迭代速度。大模型的适配性涉及多模态输入与输出是否匹配应用需求,迭代速度则依赖于行业小样本数据量能否满足模型更新需求。
- 适配程度:适配程度是指大模型是否能有效地处理特定行业的输入和输出数据。例如,GPT-4适用于“图+文”的多模态输入与“文”单模态输出的垂直应用。
- 迭代速度:迭代速度取决于行业小样本数据量是否足够丰富,以支持模型的持续优化。
行业小样本与大模型结合
- 数据集来源:小模型或应用及内容可以作为行业小样本的源头,这些数据集合了特定场景的特有信息。
- 结合方式:结合方式包括“能力调用”和“能力训练”。前者指下游应用直接调用大模型能力,后者则是应用层数据回流优化大模型性能。
- 调用与训练:调用侧重快速获取大模型能力,训练则涉及应用层数据反哺大模型,提升模型对特定场景的适应性。
AI+传媒的投资视角
- 数据与内容匹配:数据与内容的匹配程度决定了应用的效率和效果。匹配大模型输出模态有助于提升应用效能。
- 数据与内容的质量:数量大、质量高的数据集对模型迭代至关重要,尤其是在文本、图像、视频、影视和游戏中。
具体案例分析
- Midjourney:作为AI图像生成领域的领军企业,Midjourney通过差异化的产品定位积累了早期数据和活跃社区。其基于开源模型构建闭源模型,通过数据飞轮快速迭代模型,实现技术创新和用户增长。V5版本解决了多项技术难题,提高了图像质量和处理能力,特别是在细节识别和多物体场景塑造方面表现出色。
- 投资建议:聚焦于AI+文本/虚拟人的公司,如【芒果超媒】;关注海外用户/业务的公司,如【汤姆猫】、【昆仑万维】等;考虑中国版Discord【创梦天地】;以及【浙文互联】、【视觉中国】等在图像生成领域的标的。
风险提示
- 宏观经济风险:AI技术投入大,资本支出高,宏观经济波动可能影响公司的经营状况。
- 地缘政治风险:数据安全问题可能导致政治风险。
- 技术发展不及预期:GPT与下游应用的结合可能存在不确定性。
- AIGC行业发展不及预期:底层技术发展受限可能影响整体应用前景。
结论
该研究着重于AI在传媒行业的应用,特别是通过“通用大模型”与“行业小样本”的结合,探讨了如何通过数据与内容的匹配和优化,提升AI在垂直应用领域的效能。通过具体案例分析,如Midjourney的成功经验,为投资者提供了行业内的投资机会和风险考量。