您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:人工智能行业专题:SAM带领CV领域技术突破,赋能多场景AI应用 - 发现报告
当前位置:首页/行业研究/报告详情/

人工智能行业专题:SAM带领CV领域技术突破,赋能多场景AI应用

信息技术2023-08-04熊莉、库宏垚国信证券孙***
人工智能行业专题:SAM带领CV领域技术突破,赋能多场景AI应用

请务必阅读正文之后的免责声明及其项下所有内容证券研究报告|2023年08月04日超配人工智能行业专题:SAM带领CV领域技术突破,赋能多场景AI应用核心观点行业研究·行业专题计算机超配·维持评级证券分析师:熊莉证券分析师:库宏垚021-61761067021-60875168xiongli1@guosen.com.cnkuhongyao@guosen.com.cnS0980519030002S0980520010001市场走势资料来源:Wind、国信证券经济研究所整理相关研究报告《计算机行业2023年7月暨中期投资策略-紧抓算力、大模型、应用迭代周期,把握AI带来信息产业革命》——2023-07-17《甲骨文OCI:高性能+经济性,抢占AI云市场》——2023-07-09《ChatGPT用户数据:用户时长及流量分析》——2023-06-28《人工智能行业专题:海外AI基础软件被认可》——2023-06-19《计算机行业2023年6月投资策略-AI大模型发展新趋势,关注AI应用+监管》——2023-06-13SAM模型为CV领域的ChatGPT,为计算机视觉带来技术突破。Meta公司近期推出了其创新的AI模型——SegmentAnythingModel(SAM),专门用于计算机视觉(CV)领域的图像分割任务。这一模型吸取了ChatGPT基于提示(Prompt)的学习范式,实现了预训练与特定下游任务之间的紧密结合,从而显著提高了模型的泛化能力。更为出色的是,SAM还展现出了卓越的零样本学习效果。SAM的设计初衷和核心愿景是为了简化图像分割流程。它旨在减少对专业建模知识的依赖,同时也降低了大规模训练计算的需求。与此同时,SAM模型还大大降低了用户手动标注掩码的需求。其最终目标是使用户在“不会/少会操作、不标注/少标注数据、不训练/少训练模型”的前提下,也能够实现高效的图像目标分割。SAM引起AI届的广泛关注和讨论,并产生相关衍生模型,提升模型功能,增加应用可能性。其衍生模型在分割效率、医学影像分割、阴影缺陷检测、伪体识别和动态图像分割等领域有性能提升,如SEEM模型结合了SAM的零样本泛化能力和检测器,可以根据多种用户输入分割图像或视频中的内容;MedSAM对SAM进行微调,专门针对医学影像分割,并显示出比SAM更优的性能;通过适配方法生成SAM-Adapter,其性能得以提升,特别是在阴影检测和伪装物体分割等任务上;SAM-Track项目拓展了SAM模型,增强其视频分割能力,可广泛应用于多种视频场景,提供高准确性和可靠性的视频编辑功能。SAM衍生模型或可应用与运动场景、医学影像、遥感图像等图像分割难度较大的领域。SAM及其衍生模型可基于强大的性能赋能多场景应用,催生巨大应用蓝海。如SAM在零样本学习上表现优秀,可减少已有的CV领域训练数据量,实现降本增效;或在在标记数据稀缺或获取成本高的领域有许多潜在的应用。可将大模型应用在CV领域的制造业赛道,如工业机器视觉行业;可将模型应用于计算机视觉的下游应用赛道,包括自动驾驶、安防系统、AR领域等;此外遥感图像、医学影像领域,由于图像分割难度较高,技术还需突破,可长期关注。风险提示:1、技术发展不及预期;2、算力、数据支持不及预期;3、应用落地不及预期;4、行业竞争加剧。投资建议:建议关注AIGC在CV领域应用的相关赛道,维持超配评级。AI大模型正在推动空天信息产业的发展,其中遥感大模型技术日益显现其重要性。相对于传统方法的局限性,大模型提供了统一分割、识别和生成遥感图像的能力,显著提高了效率和鲁棒性。基于此推荐相关标的1)航天宏图:推出了天权大模型,提升了各类遥感数据的处理性能;2)中科星图:推出了空天灵眸大模型,推动在线数字地球业务。重点公司盈利预测及投资评级公司公司投资昨收盘总市值EPSPE代码名称评级(元)(亿元)2023E2024E2023E2024E688066.SH航天宏图买入61.70160.391.582.3039.0526.82688568.SH中科星图买入48.50177.240.951.3251.0536.74资料来源:Wind、国信证券经济研究所预测 请务必阅读正文之后的免责声明及其项下所有内容证券研究报告2内容目录SAM模型:CV领域的ChatGPT...........................................................................................................5SAM:“分割一切”的AI新模型......................................................................................................................5Prompt:将ChatGPT的学习思维应用在CV领域............................................................................................5ZSL:零样本学习降本增效,提高模型泛化能力............................................................................................9SA-1B:迄今为止最大的分割数据集,助力模型增效..................................................................................10SAM核心优势:减少训练需求,提升分割性能.............................................................................................12基于SAM二次创作,衍生模型提升性能........................................................................................13SEEM:交互、语义更泛化,分割质量提升....................................................................................................13MedSAM:提升感知力,应用医学图像分割....................................................................................................15SAM-Adapter:阴影检测再升级,伪体分割更精准......................................................................................16SAM-Track:扩展SAM应用领域,增强视频分割性能..................................................................................18SAM及衍生模型赋能多场景应用.....................................................................................................18基于3D重建,赋能AR、游戏.........................................................................................................................18跟踪运动物体,赋能安防监控........................................................................................................................19解决长尾难题,赋能自动驾驶........................................................................................................................20提高分割性能,赋能遥感图像........................................................................................................................21算力应用驱动,赋能机器视觉........................................................................................................................24投资建议............................................................................................................................................26风险提示............................................................................................................................................28 请务必阅读正文之后的免责声明及其项下所有内容证券研究报告3图表目录图1:SAM模型官方文章............................................................................................................................................5图2:自然语言处理(NLP)的常用算法和模型.....................................................................................................6图3:预训练模型(PLM)的发展阶段和特征.........................................................................................................6图4:基于提示的学习(prompt-basedlearning)各分支...................................................................................7图5:传统的预训练+微调模型以及prompt范式...................................................................................................7图6:Fine-tune和prompt两种范式的区别..........................................................................................................8图7:预训练+下游任务微调(PLM+Fine-tun