AI智能总结
计算机视觉是机器认知世界的基础,也是人工智能应用前景最为广阔的细分领域之一。计算机视觉指使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解、分析图像以及图像序列的能力。简单来说,类似于人类依靠双眼进行外界视觉感知,计算机视觉就是借助光学、电子元器件给计算机提供一双眼睛,并依靠人工智能的算法去教会计算机如何使用眼睛获取有用信息。 技术持续提升,带动千亿级规模市场。在数据、算力和算法的进步与驱动下,近年来人工智能商业成熟度不断提升。计算机视觉技术主要基于使用神经网络的深度学习算法,神经网络和深度学习的快速发展极大推动了计算机视觉的发展,使其成为人工智能行业中成熟度相对更高、商业落地较早的技术。数据量的爆炸式增长、算力的大幅提升、深度学习算法的日益优化也是计算机视觉行业快速发展的三大因素。 AI行业目前主要有四类玩家。目前,人工智能行业的主要参与者可分类为国际机器视觉企业、综合型科技企业、技术型科技企业及智能化转型的硬件厂商等四大阵营。各类企业因资源禀赋、创新能力、经营策略等方面的差异,其经营模式、产品服务及应用领域等各有侧重。 推荐虹软科技、格灵深瞳,受益商汤科技、旷视科技、依图科技、云从科技、云天励飞。随着技术逐渐成熟化,AI将会被应用于越来越多的行业和场景。其中计算机视觉作为人工智能的最重要应用领域,拥有广阔的前景。我们认为,技术与场景是衡量计算机视觉公司实力和未来发展前景的重要指标,故我们综合目前AI视觉技术成熟程度、AI视觉业务在自身业务中的占比情况以及所处行业的景气程度等方面的因素,推荐虹软科技、格灵深瞳,受益商汤科技、旷视科技、依图科技、云从科技、云天励飞。 风险提示:安防、金融等行业增速快速下行;AI在对于小概率事件敏感的领域落地不及预期 1.计算机视觉:人工智能主要应用领域 1.1.计算机代替人眼识别,运用算法处理解释 计算机视觉是机器认知世界的基础,也是AI应用前景最为广阔的细分领域之一。计算机视觉指使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解、分析图像以及图像序列的能力。简单来说,类似于人类依靠双眼进行外界视觉感知,计算机视觉就是借助光学、电子元器件给计算机提供一双眼睛,并依靠人工智能的算法去教会计算机如何使用眼睛获取有用信息。 计算机视觉以准确率、召回率和误报率作为衡量指标。近年来,随着深度学习算法的发展,在计算机视觉领域,很多研究成果已取得接近甚至超过人类视觉系统的突破性进展。计算机视觉技术通常以准确率、召回率和误报率作为衡量指标,准确率是指提取正确的信息占全部需要待提取信息的比例,召回率是指算法选择报告样本中正确样本的比例,误报率是指算法选择报告样本中错误样本的比例。通常情况下准确率越高、召回率越高或误报率越低则表明计算机视觉算法的性能表现越好。 计算机视觉不同于机器视觉,运用算法对图像、视频进行处理和解释。 以图像识别举例,对于机器视觉,在识别某个图像的时候,系统不需要知道这个东西是什么,而只需要做标定。比如工程师拍了很多角度的路标的图片作为样张,然后把它送到模型里。经过训练,系统在看到新的照片时就可以通过损失函数来判断它和样张的相似度,从而识别是不是路标。而计算机视觉则是先描绘路标的轮廓,把它的特征表述出来,检测的时候直接识别轮廓,如果轮廓相似度比较高系统才认为它是路标。 图1:计算机视觉与其他领域存在千丝万缕的联系 1.2.计算机视觉核心技术,层层递进 计算机视觉系统五大方向。近来随着深度学习的发展,预处理、特征提取与算法处理渐渐融合,形成端到端的人工智能算法技术。参考《人工智能标准化白皮书》的说法,根据解决的问题,计算机视觉可分为计算成像学、图像理解、三维视觉、动态视觉和视频编解码五大类。 请务必阅读正文之后的免责条款部分 1)计算成像学:计算成像学是探索人眼结构、相机成像原理以及其延伸应用的科学。在相机应用科学方面,计算成像学可以提升相机的能力,从而通过后续的算法处理使得在受限条件下拍摄的图像更加完善,例如图像去噪、去模糊、暗光增强、去雾霾等,以及实现新的功能,例如全景图、软件虚化、超分辨率等。 2)图像理解:图像理解是通过用计算机系统解释图像,实现类似人类视觉系统理解外部世界的一门科学。通常根据理解信息的抽象程度可分为三个层次:浅层理解,包括图像边缘、图像特征点、纹理元素等;中层理解,包括物体边界、区域与平面等;高层理解,根据需要抽取的高层语义信息,可大致分为识别、检测、分割、姿态估计、图像文字说明等。目前高层图像理解算法已逐渐广泛应用于人工智能系统,如刷脸支付、智慧安防、图像搜索等。 3)三维视觉:三维视觉即研究如何通过视觉获取三维信息(三维重建)以及如何理解所获取的三维信息的科学。三维重建可以根据重建的信息来源,分为单目图像重建、多目图像重建和深度图像重建等。三维信息理解,即使用三维信息辅助图像理解或者直接理解三维信息。三维视觉技术可以广泛应用于机器人、无人驾驶、智慧工厂、虚拟/增强现实等方向。 4)动态视觉:动态视觉即分析视频或图像序列,模拟人处理时序图像的科学。通常动态视觉问题可以定义为寻找图像元素,如像素、区域、物体在时序上的对应,以及提取其语义信息的问题。动态视觉研究被广泛应用在视频分析以及人机交互等方面。 5)视频编解码:视频编解码是指通过特定的压缩技术,将视频流进行压缩。视频压缩编码主要分为两大类无损压缩和有损压缩。无损压缩应用于磁盘文件的压缩等,而有损压缩的应用广泛,例如视频会议、可视电话、视频广播、视频监控等。 计算机视觉系统包含五大基础功能。虽然计算机视觉系统的结构形式很大程度上依赖于其具体应用方向,但它们有些功能是几乎是每个计算机系统都具备的。计算机视觉现在可实现主要功能包括图像获取、预处理、特征提取、检测/分割、高级处理等。 图2:计算机视觉技术从获取、预处理、初级、中级、高级处理五大层级 图3:检测分割技术从包括语义分割、实例分割、全景分割等 2.人工智能商业成熟度提升,计算机视觉加速发展 2.1.数据、算力和算法驱动,人工智能迈入快车道 在数据、算力和算法的进步与驱动下,近年来人工智能商业成熟度不断提升,行业进入加速发展阶段。与此同时,人工智能与传统产业的融合发展,彰显出了巨大的市场潜力,吸引了包括国内外科技巨头、解决方案及设备供应商、传统行业龙头企业以及人工智能企业等各类企业,积极参与到各个层面及细分领域的发展布局和市场竞争中。各类企业因资源禀赋、创新能力、经营策略等方面的差异,其经营模式、产品服务及应用领域等各有侧重。行业内主要企业具体情况如下: 图4:人工智能技术已经渗透至各个行业中 人工智能行业产业链可分为基础层、技术层、应用层。 基础层:主要包括芯片、软件框架、传感器、服务器、数据(集)等软硬件及服务,为技术层提供算力、数据等底层支撑,是人工智能发展的重要基石。 技术层:主要通过基础层的算力、数据支持,进行海量模拟训练和机器学习建模,为人工智能提供核心的算法与应用技术,主要包括以深度学习为代表的算法模型,以及计算机视觉、智能语音、机器学习、生物特征识别、知识图谱等关键技术。技术层是人工智能发展的核心,对应用层的智能化发展起到决定性作用。 应用层:基于基础层与技术层,面向特定应用场景需求而形成的软硬件产品或解决方案。人工智能应用广泛,可有效赋能下游领域实现人工智能应用,为其转型与发展注入强劲新动能。 2.2.人工智能核心计算机视觉,场景应用快速扩展 作为人工智能行业的率先取得突破、应用场景明确的关键分支,计算机视觉产业链也可分为基础层、技术层、应用层。基础层包括硬件支持、算法支持和数据集;技术层包括视觉技术平台、视频识别、图片识别和模式匹配;应用层包括计算机视觉技术在智慧城市、智慧安防、智慧物流、智慧金融、手机终端和智慧商业等领域的应用。随着机器学习的不断推进,图像及视频识别准确率持续提升,计算机视觉算法向着高效求解复杂问题、进行全局优化的方向发展。 图5:计算机视觉产业链包括基础层、技术层、应用层等 计算机视觉技术实际应用的技术领域不断扩展。从最初的静态人脸识别和光学字符识别起步,逐渐扩展到了人脸识别分析、活体检测、人体识别分析、物体检测识别、行为识别分析、人体重识别、医疗影像诊断技术等诸多种方向。 除了技术越发成熟,计算机视觉技术与场景结合的应用领域也越来越广泛,除应用较早的安防、金融、互联网等领域之外,城市治理、楼宇园区、医疗影像等创新领域正逐步实现应用,成为计算机视觉技术快速发展的重要支撑,计算机视觉领域市场规模仍处在高速增长阶段,中国有高达42%的企业应用计算机视觉相关技术。 2.3.技术持续提升,带动千亿级规模市场 近年来,全球高度重视计算机视觉的研究和应用,在核心技术和产业化应用上的研发投入持续增加。计算机视觉技术主要基于使用神经网络的深度学习算法,神经网络和深度学习的快速发展极大推动了计算机视觉的发展,使其成为人工智能行业中成熟度相对更高、商业落地较早的技术。数据量的爆炸式增长、算力的大幅提升、深度学习算法的日益优化也是计算机视觉行业快速发展的三大因素: 1)数据为深度学习算法提供训练支撑。海量的应用场景数据为计算机视觉算法提供训练基础,从而使得计算机视觉算法精准度提升,让机器最终实现精准的视觉识别。 2)人工智能芯片的发展不断提升计算机视觉算力。GPU、FPGA、ASIC等专用芯片具有良好的并行计算能力,大幅提升了数据处理速度,缩短了计算过程和模型架构调整时间,为计算机视觉的发展提供了算力支持。 3)深度学习算法的发展有效提升计算机视觉准确度。深度学习算法是以多层神经网络为基础,以海量数据为输入的规则自学习方法。它能够通过输入的海量行为数据对规则中的参数进行调整,让机器通过数据训练,在数据库中自行归纳物体特征,而后依照其归纳出的规律对物体进行识别。 2021年,我国计算机视觉核心产业规模和带动相关产业规模分别为989.6亿元和3079亿元,占人工智能核心产业和带动相关产业规模的比重分别达到49.5%和40.0%。通过对下游行业需求统计测算,2021年,中国计算机视觉核心产品的市场规模已接近千亿元大关。此外,与计算机视觉相关的计算机通信设备销售、工程建设、传统业务效益转化等带动相关产业规模超过3000亿元。且在未来的几年中, 图6:2019-2025年中国计算机视觉市场规模仍将快速增长 2.4.四类企业划分市场格局,多层次发力 目前,人工智能行业的主要参与者可分类为国际机器视觉企业、综合型科技企业、技术型科技企业及智能化转型的硬件厂商等四大阵营。 1)国际机器视觉企业:康耐视和基恩士等国际企业作为传感器和测量仪器的主要供应商,在工业自动化的发展历程中打造了底层开发的研究基础,形成了种类丰富的机器视觉产品体系,系机器视觉领域的先驱者。 2)综合型科技企业:以百度、华为等为首的综合型科技企业全面布局人工智能的基础层、技术层和应用层,既着力于开发计算和开放平台,面向人工智能云边端的自主研发芯片产品,又注重结合场景,提供行业解决方案和消费级产品并已实现规模化销售,系人工智能行业的重要参与者。 3)技术型科技企业:商汤科技、依图科技、云从科技、科大讯飞、云天励飞、虹软科技、汇顶科技、寒武纪等技术型企业以计算机视觉、语音识别、人工智能芯片等分支技术方向为出发点,顺应行业趋势,迅速发展壮大,系人工智能行业的中坚力量。 4)智能化转型的硬件厂商:海康威视、大华股份等硬件厂商以传统的摄像头为基础,通过硬件的智能化转型切入人工智能行业,系人工智能行业的重要参与者。 中国计算机视觉厂商具有基于基础算法进行改进和优化并形成各自特有算法的技术能力。据IDC统计,2019年商汤科技、旷视科技、云从科技、依图科技四家企业占国内计算机视觉应用市场份额的51.40%。 图7:商汤、旷世、依图、云从等公司是计算机视觉的重要玩家 而计算机视觉的下游应用包罗万象,既可以直接输出通用的技术,也可以结合垂直行业的痛点提供