AI智能总结
: 2022年10月1日,TeslaAIDAY举办,AIday上Tesla人形机器人”擎天柱”首次亮相。根据马斯克的透露,此台人形机器人的成本不到2万美元,远低于汽车,此种类的机器人将生产数百万台。此外,机器人的最终设想是可以替代部分劳动力,人人都可以成为脑力劳动者。 特斯拉AI DAY的见闻与总结 机器人是智能驾驶技术的集大成者。AI day中TESLA的工程师的演讲也印证了我们的猜想,“可以将人形机器人理解成装有两条腿并可以直立行走的汽车。功能:可以独立行走,自由抓取物体,暂未配备智能语音系统,未来预计配备;AI域:相同点,机器人和智能驾驶共用一套FSD系统,绝大部分视觉解决方案和神经网络算法具备通用性;不同点,机器人行走方式、路径规划、安全性考虑角度和智能性方面和智能驾驶略有差 异。动力域:执行器,智能汽车为2个,机器人有28个,受伤关节有11个;减速器,机器人配备6个大小、质量、扭矩不同的减速器;电机,设计理念和汽车基本相同,传感器、执行器、FSD系统共用一个电池系统。 AI猛兽”背后的秘密 由于机器人和智能驾驶共用一套FSD系统,我们认为神经网络是机器人和智能驾驶的本质,而算力实则为算法的基本 “ 食粮”,Tesla自我研发DOJO超级计算机,为智能电车和机器人提供不断地”精神源泉”。DOJO处理器可以差拆分为四个部分即CPU、Switch、Matmult、SIMD,其中Matmult(AI处理器)是可以专注域神经网络的计算,是特斯拉实现“算力猛兽”的根本原因。此外,Dojo超级计算机采用的S-RAM存储架构,相较于D-RAM具有高代宽、利用效率高、低延时、运行速度快等优势;D1(AI处理器)相较于GPU的优势在于运行效率上,平行计算方面AI处理器相较于可以同时处理多个任务;D1芯片和英伟达A100的优势在于:画面帧数传输速度更快、自动标注能力更强,效率更高;最后马斯克透露特斯拉欲将提供AI算法服务,类似于亚马逊的云服务(AWS),此举意味着特斯拉不仅仅是AI公司,未来更有希望成为云公司。 投资建议:关注AI处理器+AI算法+机器人布局厂商 我们认为拥有AI域的机器人有望率先实现商业化落地,拥有AI域的机器人优势在于通过统一的算法和平台软件迭代可以进行快速版本升级,产品交付速度、迭代周期明显更快。同时统一的算法和平台架构可以快速吸引平台开发者,进而加快机器人应用版本功能升级、丰富应用场景。此外,AI域可以大幅提升用户的接受度和体验感,进而实现机器人真正意义上的智能化。 因此积极的推荐以下四条投资主线:1)具备自研AI处理器的厂商,受益标的为寒武纪、商汤、海光信息;2)具备AI算法落地+机器人布局厂商,重点推荐科大讯飞,其他受益标的为大华股份 、 海康威视;3)机器人商业落地的厂商,受益标的为机器人、汇川技术、井松智能、远光软件、亿嘉和、赛为智能;4)具备AI算法落地的厂商,受益标的为虹软科技、云从科技、拓尔思、海天瑞声。 风险提示 政策推进不及预期的风险、宏观经济下滑风险、核心技术研发不及预期的风险、中美贸易摩擦升级的风险。 1.Tesla“擎天柱”首次亮相,“AI怪兽”背后的秘密 1.1.特斯拉AI DAY的见闻与总结 北京时间,2022年10月1日,特斯拉AI DAY举办,一个一个全身裸露电线的人形机器人“擎天柱”缓缓走上特斯拉AI Day 2022的舞台,向现场观众挥手打招呼。据马斯克透露,此台机器人的成本预计不到2万美元,将远低于汽车。此外,马斯克透露,此种类的机器人将生产数百万台,并未来解决枯燥或危险的事,例如家庭、做饭、修草坪等,乃至成为人类的伙伴或伴侣。马斯克对人形机器人的最终设想是机器人可以替代部分劳动力,从而人人都可以选择成为脑力劳动者。 功能:从功能上来看,特斯拉“擎天柱”从现场来看已经可以实现独立行走,从马斯克的发布的视频来看,人形机器人已经可以实现在工厂或者是办公室内搬运物体。然而目前此款机器人并没有搭载人机交互系统(智能语音系统),然而根据马斯克的透露,未来智能语音系统一定会装置在机器人上,进而实现人类和机器人畅通无阻的交流。 机器人是智能驾驶技术的集大成者:AI day中TESLA的工程师的演讲也印证了我们的猜想,“可以将人形机器人理解成装有两条腿并可以直立行走的汽车。” AI域方面:包括传感器和FSD系统:距Tesla工程师透露,人形机器人和Tesla智能驾驶汽车共用一套FSD系统,相关的视觉感知和神经网络的算法和数据都可以应用在机器人中。 相同点,从智能驾驶的算法中看机器人:机器人延续了Tesla智能驾驶的绝大部分神经网络算法,例如纯视觉解决方案,2D到3D的转换,其中包括解决分割、场景理解、目标追踪、图像描述、事件检测等重要机器人视觉神经网路篇。 1.智能驾驶算法:2021年仅有2000位特斯拉车主参加了FSD Beta测试,2022年参与测试的车主已经达到16万,至此,2022年特斯拉全年已经进行了75778个神经网络训练,其中281个模型对于FSD系统进行有效的性能改善,这为Tesla机器人的落地节省了极大的算法和算力的成本。 2、纯视觉解决方案:2D到3D物体转变相关神经网络也应用在机器人领域,特斯拉通过在不同位置的摄像头,得到不同角度的同一物体,在通过神经网络(类似NeRF算法)渲染出该物体的3D图像,并记录该物体的大小及位置;随后生成一个3D向量空间,通过鸟看图的方式,通过另一种神经网络(类似LSTM算法)和物体识别计算出物体下一时间点出现的位置,至此人形机器人完成全部的感知步骤,其中包含三维信息及时间维度信息,并将该信息存储在训练集中,并不断强化学习。 不同点,从智能驾驶和机器人的最大不同: 1、行走方式+路径规划:车与机器人最大的不同就是”车行走依靠的是轮子,机器人行走依靠双腿”,因此机器人的神经网络(FSD系统)需要具有相关”智能性”,在实现语义分割、目标追踪的基础上需要与机器人自己本身的自由度和减速器等硬件方面进行高度协同才能实现双腿行走比如爬楼梯、跨越障碍等和拿取物体,因此我们认为相关算法仍需要相关场景的不断迭代。 2、安全性:由于车辆行驶安全和机器人形式安全不同,其核心的最本质的原因是形式速度和加速度的不同,因此考虑到机器人周围人类的安全性,我们认为相关的场景识别和语义分割仍需要重新”学习”和算法迭代。 动力域方面:包括电机、执行器、减速器:根据工程师的透露,特斯拉机器人和智能汽车在动力域具有”异曲同工之妙”之处,然而细节方面还是略有不同。 执行器:车与机器人执行器最大的不同在于数量上的不同,车的执行器只有两个,作用是是保证其速度和加速度,而到机器人上执行器有28个关节,手部有11个自由度,主要目的是形成较为困难”防人类动作”例如抓取、爬坡等,因此机器人方面,由于压力和执行难度大幅加大,对于关节的要求和难度更高。此外,特斯拉机器人的自由度的设计理念是汽车相同,减少元器件的数量,进而减少能源消耗。 电机:与汽车的设计理念基本相同,功率是2.3kwh,精密的电池组可以维持机器人一天的工作,机器人的传感器、执行器、FSD系统共用一个电池系统,与汽车一致。 1.2.“AI猛兽”背后的秘密 Tesla不仅仅是一家智能驾驶公司,更是一家AI公司。透过马斯克发布机器人的现象看本质,我们认为既然智能驾驶和机器人共用一套FSD系统,神经网络在车和机器人领域具有高度相关性。神经网络的本质机器对极大量的数据进行反复不断的学习。因此,算力实则为数据和算法提供基本食粮,因此TESLA通过自己强大资源整合能力,研发出D1芯片,并通过连接器等建立了世界上首屈一指的超级计算机DOJO,为特斯拉智能驾驶和机器人提供源源不断的“精神”源泉。 TeslaDOJO处理器芯片可以拆解成四个部分即CPU、Switch、Matmult、SIMD 1、CPU即中央处理器,是计算机系列的运行和控制核心,是信息处理、程序运行的最终指令单元; 2、Switch即交换器,是计算机芯片与芯片之间的桥梁,具有数据传输功能; 3、SIMD即单指令流多数据流,可以理解成平行计算,是采用一个控制器来控制多个处理器,介入实现空间并行性的技术,简单来说是一个指令可以处理多个数据; 4、Mat mult即计算单元,即D1芯片,可以专注于神经网络的计算,进而加速神经网络的计算速度,是特斯拉计算机实现算力猛兽的根本原因之一。我们认为可以将该计算单元可以理解成人工智能芯片,即AI处理器,是一款芯片专门用于机器学习的算法及神经网络的运算,可用于训练和推理。 存储器架构:此外值得关注的一点是,特斯拉DOJO超级计算机采取的是S-RAM架构而非是D-RAM架构。 S-RAM(静态随机存储器)相比较于D-RAM(动态随机存储器)架构相比,具有低延时、高带宽、利用率更高、存储成本高、运行速度快等优势,然而缺点就是发热量较大。特斯拉通过纵向整合自己数据中心的结构,对数据中心进行整合,开展了跨系统的管理,使数据的交换速度更快。 D1比GPU的优势: D1(AI芯片)相较于GPU的优势在于效率(功率上):无论是机器人还是智能驾驶,其算法的本质都是大量数据的不断进行神经网络的机器学习,因此对算力要求极大。根据AIday马斯克工程师透露“GPU不是最优解,14亿帧的数据通过GPU才能训练一兆的内容,因此特斯拉不会部署几万个GPU进行叠加存储和运算”。此外,就神经网络训练而言,相较于同期的CPU和GPU相比,可以实现15-30倍的性能提升,以及30-80倍效率(性能)提升。 D1(AI芯片)和GPU的本质差别在于平行运算上,GPU对接平行处理只能逐步处理任务,而D1芯片可以同时进行多个任务处理,因此能耗和效率相差极大。 特斯拉和英伟达最大的不同: 我们认为特斯拉在机器人领域最大的优势在于其强大的D1芯片,特斯拉由于自身原因摒弃了英伟达A100芯片作为超级计算机超级电脑的阵列去做训练。 我们认为DOJO相较于A100的优势分为两点:1、画面帧数传输速度更快:可以看出8Batch SIZE下的Dojo的FPS略高于英伟达A100在192Batch size的状态,言外之意就是在神经网路算法的准确值更高的情况下,Dojo芯片更占据传输速度优势,性能更高。 2、自动标注的能力DOJO1更胜一筹:自动标注是神经网络的初始阶段,较高水平的自动标注能力意味着神经网络的学习能力更强,效率更高。目前状态下的DOJO芯片是英伟达A100芯片自动标注能力的1.3倍。此外,根据AIday的透露,Dojo芯片仍在不断升级,特斯拉预计将2023年Q1阶段,DOJO芯片的生产硬件的自动标注能力是英伟达的2倍、DOJO芯片生产的计算机的自动标注能力是英伟达的3.2倍。 值得关注的一点是马斯克透露,在解决超级计算机的耗能问题后,特斯拉欲将提供神经网络(AI算法)的服务,类似于亚马逊网络(AWS),通过云服务的服务提供给市场。我们认为此未来特斯拉不止是一家AI公司,更是一家提供AI的云公司,同时,TESLA由于其强大的DOJO超级计算机在算力层面取得的巨大优势,相关机器人的神经网络能够进行快速训练学习,机器人有望加速落地。 2.投资建议:关注AI处理器+AI算法+机器人布局厂商 我们认为机器人的受益厂商分为三类:具备自研AI处理器的厂商 具备自研AI处理器的厂商可以为人形机器人的神经网络提供算力支撑。人工智能的本质及数据的海量运算,相较于AI算法,数据才是重中之重。算力作为数据加速处理的动力源泉,其重要性不言而喻。机器学习和神经网络训练环节需要极为庞大的数据输入才能支持一个复杂的神经网络模型,训练过程中由于复杂的神经网络结构和海量训练数据,运算量巨大,因此对于处理器的算力、效率(能耗)要求极大。AI处理器在神经网络和机器学习中,相比于其他处理器,拥有成倍的性能提升,和极低的耗电水平。 机器人相关场景落地厂商 具备相关机器人落地的厂商具有应用场景的先发优势。在我国,部分类别机器人已经实现