
调研日期: 2024-05-24 虹软科技股份有限公司是一家领先的计算机视觉算法服务提供商和解决方案供应商,为全球客户提供计算机视觉技术和人工智能技术的商业应用解决方案。公司在杭州、上海、南京、深圳、台北、硅谷、东京、都柏林等地设有商业和研发基地,致力于将先进的计算机视觉技术和人工智能技术应用于智能手机、智能汽车、智能家居、智能零售、互联网视频等各个领域。虹软视觉开放平台支持离线式图像技术,与广大合作伙伴携手推动各类视觉技术应用深入到旅游、教育、政务、出行、社区楼宇、互联网应用等各个领域,引领和推动着视觉技术赋能和落地。在超过20年的发展过程中,虹软聚集了众多的视觉领域专家,并吸纳和培养了来自国内外一流高校的优秀人才作为生力军。虹软将坚持聚焦在技术,注重技术与行业结合的应用经验,融合先进的学术科研力量,为全球的客户和消费者带来真正价值的视觉享受与体验。 第一部分、公司业务情况介绍 一、公司主要业务模块介绍 1、公司手机业务的现状与未来的机会: 公司现在手机业务的情况:2023年,虽然手机市场整体的出货量持续下降,但公司通过技术创新,提升与升级手机视觉算法产品,深入研发并出货了技术含量高的新产品系列“智能超域融合”,此类产品在2023年起就体现了优势,所以公司2023年整体营收同比有较好的提升。 公司未来手机业务的机会:1)目前我们看到在手机AI功能上对计算摄影的需求是比较旺盛的。我们相信未来手机AI功能还会再推动手机的发展,虹软有可能作为手机AI中计算摄影技术的软件供应商,并占据领先优势。2)我们还看到在手机市场领域对于视频成像质量的需求越来越高。因为有大量的视频、社交平台(如抖音、小红书等社交平台)对视频的需求越来越广泛,对视频成像质量的要求越来越高,所以我们相信视频的高质量成像拍摄也是一个很好的机会。3)随着以Apple Vision Pro为终端的3D影像视频逐渐产生,通过消费者在3D影像 设备中对3D影像、3D视频观看的需求,未来在3D影像和3D视频上可能还会有新的机会,而手机作为影像和视频的获取工具,我们相信未来还会有新的发展,而公司在这部分也有较多的布局。 所以我们对整个手机的发展还是比较乐观的。 2、公司智能汽车业务的发展方向: 近年来,公司大力发展智能汽车业务。我们的产品从智能驾驶舱内产品逐渐延伸到智能辅助驾驶舱外产品。目前我们从软件开始,以视觉感知技术为核心,已经可以设计整套包括规控方面的软硬一体产品。在智能辅助驾驶舱外产品上,公司目前有两个产品平台,一个叫“西湖”,是我们中低端的产品平台;一个叫“东湖”,它是向更高等级的自动驾驶方案上研发的,这非常具有挑战性(如:在高通8620的芯片平台上,实现行泊一体/舱泊一体的方案)。 3、公司AIGC商拍业务进展情况: 目前,公司的产品、销售、市场团队在AIGC商拍产品PhotoStudio? AI上花了许多时间和精力,这个市场非常有意义。公司的AI模型在今 年四月底通过网信办备案,随后公司的PhotoStudio? AI智能商拍产品分别入驻阿里巴巴集团旗下的千牛商家工作台、阿里1688平台以及抖店微应用。后续PhotoStudio? AI会与更多其它的平台合作入驻。 二、公司AIGC商拍产品主题分享 2023年10月23日,公司正式发布与上线了PhotoStudio? AI智能商拍产品(以下简称“PSAI”),利用我们自主研发的专属视觉模型和多年积累的视觉引擎,为传统的商拍降本增效,改善传统商拍成本高、周期长、流程繁琐的问题。PSAI上线以来,使用PSAI生成的每张可商用的图片,可为商家节省90%以上的成本。 因为和服装相关的内容生产难度大,衣服所在的细分市场容量可能最高,所以公司也将重心放在了服装、模特相关的产品工程与技术的打磨上。公司PSAI自从上线以来,不断拓展产品的功能边界,陆续推出了商品换背景,真人图片换模特/换背景,人台图片换模特/换背景,衣服平铺图、模特直接试衣图等核心功能,以及智能补光、智能美化、画质提升等AI工具箱功能。通过我们PSAI海量的模特和场景以及快速的 图片生成,给商家提供了丰富的选择,同时我们致力于追求极致便捷的使用体验,利用智能分割、语义分割等技术,让每一位使用者仅需简单的三步点击就可以自动生成,帮助其获得想要的图片。 同时,在此期间我们深耕核心算法,不断改善我们的生成效果和质量,完善我们的工具链,联合合作平台,给商家提供更好的智能生态服务。 ①对于真人图换模特/换背景,我们有着精细的细节保持,例如对有大量皮肤裸露区域的服装,公司依靠精准的边缘和分割的控制,能够生成完美的细节效果。 ②面对复杂的手型,通常存在着手指多生、少生、畸形、粘连、指纹不清晰等问题,公司依然可以生成完美的手势效果。 ③对于模特图换背景这个功能上,我们可以让商家足不出户,就能获得外景照片(例如:商品为一件羽绒服,商家希望到雪山上去拍外景照片),而PSAI可以利用强大的深度引擎,保障生成的图片自然合理。 ④在人台换模特这个功能上,如残缺人台(没有胳膊、头等),在模特生成上难度很高。但PSAI能够覆盖更多种人台类别,利用强大的人体骨 骼点等技术,生成正确、美观、优雅的模特。 ⑤在PSAI更新迭代过程当中,我们发现衣服平铺图和平挂图的试衣功能是智能商拍商家所青睐的主要功能之一。目前我们也是市场上极少数拥有智能试衣技术自主研发的公司,所以相较竞品的方案我们也有了优势。 因为一幅平铺/平挂的衣服图上身,对于衣服版型的还原要求非常严格,例如女士连衣裙,通常会被算法错误地当成T恤,或生成一件上衣塞在裤子里的效果,而我们可以正确地去控制衣服版型;例如特殊设计的露肩短袖,通常算法无法理解衣服肩膀处的特殊设计而生成错误的效果,而PSAI依然可以正确地还原衣服信息;还有服装的logo印花、文字色彩等等细节,体现商家自己设计巧思的细节,PSAI都能很好地保留。 PSAI图生视频功能的上线 ⑥除了上述这些图片生成的核心功能之外,PSAI围绕着服装展示 ,在5月23日全新上线了AI模特的视频生成功能,目前也已经可以在PSAI网站上体验和使用了。 我们的PSAI视频生成功能可以很自然的保持模特特征的一致性,从正面、侧面、大角度上都不会出现异常扭曲,可以很好的表现模特穿上服装之后优雅的风采和神态。 同时PSAI视频生成还可以还原服装的物理效果,比如人穿裙子之后走动时,裙摆的飘动,这其实是一个非常难攻克的技术难题,我们也恰恰是因为这一个小点把产品的上线时间推迟到了现在,这背后隐藏着公司的核心技术优势。 PSAI即将推出的C端产品 ⑦顺着以上智能生成的功能,我们想到如果把模特换成消费者本人,当大家在淘宝、小红书等电商平台和社区上看到心仪的服装之后,也可以将服装很快地穿在自己的身上,然后看到服装上身后的静态图片和动态效果,这样在手机购物和冲浪的过程当中,即便没有实物衣服,消费者也可以有写实、逼真的体验,甚至是暂时买不到或者是买不起的衣服,也可以随时随地的试穿,产生有风采的视频,随时给自己的小伙伴分享穿新衣服的喜悦。 所以我们也依托于相同的引擎和技术组件,打造了一款面向C端用户的APP。目前我们已经完成了产品原型的开发,并且会择机上线。 公司在多年的手机、车载等OEM业务发展过程当中,积累了大量的核心算法,围绕着人、物、景储备了海量的优质引擎。其中人/物技术包括2D、3D的引擎,包括多种的人体/物体检测、识别、边缘、深度等等,而在场景上包括万物的分割、场景理解、光照、影调调整的算法等。这些技术不仅在我们商拍内容的预处理和后处理当中发挥着重要的作用,我们也以此为基础,训练了大量的条件控制小模型,与我们的专属大模型和风格模型结合,通过边界约束条件生成可控的图片、视频与3D内容。这也是我们会持续发展的方向。我们相信AIGC的技术是有着广阔的应用前景和市场规模的,公司的PSAI智能商拍所面对的市场,需要我们做得更好,才能服务更多的商家,我们也希望我们的PSAI未来能够成为公司的主营业务,为公司的发展持续提供动能。 第二部分、提问与回答环节 Q1:目前商拍产品有非常多的玩家,且商拍效果看上去都差不多,公司PSAI与竞品的差异化在哪里? A:公司PSAI与竞品的差异化可以分为两个维度来谈:第一是在客观维度上,产品的基础功能也许非常相似,但在产品成像、生成结果、附 加功能(如二次编辑工具)和解决方案上有所区别。产品成像上,如在分割、手部生成、控制畸变、背景图等等这些细节上,PSAI可以更准确地处理或生成满意的效果;生成结果上,PSAI更趋向于在保证生成的图片符合物理逻辑的情况下,还原商品本身的质感、质量;附加功能上,公司PSAI开发了各种二次编辑功能,如智能补光、智能美化、魔法擦除等精修功能;在解决方案上,PSAI采用一站式解决方案,更加智能便捷的生成结果图。第二是在主观维度上,因为对于图片生成结果的满意度,是非常主观的东西,每个使用者有着不同的审美,最后能体现获客能力、增加客户使用粘性,才能最终赢得市场的喜爱,而这是公司PSAI需要持续跟进市场、不断更新的地方。 A:目前PSAI用户基数较低,没有形成规模化的数据可供分析,待数据稳定且规模化我们会告诉大家。 Q3:公司如何计划PSAI To C的APP产品未来的推广和运作的? A:PSAI APP产品,是我们基于PSAI To B产品的功能而思考研发的,我们想到如果把模特换成消费者本人,当大家在淘宝、小红书等电商平台和社区上看到心仪的服装之后,也可以将服装很快地穿在自己的身上,然后看到服装上身后的静态图片和动态效果,这样在手机购物和 冲浪的过程当中,即便没有实物衣服,消费者也可以有写实逼真的体验,甚至是暂时买不到或者是买不起的衣服,也可以随时随地的试穿,产生有风采的视频,随时给自己的小伙伴分享穿新衣服的喜悦。 所以我们也依托于相同的引擎和技术组件,打造了一款面向C端用户的APP。目前我们已经完成了产品原型的开发,并且会择机上线。在PSAI APP产品未来的推广和运作方面,公司也在非常认真的评估与计划中,待有可以公开的新进展,公司会及时和大家分享。Q4:AIGC市场是一个非常大的市场,公司未来在AIGC市场的投入与技术人员的规划上是怎样的? A: PhotoStudio? AI智能商拍,是我们在AIGC市场的切入点与驱动方式。公司将不断优化ArcMuse计算技术引擎,并将ArcMuse的新能力应用到包括云工作室在内的产品上。且通过技术发展和市场发展模式创新来助推技术的进一步升级,整合内外部资源,进一步丰富AIGC产品矩阵,使之可以运用到手机、汽车等领域。未来公司会根据市场重点需求有序地进行投入,继续探索,把虹软AI技术带到更多的智能设备领域和应用场景,助力更多“视觉人工智能+X”产业的发展。 Q5:公司在AI端侧(含AI手机)上的布局是怎样? A:手机AI功能、应用是未来的大趋势,但就AI功能而言,目前手机上的AI应用更多的是以交互、语音以及提高生产效率类应用为主。未来智能手机上会衍生AI大模型的应用,所以AI手机预计会把大算力、耗时较长的功能都放到相机及相册里,我司的视觉算法在这块也会有一些衍生技术产品,例如在手机相机中引入大模型的技术或者拓展公司自己的应用,来帮助与大模型相关的视觉算法在手机相机及相册上落地,这是公司未来的机会之一。 Q6:公司PSAI视频生成的效果很好,目前大概花费在5-10分钟的时间能使生成视频,在后续阶段性生成数据上不会有时间上的提升?在算力投入上公司有什么投入计划? A:针对目前PSAI图生视频产品上,公司目前的目标是在公司算力可以承受的范围内快速上线产品,未来如需在算力上扩充,我们会根据实际情况通过租用或采购芯片增加算力。 Q7:公司在智能驾驶产品上目前的市场地位怎样?智能驾驶产品未来着重要往那个方向发展? A:公司智能驾驶产品分为两种产品形态,一种是一站式软件解决方案,一种是一站式软硬一体解决方案。在VisDrive?一站