证券研究报告2024年05月28日 重新定义操作系统 人工智能系列报告(五) 核心结论 AI与终端的结合,将重塑人机交互——从响应式进化为主动式,从“人找服务”进化为“服务找人”。谷歌安卓与微软windows领衔,大模型加持下,“服务找人”理念已初步体现在最新系统中。传统情况下用户主动搜索应用、手动启动服务的行为模式,将逐渐让位于一种更为智能化、前瞻性的互动体验。终端OS通过与大模型融合,实时分析用户上下文并预测需求,进而自主推断并执行服务,无需用户显式指令,人机交互向更加自然、无感的境界迈进。 我们认为实现从被动响应到主动服务的跨越,达成“服务找人”的愿景,首先需要打造系统级AI,即将大模型技术与操作系统深度融合,因为只有系统级AI才能跨越单一应用边界,打破数据与功能的孤岛,无缝融入用户的日常交互流程。 1)谷歌宣布即将推出的Android 15将以AI为核心,Gemini将成为Android的基础部分,可在系统层面运行。同时,谷歌还使用本地小模型Gemini Nano来保障用户数据安全,端云AI协同为用户带来更好的体验。Gemini将在Android上充当AI助手,而不是Google Assistant,Gemini AI将能够作为任何正在使用的应用程序的叠加层出现。 分析师 郑宏达S080052402000113918906471zhenghongda@research.xbmail.com.cn 2)苹果有望与OpenAI合作,把一系列生成式AI功能加入即将推出的iOS 18中。一个代号为“Project Greymatter”的AI工具套件或将集成到Safari、照片、语音备忘录等苹果的核心应用之中。 相关研究 计算机:阿里通义千问:从模型到生态全方位领先—AI行业跟踪点评2024-05-27计算机:从高通看端侧智能时代的到来—计算机行业周观点第12期2024-05-26计算机:端侧模型与操作系统的融合—计算机行业周观点第11期2024-05-19 3)微软发布Copilot + PC,大模型技术从应用层向下延伸至系统层面,新增多项系统级AI功能,如Recall、理解屏幕内容并与用户实时交互、系统级AI实时翻译功能等。 4)鸿蒙OS也将与AI深度融合。早在2021年,华为就设想未来的万物智联是通过智能助手“小艺”实现统一交互,解决不同IoT设备入口的差异,然后从海量应用中找到合适的服务并主动推荐给用户。 随着AI技术的深度整合,操作系统地位抬升,价值将被重新定义。大模型时代的操作系统正逐渐进化为一个更加智能的平台,除了传统的为应用程序提供运行环境和支持外,还将成为调度中心,作为“入口”衔接用户和APP。而这一转变中,我们认为操作系统需具备两大核心能力:1)读懂屏幕的能力;2)跨应用调度的能力。 推荐:软通动力、中科创达。建议关注:中国软件国际、中国软件、诚迈科技。 风险提示:AI技术突破不及预期、终端智能需求不及预期、宏观经济增长不及预期、国际环境变化。 1|请务必仔细阅读报告尾部的投资评级说明和声明 内容目录 一、从响应式到主动式,从“人找服务”到“服务找人”..............................................................3二、大模型将与操作系统深度融合,系统级AI将成为AI终端标配......................................3三、操作系统将成为APP调度中心,价值量有望跃升..........................................................8四、风险提示.......................................................................................................................10 图表目录 图1:Gemini会主动询问用户对刚刚接收的PDF长文档有什么疑问.....................................3图2:谷歌将Gemini嵌入Android..........................................................................................4图3:谷歌Android系统级AI..................................................................................................4图4:Android 15将以AI为核心.............................................................................................4图5:TalkBack读屏功能.........................................................................................................5图6:AI帮助预防电话诈骗.....................................................................................................5图7:Apple Insider制作的语音备忘录实时转文字界面预测...................................................5图8:Recall功能帮用户回到曾经浏览过的鞋子页面..............................................................6图9:Recall功能的时间轴......................................................................................................6图10:Copilot在《我的世界》中与用户语音对话并提供指导................................................6图11:看外国足球比赛实时翻译.............................................................................................7图12:跨国会议实时翻译形成字幕.........................................................................................7图13:鸿蒙万物智联愿景........................................................................................................7图14:应用程序-操作系统-硬件结构图...................................................................................8图15:Ferret-UI能很好地处理从基础到高级的11种任务,从简单的寻找按钮到复杂的描述具体功能..................................................................................................................................9图16:荣耀任意门一拖打车导航.............................................................................................9图17:荣耀任意门一拖购物比价.............................................................................................9 一、从响应式到主动式,从“人找服务”到“服务找人” AI与终端的结合,将重塑人机交互——从响应式到主动式,从“人找服务”到“服务找人”。在传统响应式交互中,用户通常是交互的发起者,系统或服务在接收到用户的明确指令后作出响应,用户需要清楚地知道自己的需求,并采取相应的行动来满足这些需求。例如,用户通过搜索引擎输入关键词来获取信息,或者通过菜单选择来执行特定的任务。 而在AI技术高速发展的过程中,人机交互正在向主动式转变,系统或服务能够预测用户的需求,甚至在用户尚未明确表达需求之前就主动提供服务。这种模式下的交互是主动和预测性的,系统能够根据用户的历史数据、上下文信息、行为模式等来推断用户的意图,并据此提供个性化的服务。例如,未来的主动式AI可以跨多个娱乐平台如电影、音乐等,根据用户的娱乐偏好、观看历史和社交活动,主动在合适的时间点询问并为用户播放符合其喜好的娱乐内容。 谷歌安卓与微软windows领衔,大模型加持下,“服务找人”理念已初步体现在最新系统中。在I/O 2024大会上,谷歌宣布安卓新版本将以AI为核心,我们认为其中有些功能已体现了“主动式AI”理念,如Gemini可以感知到用户在看视频,弹出提示来询问是不是想了解关于这个视频的问题,用户可以直接询问视频中的细节,Gemini可以根据视频做出回答;而当用户接收到一个匹克球长文档时,Gemini会检测并询问是不是要了解这个PDF,如果用户需要,Gemini会化身匹克球专家,可以基于该文档解答各种问题。而微软Copilot+PC中也有“服务找人”,如用户收到邮件需要发送一份PPT给同事,Copilot可以直接根据邮件里的需求,找出具体的PPT,用户点击发送既可。 资料来源:智东西微信公众号、西部证券研发中心 二、大模型将与操作系统深度融合,系统级AI将成为AI终端标配 我们认为实现从被动响应到主动服务的跨越,达成“服务找人”的愿景,首先需要打造系统 级AI,因为只有系统级AI才能跨越单一应用边界,打破数据与功能的孤岛,无缝融入用户的日常交互流程。 资料来源:智东西微信公众号、西部证券研发中心 资料来源:智东西微信公众号、西部证券研发中心 谷歌宣布即将推出的Android 15将以AI为核心,Gemini将成为Android的基础部分,可在系统层面运行。与底层操作系统的集成,能最大化AI的价值。Gemini将在Android上充当AI助手,而不是Google Assistant,Gemini AI将能够作为任何正在使用的应用程序的叠加层出现,且能基于较强的上下文感知能力,预测用户的操作并提供即时帮助,如为文本和社交媒体创建图像等等。 资料来源:爱活网微信公众号、西部证券研发中心 同时,谷歌还使用本地小模型Gemini Nano来保障用户数据安全,端云AI协同为用户带来更好的体验。Gemini Nano是谷歌的设备AI,目前能在消息应用中生成智能回复,总结语音备忘录。Gemini Nano withMultimodality(Gemini Nano多模态模型)将于今年晚些时候在Pixel手机上推出,支持新的设备内AI功能,如TalkBack——帮助盲人和低视力用户更好地理解周围世界。谷歌还在开发一种呼叫筛选功能,该功能会主动听取通话,并帮助用户判别是否为诈骗电话。 资料来源:智东西微信公众号、西部证券研发中心 资料来源:智东西微信公众号、西部证券研发中心 苹果有望与OpenAI合作,把一系列生成式




