AI智能总结
分析师:马邦2024.09 量子位智库 QbitAl Insights 序言 人工智能的浪潮不断向前方推进,不同层级,各种各样的人工智能应用也逐步渗透进我们的生活当中。无论是在我们的日常生活中,还是繁忙的学习工作中,总有那么一类应用始终支持着我们前行一一智能助手。 智能助手以其无可比拟的便捷性和入性化特征,悄然改变了我们与世界的互动方式,正如流水般自然 在本文中,我们将以从全局到具体的方式,从上到下对AI智能助手进行行业分析揭示智能助手在全球范围内的发展现状和未来趋势。报告中将涵盖从行业概览和头部玩家概览的全局性信息介绍,也将从数据分析和数据背后的原因入手,为读者提供一站式解读。而在文中的最后是更有具体的案例分享。希望通过这篇报告可以帮助从业者、投资者、技术爱好者更加深入地理解这一领域的现状和未来发展潜力。 目 01行业发展 02AI智能助手主要玩家 03用户数据:开始分层、头部优势明显 04AI智能助手发展三要素 05未来趋势 06案例分享 01 行业概览 智能助手是什么&历史阶段 智能助手是利用人工智能技术为用户提供个性化、便捷和高效服务的软件或硬件系统。这些助手通过自然语言处理(NLP)、机器学习和数据分析等技术,能够理解和响应用户的语音、文字或其他形式的输入,执行各种任务,从而提升用户的生活和工作效率。 智能助手的分类 行业主流的智能助手通过两类产品呈现: 语音助手 语音助手主要用于日常事务管理、信息查询和设备控制,通过语音与用户交互,提供便利的生活工作服务随着大模型的发展,语音助手搭上了智能的快车。承载着大模型的语音助手完成了从识别到理解的进化。 通用型智能助手 具备更广泛的能力,能处理更复杂的任务,如自然语言理解、内容生成、数据分析、逻辑推理等,适用于更多的专业和个人应用场景。 02 AI智能助手主要玩家 海外通用型人工智能助手 Claude--AnthropicDaric Amodei. Daniela Amccei +Chris Olah·Jack Clark·Tom Browr创始人团队 Gemini--Google ChatGPT--OpenAISam Altman +Greg Brockman +IlyaSutskever+John Schulman·WoiciechZaremba创始人团队 Al 一创始人团队 2023年2月:谷歌推出聊天机器人Bard.2023年期间:Bard持续更新迭代2023年中期:Bard被Gemini取代,开发下一代多模态大模型。2023年底:Gemini1.0发布。2024年初:Gemini1.5系列发布,包括Gemini1.5flash、Gemini1.5proc 2017年:Transformer架构由Vaswani等人提出。2018年:GPT系列诞生,展现文本生成能力。2019年:GPT-2发布。2020年:GPT-3发布并基于GPT-3模型推出ChatGPT。2022年之后:探索多模态模型。2023年3月:GPT-4发布。2024年5月:GPT-4o发布。2024年9月:01系列强化学习模型发布。 2022年底:Anthropic首次推出Claude.2023年中期:Claude2发布。2023年期间:Claude经历多次更新送代。2023年初:Claude3发布不同参数版本用于不同类型的任务需求。2024年6月:Claude3.5sonnet发布,成GPT最强对手。 国内通用型人工智能助手 通义一一阿里巴巴 文心—言——百度 豆包AI——字节跳动 基于自研通义大模型,支持多模态任务。应用场景广泛包括:写作、语音识别、升学、金融等全方位的功能。 基于自研豆包大模型,托有豆包浏览器插件,支持多模态任务,定位A综合体。个性化和智能体创建。 基于自研文心大模型,最早批智能助手,现更新到4.0Turbo。,大规模知识图谱、多场景应用,综合智能体。 天工AI——昆仑万维 元宝—一腾讯 讯飞星火一一科大讯飞 ,基于自研天工大模型,支持多模态任务。应用场景广泛包括:写作、音乐、PPT、图片生成、英文学 ·基于自研混元大模型。,理解和处理各种类型的问答,支持多轮对话、逻辑推理、智能创作等功能。 基于自研讯飞星火认知大模型,现为v4.0版本。拥有七大核心能力超拟人语音合成,智能标点等。 商量一—商汤科技 紫东太初一一中科紫东太初 360智脑——360 ·基于自研日日新大模型体系。·多轮对话、逻辑推理、内容创作等广泛任务,支持多模态输入。 基于自研大模型,首个三模态预训练模型。,跨模态理解与生成,图像、文本、语音三模态数据统一表示。 :注重网络安全。,支持多模态,同时具有特色数字人应用,对应不同IP角色。 国内通用型人工智能助手 海螺AI—MiniMax Kimi智能助手一一月之暗面 万知一—零一万物 ,基于自研MoEabab6.5大模型。·基于A语音交互,个性化服务。支持学习助手,内容助手,智能搜索等多场景功能。 ,基于月之暗面自研模型。擅长中英文对话,能够处理203万字超长文本,支持多种文件格式阅读,能进行网页内容解析和搜索。 ,基于自研Y大模型知识库。,支持多语种,支持从对话开始工作流。 跃问——阶跃星辰 智谱清言——智谱AI Mchat——澜舟科技 ·基于自研“Step-2”万亿参数大模型。,多模态处理,精确问答。根据图像进行创作。 基于自研千亿参数模型。300+个场景需求模板:多场景功能。 :基于自研孟子大模型。MChat·融合搜索结果、数据和图谱展开回答。 DeepSeek——深度求索 百小应——百川智能 ·开源创新MoE模型道用助手:包含广泛任务处理和信息查询。代码助手:专业用于编程开发任务。 ,基于自研taichuan-4大模型。学术研究、报告撰写、日常交流、小说创作等广泛任务。 智能助手成自研大模型玩家的第一个原生应用 03 用户数据开始分层、头部优势明显 用户数据App端:头部格局加速形成 截止最新月份统计: 总下载量:豆包以超过1亿的下载量遥遥领先,第二梯队是2000万左右的天工,Kimi,讯飞星火,文心一言。头部局面已经形成,当月下载量:豆包、Kimi以及文心一言位居前三。但月增长数据普遍出现轻微下滑。当月DAU:豆包、Kimi、文心一言居前三位,Kimi反超豆包来到头把交椅,整体数据普增20%左右。 因智能助手属中等频率使用场景的产品,采取3日留存和7日留存对比跑察 3日留存:划分为三个挡位,分别是25%、20%、10%, 7日留存:划分为三个档位,分别是15%、10%、10%以下。 App端数据分析 :头部优势不断扩大,用户习惯逐渐养成。 ,部分套壳类产品目前的用户数据,可以追平自研原生AI产品的第三梯队,先发优劳依然在。 ,质感较差产品从培速数据,已经入下坡,长期来看头部自研或精品套壳成为主流。 ,市场格局逐步走向稳定,对于不温不火的产品,在同质化竞争严重的现有市场下,非重大更新或者找到特定专居的使用场景来拉开明显差距,可能难以挤进头部梯队。各家产品需找到差异化进一步扩大市场规模。 :智能助手的推广依托于自有平台成最有效推广方式。相较于产品初上市阶段,现阶段纯投流效果不如预期。 用户数据Web端:学术工作类产品占主流 截止最新月份统计: 当月总访问量:Kimi依旧日保持在2000万梯队,文心一言和豆包位于在1000-2000万梯队,而通义在50C-1000万梯队。除豆包外,均出现轻微下滑。当月总访问量增速:同比上月,整体产品数据出现明显下滑,维持在正增长:腾讯元宝超过355%以及豆包超过了20%,大部分产品增速数据出现了负增长。市场可能出现了饱和度提高,大部分目标用户已被覆盖,增长空间收窄。当月独立访客数:Kim和文心一言数据同比上月轻微下滑但仍保持在350万-400万之间,中下游产品的数据出现下滑访问时长:普遍访问时长维持在3-4min,部分新发布产品时长来到了断档的19min。 目前网页流量的来源:直接、自然搜索、外链为前三主要来源。 整体数据出现波动下滑、竞争如副、产品更新选代不足以支持用户需求:州eb端的使用者更多的是学术工作方向,专注该类场景的智能助手数据占据第一梯队。 梯队划分:总访问量:2000万以上/1000-2000万/500-1000万/100-500万/1C0万以下考速:30%/0-30%;(-120%-0/超过-20%访间时长:4minJ F/3-4min/2-3min:0-2miv独立访客款:309万以上/100303万/50100万:1056万0-10万数据梯队 web端平均使用时长在3min-4min之间,反映了目前智能助手的使用场景更多的是对少数或单个问题的解决。针对具体问题的解决能力已满足大多离求,但是全工作流或全流程的深入分析问题仍是智能助手进一步结合工作学习的阻碍: 360和百度推出新产品360A/智能助手和百度AI伙伴,访问量达到了接近百万和超二百万,都未强调使月自家模型,市场动向潜在变化,自研并非痒点,优秀产品才能刺激用户需求, 新兴产品问小白、元象访间量增速明显。UI简洁,更注重纯助手交互。:访问时长上,州P5灵犀平均时长达到了12min,词遇科技的创脑也超过了10min。专属场景和海量免费模型的产品市场反馈明显。 市场新地 数据梯队划分:头部优势明显 综合数据梯队 数据梯队划分,Web端和Ap端各占比50%App端数据参考:总下载量、8月新增下载量、8月DAU。Web端数据参考:8月总访问量、8月增速、独立访客数和访问时长。 7个类目数据按照梯队打分后加权平均;第一梯队5分,向下以此类推。无App端产品的按照Web端数据进行计算。 04 AI智能助手发展三要素 第一要素:技术为基础 应用产品的体验很大程度取决于背后的模型性能,一款应用产品的核心价值在很大程度上都源自其所采用的人工智能技术,而模型的训练质量、推理速度以及实时响应能力都会直接影响到用户体验。 量子位智库选取目前市场上最为主流的三个基准作为标准进行分析一一SuperCLUE、FlagEval和OpenCompasS。 梯队排名前列的产品,模型性能在三大榜单上排名靠前:模型性能直接决定用户体验。全能型助手更适配用户习惯。但专属场景优秀依然带来强增速。 ,腾讯元宝在SuperCLUE的榜单上排名第2,并且加持微信搜索,高质量文字信息语料库是其独特优势。 模型性能作为产品的疾层支持:优秀的性能可能成为下一阶段增长的潜在因素。 ,海螺Al的大模型abab6.5-chat在FlagEval的榜单中排行第9: ,百小应的Baichuan4在SuperCLUE、FlagEval、OpenCompass中分列4、6、15。 万知的Yi-Large模型在SuperCLUE、FlagEval、OpenCompass中分列5、7、8。 第二要素:产品体验为核心竞争力 当前智能助手行业发展趋于同质化,各企业为了追求不一样的用户体验,大多从智能综合体入手,来覆盖用户足够多的使用场景以及功能,旨在为用户打造一站式智能体验。自前的智能助手有几大特点: ,技术多样性:涵盖了多种技术,包括自然语言处理、机器学习、图像识别等。,功能场景丰富:应用于多种场景:包括教育、医疗、企业服务、个人助理等。功能上包括文档速读、重点抓取、搜索能力、脱机推理、图像生成等功能。个性化定制:允许用户根据自己的需求调整助手的功能和行为 本土产品Web端功能分析:功能设计逐步分化,大而全或专而精 模型的性能决定了产品是否有足够的支持,但产品功能的实际表现同样决定着用户的球验,量子位智库对17款主流智能助手产品展开多方位测试, 本土产品Web端功能分析:功能设计逐步分化,大而全或专而精 本土产品Web端功能分析:功能设计逐步分化,大而全或专而精 :智能助手在基本日常对