您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[MongoDB]:2023应用程序驱动型智能:定义下一代成功的现代应用程序白皮书 - 发现报告

2023应用程序驱动型智能:定义下一代成功的现代应用程序白皮书

信息技术2023-12-01-MongoDB杨***
AI智能总结
查看更多
2023应用程序驱动型智能:定义下一代成功的现代应用程序白皮书

应用程序驱动型智能 定义下一代成功的现代应用程序 2023年7月 联系我们400-866-2988•marketing.npr@mongodb.com 目录 执行摘要3分析和AI的现状4需要做出哪些改变?6交付应用程序驱动型智能的方法8MongoDB如何提供帮助9启用应用程序驱动型智能11行业分析师对应用程序驱动型智能的研究13利用集中式分析进行定位14应用程序驱动型智能正被广泛使用15开始使用17 执行摘要 要在数字经济时代保持竞争力并站稳脚跟,您需要让自己的应用程序变得更加智能。更智能的应用会使用数据、AI和分析技术以自然语言与用户互动,生成见解并自主采取相应行动。这样可以带来两个好处。首先,与您的业务进行交互时,应用可通过提升客户体验和满意度来提高竞争优势。其次,应用可通过更快地制定明智的决策来提高效率和盈利能力。 对于这些提供价值的更智能、采用AI技术的应用,它们必须直接在应用流内实时处理实时数据。思考一下: ●在客户浏览电商网站时,提供高度个性化的服务并使用自然语言通过聊天机器人与客户互动。●在支付处理过程中检测并阻止欺诈交易。●在用户叫车时动态调整定价。●为音频流和视频流提供实时字幕和翻译。 除了更智能的应用之外,企业还希望针对运营流程自动制定决策并提供预测见解,以便应对“当下”发生的情况。思考一下: ●监控库存,以便在最佳时间推出限时抢购活动或调整供应链订单。●汇总支持案例并根据在线评价提取情感,以不断改进产品和促销活动。●通过分析传感器遥测数据预测设备故障。●生成并测试经过SEO优化的网页的多个副本,以提高发现率和点击率 虽然这些示例说明了不同的用例和行业,但它们都有一个共同的关键需求:需要使用实时系统中的最新数据提供实时智能、机器学习模型推理以及采取相应行动。其输出控制着应用程序的行为,并为生成式AI提供了基准真值上下文。 这类智能和分析与传统的BI报告查询截然不同,后者需要人盯着仪表盘或由离线机器学习模型针对历史数据批量生成预测。 为了构建新一代的此类智能应用程序,我们需要另辟蹊径。不能再仅仅依靠将数据从我们的操作系统复制到集中式分析数据仓库和数据湖中。虽然这种方法不会很快消失,但仅靠它是不够的。这是因为在不同系统之间移动数据比较耗时,并且会导致分析应用程序事件与采取行动之间出现分离。 相反,我们必须将一种新的AI和分析处理直接引入数据源,即应用程序本身。我们将这种方法称为应用程序驱动型智能。这是一种开发者和分析团队都需要欣然接受的方法,以便采用通过实时处理新鲜数据来提供价值所需的新工具、技术和工作流程。 分析和AI的现状 人们常说,应用程序负责运行业务,而分析则负责管理业务。过去,这些功能共存于单独的域中,这些域由具备不同技能的团队构建,服务于具有不同需求的受众,并且数据在针对不同任务进行了优化的系统中进行复制和存储。下面的表1比较了应用程序与集中式分析系统处理数据的方式,深入分析了它们之间的差异。 如表所示,集中式分析系统设计用于出色地完成各种任务。但是,它们并未被设计为用于满足操作型应用程序(服务于数以千计的并发用户)的需求。它们无法对以应用程序查询为代表的记录子集提供毫秒级的细粒度访问。它们也不支持应用程序不断添加到、更新且随后实时查询以检索LLM提示或模型推理的最新业务上下文的数据集。 分析系统设计用于运行繁重、高度复杂的BI报告和数据科学查询,服务于有限的内部受众。这些查询会扫描数十万至数百万条记录,每条记录需要数分钟甚至数小时才能完成扫描。报告查询可以为人工使用的“管理业务”仪表盘提供支持,并帮助训练专门构建的专业机器学习模型。在某些情况下,这些查询和模型的输出会被加载回操作型数据库,以供应用程序使用。在这些情况下,务必记住这些分析输出是针对老化且可能过时的数据批量生成的。它们不是基于最新的实时业务状态。 除了应用程序与分析之间的技术差异之外,您还必须考虑部门孤岛的影响。开发者通常会嵌入到与业务职能部门紧密合作的团队中。在快速发展的数字市场中,开发者会不断添加用户所需的新应用程序功能和修复程序。 另一方面,分析团队往往被安置在集中式后勤部门,负责平衡许多不同成员的需求。这是因为业务的每个部分都对更多的数据、分析和机器学习模型有着无法满足的需求。每份新报告都需要分析团队执行以下操作: 1.确定包含必需数据的相应数据源。2.配置ETL管道,将数据从其源移动到数据仓库或数据湖。3.设计满足相应请求所需的模式和查询,并在某些情况下选择和训练机器学习模型。4.使用流入数据仓库或数据湖的新数据的详细信息,更新所有关联的数据目录和元数据。5.每次新的应用程序功能需要更改源系统的模式或企业想要跟踪新的指标时重复上述步骤。 因此,花费数周甚或数月将新的分析需求添加到不断增长的待办列表中并不罕见。 应用程序与分析之间的交付速度不一致进一步阻碍了向应用程序驱动型智能的转变。 需要做出哪些改变? 为了提供更智能的应用并提高企业应对新数据和事件的能力,我们需要将智能和分析功能纳入应用程序中。这种转变就是我们所谓的应用程序驱动型智能。 应用程序驱动型智能不是试图将数据仓库或数据湖引入应用程序。相反,这是一种新型的AI和分析,能够为数千个并发用户以低延迟的智能方式自动处理新鲜数据并提供见解。软件和模型通常会使用推理、提示和分析输出,以产生上下文体验,提供即时见解并促使采取行动。它们不是用于管理业务的仪表盘,也不是用于训练和调整离线自定义模型的信号。因此,应用程序中的分析和AI查询仅接触几十到数千条记录,而不是数百万条记录。它们使用的是应用程序正在处理的实时数据,而不是经过数月甚或数年从几十个不同的数据源获取和合并的数据。 为了满足这些要求,有一组功能对业务取得成功至关重要。对于开发者而言,这意味着数据平台(专为开发者而设计)能够让他们以各种有趣的新方式轻松快速地处理应用程序数据: AI●各种工具和API,帮助开发者针对任何形态和结构的实时数据构建更复杂的查询。●编程API和连接器,将开发者正在构建的应用集成到企业选择的机器学习模型和更广泛的生态系统中。●编制索引并针对分析处理优化的存储格式,无需编写复杂而脆弱的应用程序端逻辑。●用于将操作处理与分析处理分离的机制,这样应用程序就不会变慢,同时还能够提供贴近用户的见解和推理。 但是,助力开发者以上述方式处理数据是否意味着分析团队不再重要?恰恰相反。现实情况是,最有价值、最相关且最新的数据位于应用程序中,分析团队需要访问这些数据才能提供实时见解。在运用自己已熟悉的现有技能和工具时,分析团队需要以一种与应用程序本身隔离的方式访问这些实时数据。他们需要能够在将数据ETL回集中式数据仓库时未产生开销的情况下做到这一点。 下面的表2汇总了实现应用程序驱动型智能所需的各种功能。 应用程序驱动型智能 基本功能 交付应用程序驱动型智能的方法 所有超大规模服务提供商均可提供一系列数据管理服务,这些服务可以共同提供应用程序驱动型智能所需的各种功能。但是,这些服务是孤立的基本单元,而不是集成的平台。这意味着您的团队需要完成许多自定义工程工作,必须: 列测量、键值对、图),每个数据库都通过其自己独有的查询API1.拼凑多个数据库来处理操作型应用中常见的不同数据需求(即文档、表格、向量、时间序进行访问。 2.构建ETL数据管道,在不同数据库和数据存储层之间移动和转换数据。3.加速运转联邦查询引擎,跨各个数据层运作且使用其自己独有的查询API。4.集成无服务器功能,响应实时数据变化(推理或向量编码,以检索模型提示的最新上下文)。5.设立自己的API层,将数据提供给使用中的应用程序。 所有这些复杂性都会给您的团队带来巨大的开销。这会导致碎片化且低效的开发者体验,需要处理大量的操作模型和安全模型、海量的数据集成工作以及大量的数据复制。它会延长上市时间,同时增加成本和风险。现在,您已经深深地受困于超大规模服务提供商的整个堆栈–从低级基础架构到高级软件、AI和分析服务。这种锁定会限制您的自由,如果日后您想切换到其他提供商,则会提高切换成本。 您可以尝试缓解锁定,方法是将一系列同类最佳的技术供应商所提供的数据管理组件全部组装在一起。但是您选择的不同技术和供应商之间的碎片化和无序扩张现在进一步加剧。 超大规模服务提供商或自行组装方法的复杂性甚至可能会阻碍团队尝试采用应用程序驱动型智能。这使得企业处于劣势,无法与更敏捷、更具创新能力的竞争对手角逐。 但是,MongoDB为您提供了一种更好的方式。 MongoDB如何提供帮助 基于MongoDB Atlas构建的MongoDB开发者数据平台统一了操作、AI和分析数据服务,可简化构建AI强化应用的过程。 Atlas能够以适合开发者的工作流程、框架和语言的方式,将强大的AI和分析功能直接交到开发者手中。借助Atlas,开发者可以获得任何结构的数据、对其编制索引、查询、搜索并分析数据,以应用所需的任何方式提供模型上下文和推理,然后对提示和推理步骤进行存档,以获得长期的模型记忆。所有这些操作均可在使用统一的API和灵活的数据模型的情况下进行,而无需构建自己的数据管道或复制数据。 同时,分析团队可以使用自己首选的基于SQL的工具访问实时应用程序数据。这些工具可以在不干扰应用程序的情况下使用此类新鲜数据,能够为企业主生成见解,以及将训练数据输入到其自定义模型中。 Atlas支持任何级别的应用智能,从查询记录和通过语义与关键词搜索来检索信息到聚合和转换数据,提供基于规则的引擎和特征存储,直到使用实时数据增强LLM和传统AI模型。Atlas会自动优化数据的获取、处理和存储方式,最大限度地提高应用程序的操作、AI和分析工作负载的效率。这些功能全部打包在一个巧妙的集成式多云数据架构中。 MongoDB Atlas在AWS、Azure和Google Cloud上的110多个区域中运行。这样您就可以在任何所需位置自由运行AI工作负载。您可以将自己的应用置于靠近用户的位置,以保护数据主权并减少延迟,或者可以灵活地利用任何超大规模服务提供商的最新AI创新,同时Atlas会为您处理所有数据移动。 启用应用程序驱动型智能 从将最新的生成式AI嵌入应用中到训练并服务于您自己的机器学习模型,无论您要如何利用AI,Atlas都能让您更快地实现应用智能。从原型到企业就绪,您可以确保自己的应用以最新的真实操作数据为基础,同时满足用户期望的规模、安全性和性能要求。 主要功能如下。 统一的操作、AI、分析和流式数据服务 在高度可扩展且安全的多云平台(可处理动态数据和静态数据)上,可使用单个数据模型和单个查询API简化AI数据生命周期。 灵活的文档数据模型 开发者非常重视文档模型,因为它会映射到代码中的对象,并且可以按需修改。这样开发者就能够不断创新,使用新的参数和数据类型开展试验。 文档可以对任何结构的数据进行建模,包括各种常规应用程序数据和模型特征以及由数千个维度组成的向量嵌入。您可以随时修改任何这些结构,以支持添加新的数据类型和应用程序或模型特征,而无需冗长的前端模式设计或令人痛苦的迁移。 在您的竞争对手可以与您一样访问许多相同模型的环境中,您自己的专有数据是实现市场差异化的关键。文档让您可以灵活地合理化并利用这些数据,这是传统的表格数据模型所无法做到的。 优化的数据存储和分层 实现在线推理存储和知识检索的低延迟,以及实现离线特征存储的高吞吐量–全部均可在一个平台上交付。 Atlas会将数据分层、查询联合以及行和列索引编制与可横向扩展的操作型数据库相集成。专用的分析节点会将长期运行的复杂查询与操作型数据库隔离,确保每项服务都能获得所需的资源。 富有表现力的开发者原生API 通过单个表达式查询API,提高开发者和ML/AI团队的工作效率,该API可以简化数据准备、模型训练、推理和知识检索以及为应用程序提供服务等工作流程。 从简单的CRUD操作到关键词和向量相似性搜索,再到用