行业研究公司研究宏观策略财报招股书会议纪要稀土低空经济 DeepSeek AIGC 智能驾驶大模型

AI网关：AI原生架构下的智能流量中枢

信息技术2025-12-01-阿里巴巴好***

AI智能总结

AI网关：AI原生架构下的智能流量中枢

AI网关的演进历程与核心特性

网关的演进历程

AI网关是伴随AI应用快速发展的必然产物。AI应用落地过程中面临诸多挑战，如模型推理成本高、Agent任务成功率低、部署复杂等，推动了AI网关的出现。

HigressAI网关的落地实践

AI网关LLMs代理

基于Token的限流降级：通过Token控制请求频率，保障系统稳定性。
语义化缓存：根据语义内容缓存响应，提升效率。
高可用实践：通过分布式部署和负载均衡，确保服务高可用。

服务维度配置健康检查策略

主动健康检查：主动发送请求（TCP/HTTPGET）检查节点健康状态。
被动健康检查：基于实际流量的请求成功率动态分析节点健康状态。

MCP的统一代理

RESTtoMCP：将现有REST API一键转换为MCP Server，盘活存量资产。
MCPSSE状态会话负载均衡：通过Session ID嵌入实例地址信息，保证SSE会话一致性。
MCP优化与卸载：
- 响应调优：通过Higress配置自动追加注释，让LLM理解API。
- 深度定制(Template DSL)：使用模板DSL和gjson路径表达式重塑响应体，提升LLM理解能力。
- 协议卸载：将StreamableHTTP请求转换为SSE，提升系统健壮性。
MCP的身份认证和权限管控：通过Higress网关实现精准控制，确保每个AI Agent只拥有完成任务所需的最小权限。
MCP工具组装：支持语义化检索，动态发现工具。

AI网关的安全体系

提供全链路安全防护，确保入口可控、配置可信、内容可审。

AI网关的可观测体系

提供统一采集LLM可观测需要的日志、指标、Trace、Profiling数据。
支持OpenTelemetry、Prometheus、Grafana等开源标准。

HiMarketAI开放平台

企业为什么需要AI开放平台

私有MCP/Agent市场让企业在安全、可控、低成本的前提下规模化落地AI Agent。

开源HiMarketAI开放平台

HiMarket整体架构：提供分布式AI Agent架构和工具管理。
AI网关在AI原生架构中的位置：作为智能流量中枢，支持AI原生应用的高效运行。

总结

AI网关作为AI原生架构下的智能流量中枢，通过LLMs代理、MCP统一代理、安全体系和可观测体系等功能，有效解决了AI应用落地过程中的诸多挑战。HiMarketAI开放平台则为企业提供了安全、可控、低成本的AI Agent规模化落地方案。AI原生应用架构通过分布式AI Agent架构、Nacos动态配置、AI消息、AI网关等组件，实现了高效、可观测、安全的AI应用开发与部署。

AI网关：AI原生架构下的智能流量中枢赵炳堃（秉钧）｜阿里云智能云原生高级开发工程师 01AI网关的演进历程与核心特性 02HigressAI网关的落地实践 03HiMarketAI开放平台 04总结 AI网关的演进历程与核心特性网关的演进历程 AI网关是伴随AI应用快速发展的必然产物 AI应用落地过程中的挑战 HigressAI网关的落地实践 AI网关LLMs代理 LLMs代理——基于Token的限流降级 LLMs代理——语义化缓存 LLMs代理——高可用实践 2.服务维度配置健康检查策略 ➢主动健康检查：➢主动发送请求（TCP/HTTPGET）➢被动健康检查：➢基于实际流量的请求成功率动态分析节点的健康状态 MCP的统一代理 RESTtoMCP：盘活存量资产 RESTtoMCP能力可以将企业现存的海量RESTAPI一键转换为MCPServer。只需要使用Higress提供的工具和API的Swagger文件，就可以一键生成协议转换配置。 MCPSSE状态会话负载均衡您的MCP服务在K8s集群中部署了多个实例，Higress网关可以将实例的地址信息编码后嵌入到返回用户的Session ID中。用户再次持有此Session ID请求时会从ID中解析出地址信息，再次路由会该实例。从而保证了SSE会话的一致性 MCP优化与卸载响应调优：让LLM理解API 基础调优(prependBody)问题:旧API返回{“succ”: true, “data”:{“p_name”:“...”,“p_id”: “...”}},LLM完全无法理解p_name和p_id的含义。解决:通过Higress配置自动在响应前追加注释深度定制(Template DSL) 方案:使用Higress的模板DSL和gjson路径表达式,对响应体进行"重塑"。效果:通过Higress配置定义新结构,彻底丢弃原始的复杂JSON,转而返回一个LLM极易理解的清爽JSON。这不仅节省了Token,还从根本上杜绝了LLM的错误解读。协议卸载：智能翻译官问题：MCP生态存在两种传输协议:StreamableHTTP(无状态短连接)和SSE(有状态长连接)。这导致了客户端与服务端的"协议错配"。方案：网关可以把客户端的StreamableHTTP请求转换为SSE，让后端进行处理。价值：后端服务可以随意进行滚动更新、扩缩容,甚至实例重启,而客户端的连接完全不受影响。网关屏蔽了底层的复杂性,极大提升了系统的健壮性。 MCP的身份认证和权限管控无权限控制(高风险) 在缺乏严格权限管控的环境中，AI Agent成为安全隐患的焦点。•恶意用户：发起提示词注入攻击，试图诱导AI执行非授权操作。•AI客服：部署时被赋予了所有可用的工具权限。结果：严重的安全事故和资损风险。企业版精准控制(安全可控) Higress网关作为安全屏障，确保每个AI Agent只拥有完成任务所需的最小权限。案例一：AI客服(消费者A) • read-order(可见)•refund-order(不可见)•delete-user(不可见)•view-analytics(不可见) 案例二：财务Agent (消费者B) • read-order(可见)•refund-order(可见)•delete-user(不可见)•view-analytics(不可见) 结果：从源头杜绝高危操作风险，实现最小权限原则。 MCP工具组装 MCP工具语义化检索如果Agent的任务不固定，需要动态发现工具呢？ AI网关的安全体系 AI网关的可观测体系企业为什么需要AI开放平台私有MCP/Agent市场让企业在安全、可控、低成本的前提下规模化落地AIAgent 开源HiMarketAI开放平台 HiMarket整体架构 AI网关在AI原生架构中的位置感谢聆听 AI原生应用架构探索与实践肖京｜AgentScopeJava版负责人，阿里云智能高级技术专家正文要求：微软雅黑：最小字号8号宋体：最小字号10号等线：最小字号12号肖京阿里云智能高级技术专家拥有十余年微服务领域深耕经验，Spring CloudAlibaba项目的发起人，阿里云微服务框架与治理团队负责人，在微服务架构设计、高可用系统建设等方面积累了深厚的技术积淀。主导了《微服务治理技术白皮书》和《AI原生应用架构白皮书》的编写工作。目前专注于SpringAIAlibaba和AgentScopeJava版本的研发工作，致力于构建面向AI原生应用的架构底座和中间件；同时深入探索AI原生应用架构的核心模式及最佳工程实践，推动Agent应用与云原生技术的深度融合。 01020304AI原生应用架构定义AI原生应用场景与难点AI原生应用中间件AI原生应用架构实践 AI原生应用初步成型模型迈过拐点 Agent迈过炒作周期 •GPT横空出世以来，大模型ScalingLaw不断刷新智能边界。•DeepSeek进一步降低了模型的成本，效果/成本这个智价比进一步提升，AI应用更是加快了创新速度。 •从简单Agent，再到复杂工作流，再到Manus打开通用Agent的想象。•AI从以前工具升级成为了助手，AICoding、DeepResearch等场景开始爆发。•AIAgent迈过炒作周期峰值，进入生产大规模落地阶段。 AI原生应用新范式 AI原生应用架构定义 AI原生应用架构定义 AI原生应用场景与难点 AI原生应用难点与挑战 AI原生应用平台构建以数据为中心的AI原生应用平台，解决效率和效果问题，构建AI企业级能力 Agent开发范式：低代码、高代码、零代码零代码高代码低代码提供底层编程接口，性能可控且灵活性强，能支撑复杂业务逻辑与系统集成，满足大规模生产要求抽象层次过高，导致难以满足所有复杂业务场景的逻辑，灵活性受限。生产可用性受制于大模型自身的能力。当前模型的稳定水平，还不能满足复杂业务场景对推理深度、上下文管理和可控性的高要求，因此难以承担生产任务。底层引擎与管控通常部署在一起，这种架构限制了Agent的性能和可扩展性。高代码在智能自主性和可控确定性间取得平衡，确保系统行为可靠、结果可预测，兼顾效率与准确性。高代码开发框架的演进分布式Multi Agents系统高可用与水平扩展康威定律系统架构是组织沟通结构的反映，团队划分方式决定了系统的模块边界。分布式架构消除单点故障，支持按需弹性伸缩，支撑服务高可用。 AI原生应用架构 AI原生应用架构注册配置分布式AI Agent架构基于能力注册和发现，基于指标智能负载均衡 MCPRegistry&ToolsManagement Nacos3.1重磅发布-拥抱分布式Multi Agent架构 AI原生应用架构Nacos动态配置 1.通过Nacos获取Prompt配置，动态更新，支持Prompt版本管理，支持实时回滚。2.基于长期记忆智能填充模版中变量。3.支持MCP工具描述在线修改更新。4.支持配置加密，避免敏感信息明文写在代码中。 AI原生应用架构NacosA2A注册发现 •Agent可以通过AgentScope等框架在启动时自动注册到Nacos •AgentScope通过Agent名称自动发现AgentCard并发起调用。 •SupervisorAgent通过skills自动选择对应的RemoteAgent并生成可调用的SubAgent。 •支持从Session自动映射到TaskId并维护。 AI原生应用AI消息 •支持通过同步的编程模式，实现高性能的异步通信，通过分片的方式支持流式返回，开发者无需关注异步实现的细节。 •借助于消息的LiteTopic异步通讯，实现高性能通信，最大支持100M级别消息内容。 •将AI应用的状态自动保存在MQ中，开发者无需关注长连接维护，简化应用开发。 •历史上下文自动保存，便于状态共享和失败重试，在失败重试的过程中，能够自动读取checkpoint，从上一次的失败点进行重试。 AI原生应用AI消息 •Lite-Topic模型：专为短期、动态、海量个性化订阅场景（如AI Agent）设计。 •管理订阅(InterestSet)：以客户端为单位维护订阅关系，实现去中心化与最终一致性。 •优化拉取(ReadySet)：通过事件驱动告知客户端“何处有消息”，避免无效轮询。 •Pull模型+Push语义：将“盲目轮询”升级为“精准唤醒”，实现大规模个性化订阅场景下的高效低延迟的消息分发。 AI原生应用AI网关 AI原生应用全链路安全入口可控、配置可信、内容可审的全链路安全 AI原生应用高可用治理 AI原生应用观测评估训练感谢聆听从可观测到RL打造生产级可靠的长周期Agent 马云雷｜阿里云可观测高级技术专家马云雷阿里云-云原生可观测-高级技术专家 2012年毕业于上海交通大学，加入阿里云日志服务。13年可观测行业经验，先后参与日志采集、查询、计算、向量搜索、大模型可观测等多个模块的建设，从0到1参与可观测体系的建设。阿里云可观测日处理百PB级数据，秒级别查询百亿数据。目前专注于结合Data+AI，探索DataforAI和AIforData两个方向。基于多模态存储和检索解决AI的预训练和后训练场景的需求。在AIforData领域，基于agent的模式的nl2sql获得了98%的可执行率，在Agent的dev、ops上积累了实践经验，帮助打造更好的agent数据基座。 01AI-Native应用的典型架构和挑战 02Agent应用可观测 03Agent应用评估 04Agent从可观测到RL闭环 AI-Native应用的典型架构和挑战 AI-Native应用的分级图谱：从辅助到自治 L4:群体智能 L3:自动驾驶 L2:辅助驾驶 L1:信息增强 •产品形态：ChatBot/ RAG•核心定义：对话 •核心定义：执行•产品形态：Manus •核心定义：协作•产品形态：多Agent •产品形态：IDE插件/Copilot•核心定义：辅助 •能力描述：1.给个目标，AI搞定2.自主拆解复杂目标3.动态规划与工具链调用4.具备反思与纠错能力 •能力描述：1.AI团队，自我治理2.多角色分工动态3.像公司一样运作具备4.无需人类介入的闭环 •能力描述：1.人发指令，AI跑腿2.嵌入工作流3.调用单一工具无长期4.提供建议，人类做决策 •能力描述：1.能听懂，能回答2.基于检索增强(RAG)3.没有手和脚4.无长期记忆或状态 •人机关系：人主导•责任归属：100%人类 •人机关系：人提问•责任归属：100%人类 •人机关系：人监督•责任归属：人机共担 •人机关系：人定目标•责任归属：系统承担戳破泡沫：Agent任务的真实成功率从阵痛到掌控：Agent生产落地的挑战与对策 👑可靠性和可控性可观测 •非确定性•幻觉与错误传播•鲁棒性差•提示词敏感•非预期环境•死循环•格式崩坏 •可调试(定位失败)•可审计(追溯安全)•可测量(优化成本) •概率模型•黑盒调试•难以复现•评估复杂评估 •自动评估(判断好坏)•回归测试(防止退化) 💰成本和性能 •高昂成本•高延迟 🚀反馈数据闭环(收集失败案例)强化训练(实现自我迭代) 安全与合规阿里云AI全栈可观测解决方案统一采集LLM可观测需要的日志、指标、Trace、Profiling数据阿里云ARMS可观测提供自研探针（JavaAgent、Python、GO、eBPF等），覆盖RUM、APM、链路追踪、容器监控以及基础设施监控等，全面拥抱OpenTelemetry、Prom

点击免费查看完整报告