行业研究公司研究宏观策略财报招股书会议纪要中央经济工作会议低空经济 DeepSeek AIGC 大模型

释放算力潜能加速应用构建Serverless 为 AI 创新提速

信息技术2023-12-01赵庆杰中国信通院肖***

AI智能总结

AI应用创新与Serverless技术的融合

AI应用发展趋势与挑战

发展趋势：AI应用场景快速增加，百花齐鸣的市场竞争中，“迭代速度”成为关键因素。面对异构计算环境，包括GPU、CPU、NPU、FPGA等，资源调度与虚拟化成为核心议题。
主要挑战：
- 构建复杂性：AI应用构建涉及多环境部署与集成，需要解决与非AI应用的协同问题。
- 调用链路长：丰富的功能导致调用链路长，影响问题快速发现。
- 资源复用性：AI应用组件重复开发，浪费资源，如绿网能力、队列等。
- 安全与防护：需要强大的网关鉴权、限流保护机制，支持多协议，抵御各种攻击。
- 计算力需求：GPU资源稀缺、成本高，卡型不统一影响应用性能；计算规模增大，容错能力提升要求更高；数据处理与模型加载对底层技术要求提高。

Serverless技术加速AI应用构建

解决方案：函数计算平台提供构建现代化高可用AI应用的简化路径，支持快速弹性CPU+GPU实例，减少成本，提升效率。
平台特性：一键模型托管，大幅降低上手门槛；支持GPU资源按需付费，灵活调整计算资源。
生态集成：与ModelScope、HuggingFace等开源生态联动，集成AI开源框架，如LangChain，增强平台集成度。
应用场景：涵盖电商、软件开发、教育、医疗、创作等多个领域，提供一站式部署与管理服务。

Serverless GPU与AI应用优化

成本与性能：Serverless GPU采用虚拟化技术，实现算力、显存与故障的强隔离，提供热资源池与FCGPU/IaaSGPU两级资源池，降低使用成本，实现实时弹性。
成本控制：免费试用额度，前100万GB*秒GPU资源使用免费，3个月有效期内，助力开发者快速启动实验。
挑战与应对：面对GB级镜像启动挑战，通过优化镜像中数据结构，结合多种存储服务构建层次化缓存体系，实现性能提升，缩短启动时间。

AI应用集成与部署

一键部署：提供丰富的API调用能力和UI界面，支持模型管理、代码上传、应用发布，快速构建AI应用。
多场景覆盖：覆盖电商、教育、医疗、创作等行业，提供特定场景的应用模板和案例，简化开发流程。
全生命周期管理：从模型管理、代码仓库、多环境支持到安全防护，提供一站式服务，确保应用稳定运行。

大模型与AI应用创新

知识库集成：利用大语言模型构建知识库，实现智能问答、个性化推荐等功能，提升用户体验。
场景化应用：结合StableDiffusion、OCR等技术，提供AI绘画、图像处理等创新应用。
成本与效率：通过GPU资源的高效利用，实现大规模推理的降本提效，同时提供一键部署服务，简化开发流程。

结论

Serverless技术与AI应用的深度融合，不仅降低了构建复杂AI系统的门槛，还显著提升了资源利用效率和应用开发速度。通过提供丰富的平台功能、优化的计算资源管理、以及与开源生态的紧密集成，实现了AI应用的快速构建与高效运行，为企业和个人提供了更多创新的可能性。

赵庆杰阿里云Serverless基础架构团队负责人 2023年12月1日 01AI应用的发展趋势以及面临挑战 02Serverless技术加速AI应用的构建 03ServerlessAI应用案例 AI应用场景极速增长百花齐鸣的AI应用市场竞争下，“迭代速度”成为关键因素之一 AI技术概览 AI应用面临的挑战 AI计算开发者领域 •AI应用的构建复杂，且需要多环境部署支持，需要与非AI应用集成•随着AI应用功能逐渐丰富，调用链路长极大影响问题的快速发现•AI应用组件无法复用，持续重复造轮子，浪费资源成本，如绿网能力，队列等•网关通用能力，安全鉴权，限流保护，多协议支持，防护攻击等 AI计算力面临的挑战 •GPU资源紧缺且成本高，需要持续保有购买•卡型不统一导致算力不统一，进而影响应用层架构•随着计算规模的提升，容错能力也越来越重要•大数据的读取，以及模型的快速加载，对于底层的技术要求越来越高经常听到的问题？ Serverless AI应用解决方案不同角色，在AI场景下的诉求工程相关负责AI应用平台建设和管理 •工程能力比较强，更希望有一个平台可以提升整体的研发效能，降低运维成本；•往往和实验室/公司内的设备有强关联，需要有安全保障等；算法相关负责AI模型开发调试 •算法能力比较强，希望有一个好用的AI模型管理平台；•希望可以在本进行开发调试、线上进行测试的时候，有一个便捷的环境等；接口相关通过API等对接口进行工程化封装如何方便快捷部署使用 •工程能力比较强，更希望有一些项目案例等，可以帮助业务快速的发布和上线；•有完整的应用开发、调试、发布流程等； Serverless开发平台AI场景函数计算提供构建现代化高可用AI应用的简化路径，是AI应用的最佳实践上手简单，降本提效 •三步上手最佳实践，一键模型托管，上手门槛降低80%；•快速弹性CPU+GPU实例赋能AI应用降本提效；拥抱开源，开放生态 •ModelScope，HuggingFace开源生态联动；•LangChain等AI开源框架与阿里云产品高集成；最佳实践，心智强化 •10+应用场景，50+应用案例，一键部署，快速体验；•覆盖2W+AI应用开发者，打造阿里云函数计算AI第一心智； Serverless GPU–按请求付费 Serverless GPU虚拟化技术 Serverless GPU两级资源池 •算力强隔离，显存强隔离•故障强隔离•GPU兼容原生应用 •热资源池：避免Node级别ScaleOut引起的分钟级别冷启动。•资源供给：FCGPU/IaaSGPU两级资源池共同保证GPU资源供给。•使用成本：FCGPU资源池平台持有，用户只为真实使用付费。热资源池，实时弹性，平台持有，用户低成本 Serverless GPU–按请求付费免费额度：函数计算为首次开通服务的用户提供免费试用额度： •GPU试用额度：前100万GB*秒GPU资源使用免费。•注意：免费额度不包含公网出流量。领取后3个月有效期。 GB级镜像实例秒级启动顶会论文•UsenixATC2020:DADI Block-Level Image Service for Agile and Elastic Application Deployment AI应用的集成：一键部署AI应用函数计算AI开发模式 HuggingFace/ModelScope Serverless AI应用案例 Serverless函数计算GPU应用场景选型指南（针对推理） Serverless应用中心一键部署SD应用 Serverless应用中心一键部署知识库应用专属StableDiffusion环境大语言模型知识库应用 StableDiffusionWEB UI Serverless函数计算平台 Serverless函数计算平台 AIGC应用场景如何快速体验、快速上手如何方便快捷的部署使用应用中心一键部署GPU资源免维护秒级弹性大规模GPU集群按量付费降本提效人人都可以拥有自己“专属”的AIGC环境优秀的开发者体验提效降本的现代应用心智快速弹性的CPU + GPU实例完备的开发者套件高效能低成本进行AI应用的开发与部署是无数AI开发者/企业的重要关注点，Serverless架构凭借高资源利用率与按量付费模式，以及服务端免运维的开发者心智，成为一众AI开发者/企业的首选； AI应用一键部署，快速上手；AI应用一键多环境划分，标准GitOPS流程；ModelScope一键托管；AIPlugin一键发布到通义千问；阿里云函数计算与应用中心，具备与生态连通，与开源结合，快速上手、一键部署的完整通路，优秀的开发者体验。 GPU实例是AI领域不可或缺的计算资源，在高昂的成本下，可弹性，且可快速弹性的GPU实力成为AI应用不可获取的部分。阿里云函数计算拥有快速弹性的GPU实例，以及大规格的函数计算性能实例，这部分是承载AI应用稳定、高性能推理的重要环节。完备的开发者套件，是开发者将AI应用部署到云原生架构必不可少的一环，在这一部分，阿里云Serverless架构拥有ServerlessDevs，应用中心等完备的开发者套件，可以帮助开发者从0到1再到N，将业务Serverless化，并提供全生命周期管理能力。 Stable Diffusion与平台集成实践方案企业级内部设计平台使用 ServerlessWebUI-方案优势解析服饰穿搭实践大语言模型知识库应用场景医疗领域问答智能客户聊天社区自动问答如RocketMQ开源知识社区，专门针对RocketMQ领域的知识问答及代码示例；如游戏社区使用游戏的信息（例如游戏介绍，游戏攻略等）构建社区知识库，自动回复社区成员提供的问题；如罕见病专业知识回复，有限医疗资源情况下进行自助服务；如中医知识问答，针对海量的中医知识进行归纳汇总，解答病患问题；儿童保健及护理，儿童常见病咨询，营养咨询等如企业客服，通过与呼叫中心/聊天机器人服务结合，可自动基于企业知识库就客户提出的问题进行聊天回复；电商平台搜索问答 IT/HR系统智能问答智能教育辅导如使用企业内部IT/HR使用手册构建企业知识库，企业内部员工可通过该知识库快速解决在IT/HR上遇到的问题。如使用教材和题库构建不同教育阶段的知识库，模拟和辅助老师/家长对孩子进行教学。如使用商品信息搜索，使用商品信息构建商品数据库，消费者可通过检索+问答的方式快速了解商品的详细信息；如特定商品检索，如节日礼物，周年庆，亲情礼品等，根据特定信息进行定制检索，快速触达用户大语言模型知识库的基本原理基本流程私域数据向量化将非结构化内容进行向量处理0 1 输入提示词预埋0 2 将用户的输入问题，跟系统问答的预埋提示词整合作为大模型输入大模型结果输出解构化03 对大模型输入的内容进行结构化输出技术细节 l1.LLMl2.embeddingl3.controlledtextgeneration 函数计算产品—基于云原生大模型智能问答实践用户身边0成本的“高级技术专家”，致力于提升云原生产品使用体验、降低云原生应用生产门槛资源生成｜面向容器，生成云原生资源配置利用大模型技术实现云原生资源配置的交互式创建、修改与应用等，提升资源维管效率应用构建｜面向中间件，构建云原生业务应用面向云原生中间件产品，实现云原生动态脚手架应用快速构建，降低业务应用构建门槛面向云原生打造云原生知识大脑故障诊断｜面向应用，整合全栈故障诊断能力知识问答｜领域知识专家集成云原生已有的系统诊断能力，面向业务应用构建具备全栈技术能力的辅助诊断助手整体系统架构云原生大模型践行可扩展架构设计，便于更多的云原生产品因大模型技术而受益知识大脑函数创建监控运维通过云原生大模型对话式唤起现有Serverless监控面板，面向应用整合常见Ops操作

点击免费查看完整报告