AI智能总结
证券基⾦期货⾏业数智升级新征程AI驱动的信创新动能腾讯云资管⾏业⾼级架构师杨磊主讲⼈ 从云计算中⼼成功升级为云智算中⼼•计算:⾼性能计算集群HCC,与多款国产化GPU完成适配•存储:TurboFS并⾏存储,1000万IOPS•⽹络:IHN软硬⼀体星脉⽹络,⽆损RoCEv2 RDMA互联腾讯不制造GPU,中⽴性决定TCE将拥抱纳管各类GPU、NPU异构算⼒:•英伟达•昇腾•昆仑芯•海光•沐曦•燧原•寒武纪•……弥补DeepEP在RoCE⽹络上的短板 AI智算是计算、存储、网络密集型场景,木桶效应明显速度和性能压榨是智算的核心 信创⼤数据:⼤数据与AI双向驱动与融合发展算⼒割裂存储割裂开发割裂AI4AataData4AI ⼤数据与AI从割裂⾛向融合统⼀集群:云原⽣数据湖+AI,统⼀算⼒存储,⽀持统⼀异构资源调度和在离线混部统⼀元数据:多模态数据统⼀元数据、统⼀数据⾯权限管理、全域数据治理统⼀开发:DataOps+MLOps+LLMOps平台⼀体化AI4Data•数据治理Agent:元数据补全、全链路⾎缘提取、找数助⼿等•开发运维Agent :SQL代码助⼿、基于LLM⽇志智能诊断排障等•问数分析Agent :TCDataAgent、ChataBI等Data4AI模型增训:指令微调、强化学习依赖的⾼质量数据源检索增强:整合内部多模态私域数据,作为LLM知识库外挂联⽹搜索:整合外部实时数据源,包括⾏情资讯、互联⽹搜索等。 •••••• 信创数据库:LLM能⼒下沉⾄DB全链路向量⽀持AI⽣态集成向量检索性能优化SQL+向量融合检索多模态统⼀处理LangChain、LlamaIndex⽣态集成AISQL诊断 -- ⽤产品描述⽣成营销⽂案SELECT product_id,google_ml.predict_row('gemini-pro',json_build_object('text', '为'||product_description || '写⼴告语'))AS ad_copyFROM products;交互逻辑:GoogleAlloyDB通过调⽤函数google_ml.predict_row() 直接调⽤部署在Google Vertex AI 平台上的AI 模型AI下沉⾄DB:AI推理从应⽤层下沉到数据库,相对传统调⽤链数据库→ 应⽤→ 调⽤AI API → 返回结果→ 写回数据库,直接在业务数据上激活AI,减少应⽤层链路调⽤。 信创操作系统:OS⾛向AI原⽣操作系统【内核性能优化/安全加固】TencentOS Server AI【内核性能优化/安全加固】训练框架TACO-Train推理框架TACO-LLM算力监控算力管理生成模型|思考模型|工具模型可编程调度器AI助手/知识库/生成提问OS4AI通过底层操作系统的优化,更好地支撑AI模型运行模型层AI4OS利用AI能力增强操作系统本身的可用性与智能化体验 在DeepSeek-R1满血版场景下,相对于vLLM性能,TTFTP95的响应时间最高降低6.25倍,吞吐提升2倍,端到端延迟降低100%。在社区最新版本SGLang场景下,TTFT P95的响应时间最高降低12.5倍。【TACO-LLM训推加速】【内核态劫持GPU虚拟化】痛点:GPU昂贵、利用率极低潮汐效应Vs独占模式,不支持在离线混部,GPU利用率低、资源极度浪费。NIVIDAvGPU成本高昂,不支持容器,算力切分不灵活传统CUDA劫持方案,其故障算力显存隔离弱,AI任务争抢资源,无QoS保证。腾讯qGPU=QoS GPU,基于内核态劫持设计,真正实现故障显存算力强隔离,不入侵业务生态的容器GPU共享的技术。支持训练推理在离线混部,极大提升GPU利用率。兼容AI+渲染,兼容LocalGPU+Remote GPU,打破GPU孤岛,搭建云原生统一AI算力资源池,实现AI任务与AI算力解耦。价值:提升GPU利用率3-10倍 ••••••• AI操作系统镜像 信创AI平台:AI⼤模型全链路⼯具⾃主可控Intel/AMDCPU异构算力平台算力层信创CPU信创GPU/NPUNvidiaGPU模型部署LLMops平台模型层数据标注运维监控训推加速RAGAgent低代码开发平台开发层WorkflowMCP插件Multi-Agent投顾智能体智能体应用层投研智能体……办公智能体 腾讯云信创5T产品矩阵全⾯拥抱AI新⽣态 THANKS谢谢观看