行业研究公司研究宏观策略财报招股书会议纪要 seedance2.0 低空经济 DeepSeek AIGC 大模型

CTO100内容精选-四川站

2024-12-11腾讯E***

AI智能总结

AMD EPYC 处理器在云、企业及 AI 领域表现卓越，市场份额持续增长，提供端到端 AI 基础设施领导力。第五代 AMD EPYC 拥有 150 亿个晶体管，支持多达 192 核和 384 线程，IPC 提升 17%，支持全 AVX512 和高达 5GHz 的频率。AMD EPYC 在性能、能效和成本方面均领先业界，提供强大的 AI 数据中心解决方案。

腾讯云推出“一云多芯”智算方案，支持国内外主流芯片和处理器，提供高性能算力服务。腾讯云智算方案包括高性能计算集群 HCC、加速框架层、算力编排层、软件定义层和基础设施层，满足 AI 大模型训练和推理需求。腾讯云智算套件支持灵活部署和全栈智算，适配多种 GPU 芯片和网络交换机，提供混合部署方案。

腾讯云大数据平台 WeData 是一站式数据开发治理平台，融合数据集成、数据开发、数据安全及数据资产管理等功能，帮助企业快速构建数据应用。WeData 支持云原生湖仓一体，提供实时湖仓应用和自研内核，具备高效列存、写入性能优化、分析性能优化等特性。WeData 提供 AI 数据链路整合、AI 数据质量保障和 AI 数据安全保障等功能，支持 LLM 数据预处理、一站式 RAG 方案和 DLC 语料数据处理。

腾讯混元大模型是腾讯全链路自研的大模型，效果居国内第一梯队。混元大模型在内容生成、AI 搜索、角色扮演、AI 智能客服等领域应用广泛，支持多模态知识处理和行业场景化知识理解。混元大模型提供文生视频、文生 3D 等能力，支持多种生成方式，应用场景涵盖内容创作、知识问答、分析推理等。

演讲者：佃锐辉AMD公司大中华区数据中心事业部高级技术专家 Computing at the heart of modern life Most transformational technology in 50 yearsAI AI Platforms Unmatchedportfolio of trainingand inferencecompute engines Evolving AI Landscape Innovation moving from silicon to nodes to racks to clusters Advancing the AI Data Center Leadership Engines for Enterprise AI Workloads Fromanalyticstogenerative AItoagentic AI AMD EPYCrecord market share…and growing AMD end-to-end AI infrastructure leadership AMD end-to-end AI infrastructure leadership 5th Gen AMD EPYC World’s great CPU for Cloud, Enterprise and AI 150 billiontransistorsUp to192 cores384 threads17%IPC upliftFullAVX5125GHzUp to3nm4nm Consistent x86 ISAConsistent IPC SP5 Socket“Genoa” Compatible “Turin” ContinuesAMD EPYCLeadership 8to192 cores125W to 500W 12Ch DDR5-6400128 PCIe® 5.0/CXL® 2.0Up to Confidential Computewith Trusted I/O Scale-Up 16“Zen 5”CCDs128Cores•256ThreadsUp to Scale-Out 12“Zen 5c”CCDs192Cores•384ThreadsUp to Fifth Generation of CPU Leadership Starts Today 10.9xPerformanceAcross 5 Generations Industry’s HigherPerforming Server CPU 60% More Performance at the Same Licensing Cost up to1.6x Performance per core invirtualized infrastructure End-to-End AI and Inference Performance up to3.8x AI performance on CPU 7:1consolidation Use thesavings,spaceandpowertogrow your business ~87%fewer servers~67%lower TCO~68%less power 300+世界纪录ANDSTILLCOUNTING强者更强vEVEN 工程/技术数据管理&分析商业应用 73Massively Parallel applications37Modeling & Simulation16Floating Point Compute Intensive apps12HPC Energy Efficiency 16Business Intelligence6Structured Database Management2Unstructured Analytics Database9AI Platform/Text & Media Analytics 8ERM/SCM Business48Enterprise server-side Java®18EnterpriseEnergy Efficiency4FinTech 内容应用5Rendering 基础架构/超融合/软件定义基础架构23Cloud and Virtualization15Integer Performance/General Purpose8Integer/General-Purpose Energy Efficiency3VM Energy Efficiency 数字服务1Social Networking BI Complete Portfolio From Edge To Endpoint Powering Artificial Intelligence for Large-Scale Data Centers Largest Finnish languagemodel (TurkuNLP-13B)Allen Institute scientific LLM WUS3 runningAI and HPC workloads National Cancer Instituteand DOE acceleratingcancer researchand treatment T5 NLP with11Bparameters Strategic Partnership Between AMD and Tencent Cloud AMD携手腾讯云为企业和用户提供领先的人工智能，大数据和云计算服务，助力数字化转型。 THANKS 谢谢观看腾讯云高效能智算底座加速释放AI生产力演讲者：腾讯云计算产品架构师孙辰龙 AI原生新时代训练加速推理加速应用加速01020304 AI原生新时代 AI原生时代，大模型的蓬勃发展跟智能算力息息相关 AI大模型训练的算力每3.4个月翻一倍全球人工智能硬件市场预计2026年增长至347亿美元五年年复合增长率达17.3% 全球科技巨头倾力入场中国10亿参数大模型超100个技术突破 2024年《政府工作报告》首次提出开展“人工智能+”行动政策支持 AI大模型及应用，对智算方案提出了三大挑战腾讯云“一云多芯”智算方案，提供高价值软硬一体高性能算力服务一云多芯支持国内外主流芯片与处理器完整工具链统一接口的硬件屏蔽方案及全面的生态迁移工具训推加速套件软硬协同，提供腾讯云独有的极致性能率先提出AI Infra品牌「腾讯云智算」，持续提升用户体验训练的核心诉求：尽快完成每一个训练任务高性能计算集群HCC：算力丰富度升级，全面拥抱大模型，业内领先的AI算力集结前沿国内外芯片软硬协同，针对腾讯云硬件定制适配框架独家优化轻松接入，业务代码无侵入“零”改造适配丰富多元的算力，提供完整配套的工具链支持加速框架层星脉网络全新升级推理混布调度充分利用闲置训练集群资源支持主流AI框架、训练作业模板训练一键部署自研交换机多轨道网络架构，千卡集群的训练性能扩展比高达96% 算力编排层基于SDHN实现硬件故障隔离网络故障无感知 5%超细粒度切分支持qGPU对单卡进行算力隔离软件定义层全面搭载腾讯自研星脉网络3.2TbpsRDMA网络云原生一致体验相比友商提供云上网络、存储、镜像基础设施层长稳训练不中断任务及节点异常恢复机制，资源利用率99%，模型训练提效200% 高性能网络：集合通讯全面领先，云网端全链路感知AI业务 ◼产品能力 IHN运营运维系统 •低成本、大规模多轨道网络架构： •流量亲和性FatTree组网，路径时延降低40%，支持高冗余bonding上联•超大规模：多GPU异构接入，通过双平面多轨道方案，支持单集群万卡规模 •高性能无损通信： •TCCL，感知拓扑进行流量亲和性调度，实现AllReduce的负载率达到90%以上•拥塞调度器，全局业务流精准的监控、选择、决策和调度，3分钟内完成拥塞消除 •监控系统：全QP精细监控，可快速定位网络、GPU故障节点，实现集群自愈•网络故障1分钟发现、3分钟定位、5分钟自愈高性能存储：多级加速数据快速读取，云原生混合存储方案千万级IOPS、100GB/s吞吐，百us延时高性能低成本支持全量训练数据持久化在对象存储上，通过GooseFS提供多级分布式缓存方案。提供海量低成本分布式存储可靠存储通过高性能并行文件存储TurboCFS，支持Checkpoint数据及重要模型/样本数据可靠存储 3TBcheckpoint的写入时间从10分钟缩短至10秒内，大幅提升大模型训练效率云原生平台：故障实时监测，支持智能断点续算训推一体：业务无缝衔接，灵活调度充分利用GPU算力推理的核心诉求：硬件算力发挥到极致 AI推理需求提升Batch_size来提升吞吐高吞吐推理集群：为业务提供更高性价比选项性能规格、软件加速、场景覆盖全面提升国产推理实践：某电商客户高效迁移，满足客户丰富的场景需求客户背景国内大型社交媒体平台，生活平台和消费方式流量入口。业务需求 •客户业务有大量传统AI模型推理需求，业务场景涉及CV、NLP等；•随着业务量增长推理卡有扩容需求，考虑到未来供应链多元化、稳定性，适配国产推理卡。迁移解决方案 •提供PTX1计算实例作为现有推理卡型补充并支持TKE接入方式•客户推理服务框架集成腾讯九霄软件栈•1个月内完成NLP、CV共计6个模型适配和迁移迁移时间 TKE NPU实例计算加速套件：软硬协同优化，「降本」和「提效」之间兼得 TACO/Pipefusion实现高效推理 TACO-LLM：加速LLM模型高效推理，性能最高提升2倍主流模型兼容全面兼容LLAMA/Falcon/OPT等 TACO-LLM使用收益 TACO-DiT：加速DiT文生图模型推理，性能最高提升2倍高能效显存占用减少30～50% 多维度高精度支持张量/序列/流水/混合等多种并行模式图像生成质量几乎无损耗 DiT模型发展成为趋势 TACO-DiT套件继Sora之后，DiT架构成为文生图/视频主流序列并行（USP）张量并行（Megatron）偏移流水并行（PipeFusion）偏移序列并行（DistriFusion:）腾讯云异构计算平台高性能计算集群HCC 高性能应用服务HAI：每个人、每家企业都能实现自己的AI Idea GPU轻量工作空间全新上线腾讯云智算套件：让高性能算力无处不在，任意位置构建AI原生能力灵活部署支持专有云、分布式云多种形态部署满足客户自有GPU、自建智算中心需求全栈智算经历公有云和自研混元大模型打磨沉淀应对智算木桶效应，推出算存网全栈方案一云多芯适配多种GPU芯片和网络交换机支持混合部署，对硬件保持开放兼容广泛认可：覆盖全国90%+大模型客户,被市场坚定选择的稳固AI底座 THANKS 谢谢观看腾讯云大数据AI场景实践 Data+AI CONTENT 腾讯云大数据概述DataforAI产品实践AIforData产品实践010203 腾讯云大数据概述腾讯具备全球领先的大数据技术能力与实践在腾讯大数据in all 对外开放腾讯业界领先的大数据技术实践大数据应用全场景化覆盖企业级数仓与数据湖用户画像精准推荐业界领先大数据技术贡献千万核大数据平台运营大规模运营技术海量算力调度技术丰富运维工具沉淀 SortBenchmark性能冠军近百技术贡献者数百万代码贡献开源开放，回馈社区 •2014年TDW开源•20

点击免费查看完整报告

你可能感兴趣

CTO100内容精选-四川站

你可能感兴趣

CTO100出海产业研习团-华东站内容精选

CTO100内容精选-清远站

CTO100内容精选--互联网研习团山西站

CTO100内容精选——出海研习团北京站

CTO100内容精选--互联网研习团东北站