您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[海光信息技术股份有限公司]:海光DCU行业实战手册 - 发现报告

海光DCU行业实战手册

AI智能总结
查看更多
海光DCU行业实战手册

海光DCU行业实战手册 海光信息技术股份有限公司 公司介绍/ COMPANY PROFILE 海光信息技术股份有限公司成立于2014年,于2022年在科创板上市(股票代码:688041),主要从事高端处理器、加速器等计算芯片产品和技术的研究、开发,目标是成为世界一流的芯片企业,为数字中国提供核心计算引擎。海光信息以务实的态度、创新的理念、先进的技术和可靠的产品,致力于促进我国信息产业核心竞争力的提升。 愿景 VISION 使命 MISSION 作为国产先进微处理器产业的推动者,海光已独立实现多代通用处理器CPU产品和人工智能加速器DCU产品的自主研发和商业化应用。基于卓越性能、主流生态、安全可靠、自主迭代等优势,海光芯片已搭载于多家国内知名整机厂商的产品,并在云计算、大数据处理、人工智能等商业场景中得到广泛应用,覆盖政府、通信、金融、医疗、教育、交通、能源等关键行业,占据国内高端计算、智能计算市场头部份额。 为数字中国提供核心计算引擎 成为世界一流的芯片企业 研发与创新实力 先进微处理器技术国家工程研究中心是专门面向C86架构芯片核心关键技术研究与工程设计的国家级工程实验室。 实验室三大优势 目录CONTENTS 产品介绍PRODUCTINTRODUCTION DCU:国内唯一全精度通用AI加速卡 通用架构 采用GPGPU大规模并行计算架构设计,通用性好,全面兼容CUDA、ROCm软件生态,迁移成本低 开源生态 支持主流AI框架和工具链,覆盖全部开源大模型,支持主流AI、AI for Science和科学计算等各类应用软件 全面精度 支FP64、FP32、TF32、BF16、FP16、INT8等多精度计算,精度完备,全面支持科学计算和AI加速计算 DTK异构计算平台 DAS人工智能基础软件系统 DTK(DCU Toolkit)集成了DCC(DCU Collect Compiler)编译器、经过验证和优化的计算库,支持多种编程语言,同时提供运行、编译、调试和性能分析功能。 DAS(DCU AI Software Stack)提供AI算子优化库、AI模版库、AI编译器、基础AI框架、推理框架和三方套件,并通过OpenDAS以开源方式提供AI扩展套件服务。 DAS与 ModelZoo、镜像仓库、创空间、开发者社区、AI 平台等构成一套完整的人工智能基础设施,全栈全场景赋能用户AI应用研发,助力千行百业智能化转型,加速新质生产力建设。 DTK可支持主流科研工具,包括但不限于Gromacs、Lammps、PWmat、Openfoam、DeePMD-kit、DeepFlame、Quda、SD3、Alphafold、Geoeast,覆盖人工智能、材料科学、生命科学、工业仿真、气象环境、地质地震等科研领域。 DTK兼容国际主流的GPGPU开源生态,可直接编译开源的GPGPUC/C++代码,旨在让用户快速移植和使用开源社区的计算工具,降低适配周期和人力投入,致力于让用户只维护一套代码。 针对海光DCU设计,全栈自主研发,并持续优化 性能卓越达到行业主流水平 已适配260+Science应用工具,覆盖12大科研领域 覆盖AI、Al4S、Science领域加速需求 兼容主流GPU开源生态,享受开源红利 支撑上层科学计算/AI框架与应用GPUFusion兼容CUDA/ROCm双生态 CUDA核心组件功能覆盖率除硬件外达到100% DAP人工智能应用平台 DAP人工智能应用平台定位于企业级大模型开发平台,致力于帮助客户快速搭建个性化知识库问答系统,通过自定义的工作流,完成用户特定的业务应用场景,在人工智能应用领域独具特色。 DAP提供对话引擎、企业知识库引擎、Agent编排引擎等能力矩阵,同时具备完善的企业级产品特性,包括精细化用户管理,SSO单点登录、多模型纳管、负载均衡等。 海光DCU应用场景APPLICATIONSCENARIOS 方便开发者快速集成各类功能便于与其他系统或应用集成 支持多个知识库的混合使用与高效检索确保回答全面准确 支持处理各个格式文件以及http调用第三方接口 简单拖拽即可定制复杂逻辑常用模块可封装复用 基于海光DCU打造智算一体机中国电信天翼云 实战场景一:AI大模型一体机 基于海光DCU的大模型一体机 海光信息秉承“深算智能”战略,以C86 CPU+DCU异构加速计算平台为核心,发挥“全精度通用架构、兼容主流AI生态、开放开源合作”等优势,倾力打造“DCU-DTK-DAS-DAP”全栈软硬件技术生态体系,支撑各类大模型适配优化与应用创新,助力千行百业智能化转型。 海光与天翼云联合推出基于海光DCU的智算一体机,通过整合天翼云翼政通等智能AI应用、云管平台以及推理管理平台,支持接入主流大模型驱动定制化功能,结合主流大模型实现一站式快速交付。 背景需求/ BACKGROUND 针对这些问题,需通过算法框架优化、加速库升级和软硬件全栈调优,构建起从模型微调、推理服务到智能体编排应用的全流程解决方案。 随着AI技术的快速发展,行业客户在智能化转型的过程中面临应用场景模糊、试错成本和算力成本高昂等一系列问题。 方案亮点 实施效果 性能卓越:海光DCU与天翼云智能AI软件深度协同,满足复杂业务场景需求,带来精准高效的AI应用体验。 软硬一体化交付,全流程自动化部署,真正实现开箱即用,大幅缩短项目落地时间。 海光硬件与天翼云软件深度融合,方案性能强劲、稳定可靠,已通过各行业客户的现网验证,能够提供坚实的可靠性保障。 灵活拓展:海光DCU全面兼容主流AI框架,推动业务快速上线,并为客户自主研发预留弹性算力空间。 安全自主:采用海光DCU+CPU的全国产化方案,为私有化部署提供数据保护,具备模型推理全流程的隐私防护能力。 一体机一站式交付,简化前期建设投入,助力客户快速接入大模型,拥抱AI时代。 持续落地重庆市某区政府、湖南某市政务云、肇庆某三甲医院、南宁市某局等地。 浙江算力科技 海曦技术 携手海光DCU团队推出AI政务智能体 联合海光打造开箱即用、全栈交付的心理筛查一体机 海曦技术基于海光DCU与国产大模型打造心理筛查一体机,首创游戏化多模态无感采集技术,突破传统心理筛查的局限,实现75%的病症识别准确率,交付国内首个深度融合行为分析与AI诊断的心理健康筛查平台。 浙江算力科技通过打造“1个中枢+2个数智产品”架构,在海光DCU上实现算力、数据、算法全要素整合,赋能杭州某重点区县上线全国首个深度融合浙政钉的AI政务智能体。 城市智能化升级需求迫切,需通过智能中枢实现跨部门数据融合与决策协同,解决传统城市管理响应滞后、资源调度低效问题。 传统筛查手段失效:问卷/沙盘等方式易引发学生抵触,数据真实性存疑,且难以捕捉隐性心理问题。 校园心理危机预警缺位:缺乏高效工具预防抑郁、自闭、欺凌及自杀事件,校园安全管理存在盲区。 现有电子政务系统难以支撑智能化服务,亟需AI驱动的工作流重构提升行政效能。 隐私与效率双重挑战:需在保护未成年人隐私前提下,实现大规模快速精准筛查。 响应国家信创战略,需在政务领域实现从算力基础设施到应用系统的全栈国产化替代。 技术国产化需求:突破国外技术垄断,构建自主可控的心理健康评估技术体系。 方案亮点 方案亮点 城市大脑中枢架构:整合海光DCU算力、多源城市数据与AI算法,构建支持实时决策的智能运算平台。 在杭州某重点区县上线全国首个“AI公务员”系统,实现政策咨询、事务办理等7类场景智能响应。 数据长期跟踪与发展性评估:建立学生心理成长档案库,通过随机截距交叉滞后模型分析学业成绩与心理状态的动态关联,识别心理健康问题的关键发展节点。 结束了传统心理检测技术(问卷、沙盘等)一统天下的局面,在大模型和多模态技术的加持下,青少年心理筛查的手段变得更加友善、更加科学。 双数智产品体系:开发城市运行管理智能体与政务办公智能体,实现城市治理与行政服务的双轨智能化。 帮助医院、学校及时发现和解决学生的心理问题,从而有效预防校园抑郁、自闭、欺凌、自杀等事件的发生,为平安校园建设提供有力支持。 自动化报告生成:系统自动生成多维度可视化报告(如心理状态雷达图、风险因子权重分析),并提供可操作建议(如推荐干预课程、家校沟通话术)。 全栈国产化适配:信创云底座部署海光DCU,完成AI算力平台与浙政钉系统的深度集成。 方便学校和教育机构随时随地进行数据查询和分析,有效提升心理健康教育的针对性和实效性。 快速交付能力:利用海光DCU高兼容性特性,实现应用适配周期缩短50%。 实战场景二:行业智能化 某股份制银行:AI算力资源池建设实践 方案亮点 / HIGHLIGHTS 实施效果/ IMPLEMENTATION RESULTS 海光DCU通过良好的生态合作,助力某股份制银行建设国产AI虚拟化算力资源池,高效适配AI厂商产品,形成基于“海光DCU+先进算力池化技术+算力管理平台”的联合技术方案 共池部署:海光DCU与非国产GPU基于GPGPU架构协同应用,模型相互迁移。 “海光DCU+先进算力池化技术+算力管理平台”的联合方案,有效提升客户在AI基础设施的自主可控水平。 资源细化:通过软件定义的方法实现异构算力池化,细粒度对上层框架模型进行资源分配。 海光DCU支撑银行实现数字化、智能化转型,AI应用稳定运行。 统一平台:采用容器云平台响应应用需求,统一配置、集中监控,降低AI业务的管理监控难度。 实现数据中心级的GPU资源池化管理和弹性调度,并基于热迁移等功能显著增强业务可靠性与管理便利性。 某国有股份制商业银行顺应“人工智能+”的国家战略,结合AI解决方案推进数字化基础设施升级。 要求IT资源集约化管理,需实现国产算力和非国产算力统一调度以及多种框架和算法的统一管理。 GPU虚拟化:通过GPU虚拟化技术,提高了板卡利用率,充分发挥高算力优势。 考虑国产化算力资源的长期自主可控需求,率先将人脸识别、OCR识别、智能客服、大模型、机器学习、RPA、知识图谱、智能营销等全业态从国外算力切换到国产异构算力。 生态赋能:海光DCU采用GPGPU架构,兼容CUDA生态,与AI应用厂商高效适配,支撑40+业务场景迁移上线。 某证券公司 某保险公司 AI技术全面赋能证券业务智能发展 构建国产AI集群算力平台 针对全球金融市场每日产生的交易数据、舆情信息以及企业财报、行业研报等多模态内容,客户亟需海光DCU强劲算力提供的自然语言处理和多维度关联分析能力,以及实时推理与预测能力,实现对市场、政策和风险的穿透式秒级洞察。 客户通过夯实AI中台国产GPU算力底座,在营销、理赔、风控、客服、业务运营等领域深挖业务价值,并科学系统地开展大模型相关的人工智能应用,深化推进AI项目应用,形成规模化效益。 背景需求/ BACKGROUND 背景需求 / BACKGROUND 某财险AI中台底座以通用车险业务模型、地址识别模型、车牌识别模型等为“地基”,以“客服+理赔+承保”等业务领域模型为“框架”,在AI建立过程中需引入国产GPU资源池建设。 某头部券商每日需处理海量的金融数据,对于精准的市场趋势预测、风险评估以及智能投顾服务有着极高的需求。 经过市场调研及实际测试,某头部证券最终引入海光DCU,在智能客服、智能投顾、智能交易、智能合规等场景深度优化与高效赋能。 随着AI技术迎来重大升级,结合供应链安全,某财险规划建设具有持续发展能力的国产AI算力资源,为人工智能技术的发展提供充分的算力服务保障,赋能客户服务领域的AI智能应用。 传统的数据分析工具和模型已难以满足其对数据处理速度和分析精度的要求,迫切需要引入先进的人工智能技术以提升核心竞争力。 方案亮点 方案亮点 实施效果 实施效果 / HIGHLIGHTS 生产支持:选