您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国科学院科技战略咨询研究院]:科教算力共享 - 发现报告
当前位置:首页/行业研究/报告详情/

科教算力共享

科教算力共享

王晓明,吴静,李宏,孙翊,吕佳龄,刘昌新中国科学院科技战略咨询研究院 22/17目录一、算力全景图二、科研算力需求三、教育算力需求四、未来发展思路与建议 33/17算力的发展态势算力:计算能力,主要指数据收集、传输、计算和存储能力。算力相关设施:大数据中心、超算中心/云计算中心、大科学中心、AI等等•指数增长•海量、非结构化•异构多质、智能化• AI、Big Data、Cloud Computing融合应用•联邦AI、端边云协同技术•异构算力•图像处理•自然语言处理•千倍定律• E级计算、碳基芯片•非冯计算体系通用算力快增AI算力崛起数据存储多元化云计算ABC时代 44/17算力发展态势国产芯片成为国产超级计算新主流但发展路径较多,有待优化龙芯申威海光飞腾鲲鹏兆芯指令集MIPSAlphaX86ARMARMX86指令集来源永久授权+自研永久授权授权授权授权授权主要产品龙芯3A3000/3B3000SW410、SW26010DhyanaFT-2000/64鲲鹏920ZX-C、ZX-A系列支持的桌面及服务器操作系统LinuxLinux等Windows、Linux多种操作系统欧拉Windows、Linux所属公司龙芯中科技术有限公司江南计算机所海光信息技术有限公司天津飞腾信息技术有限公司华为技术有限公司上海兆芯集成电路有限公司 55/17科研领域的IT基础架构和计算能力-国际经验(美国)美国没有像中国一样以政府为主部署的国家计算中心网络各大企业有各自的独立算力布置,如IBM、微软等超级计算机设施“蓝色纽约”位于纽约的布鲁克海文国家实验室(BNL),是纽约计算科学中心(NYCCS)的核心“蓝色纽约”是BNL与IBM成功合作的例子,其软硬件及操作体系被IBM控制和支持“蓝色纽约”一直在寻求学术界与工业界的合作,计算技术改进开发吸引了新业务,将先进的科学研究转化为了广泛的商业成功 66/17美国的算力设施所属实验室研发设施英文名称中文翻译Argonne National LaboratoryArgonne Leadership Computing Facility (ALCF)阿贡前沿计算设施(ALCF)Brookhaven National LaboratoryNational Nuclear Data Center国家核数据中心Lawrence Berkeley National LaboratoryNational Energy Research Scientific Computing Center (NERSC)国家能源研究科学计算中心(NELSC)Oak Ridge National LaboratoryOak Ridge Leadership Computing Facility (OLCF)橡树岭前沿计算设施(OLCF)所属实验室研发设施英文名称中文翻译Argonne National LaboratoryTransportation Research & Analysis Computing Center交通研究与分析计算中心Brookhaven National LaboratoryNew York Blue蓝色纽约计算科学中心Brookhaven National LaboratoryNew York Center for Computational Sciences纽约计算科学中心FermilabAdvanced Computing Technologies先进计算技术设施Lawrence Livermore National LaboratoryHigh Performance Computing Innovation Center高性能计算创新中心Pacific Northwest National LaboratoryComputational Science Facility (CSF)计算科学设施(CSF)Pacific Northwest National LaboratoryNorthwest Institute for Advanced Computing (NIAC)西北先进计算研究所•美国主要算力基础设施•科学专用算力基础设施 77/17科研领域的IT基础架构和计算能力-国际经验(欧洲)欧洲高级计算伙伴关系设施(PRACE)是欧盟数字经济领域的分布式算力建设•2006-2010建设费为5亿欧元,建成后年运行费0.60亿欧元•2010-2019年改造升级资金1.32亿欧元,其中1.25亿欧元由欧盟委员会提供PRACE的入口由5个成员国提供(西班牙、意大利、瑞士、德国、法国)通过评审,学术界和工业界的科学家和研究人员就可以使用其系统PRACE部署的系统不断更新和升级,达到了全球HPC技术的顶峰PRACE的高性能计算算力也为中小企业提供支持,纳入商业模式PRACE算力中中小企业所占用的比例 88/17我国科教算力基础设施体系布局我国在国家层面出台了《科学数据管理办法》和《国家科技资源共享服务平台管理办法》部署了国家超算中心、各国家科学数据中心、大科学装置等此外,各科研院所和高校也拥有自己的小型超算中心资源我国科教领域算力布局科教领域算力科技部:科研国家科学数据中心(20个)国家超级计算中心(7个)发改委:应用+设施大数据国家工程实验室(13个)教育大数据应用技术国家工程实验室大数据应用技术等国家工程实验室大科学装置(60多个)教育部三通两平台新工科建设产教融合平台(4个)产学合作协同育人项目(1000多所高校)地方政府:产学研云计算中心大数据中心 99/17国家超算中心云计算中心成立时间规模应用领域天津云计算中心2009年占用房屋面积约8,500平方米,共建有2个大型机房共约4,000平米生物医药、石油地震勘探数据处理、动漫与影视渲染、新材料新能源、高端装备设计与仿真、航空航天、流体力学、天气预报、气候预测、海洋环境模拟分析深圳云计算中心2009年运算速度达每秒1,271万亿次。配备高达17.2PB的海量存储及来源于各大运营商、教育网的丰富网络带宽资源大规模科学计算和工程仿真、动漫渲染等计算业务,同时以其强大的数据处理和存储能力为社会提供云计算服务长沙云计算中心2011年一期工程规划建筑面积30000平方米为气象、国土、水利、卫生/医疗、交通等公共服务部门提供了高性能的计算平台服务。济南云计算中心2011年采用自主处理器构建千万亿次超级计算机系统的国家面向海洋科学、现代农业、油气勘探、气候气象、药物筛选、金融分析、信息安全、工业设计、动漫渲染等领域提供计算和技术支持服务,承接国家、省部等重大科技或工程项目。广州云计算中心2013年总建筑面积42332平方米,其中机房及附属用房面积约17500平方米是助推战略性新兴产业发展、支撑国家创新型城市和智慧广州建设的重大战略性基础设施,成为融高性能计算、海量数据处理、信息管理服务于一体的世界一流超算中心。 1010/17国家科学数据中心大数据中心:用以存储和操作海量数据的中心。以IO操作、增删查改、任务调度为主。国家科学数据中心是由国家按照统一标准和规划设立的大型数据管理设施,代表国家对于特定领域(或交叉领域)的科学数据进行统筹管理和服务。国家科学资源共享服务平台国家科学数据中心(20个)国家生物种质与实验材料资源库(30个)•中国科学资源共享平台序号国家平台名称依托单位主管部门序号国家平台名称依托单位主管部门1国家高能物理科学数据中心中国科学院高能物理研究所中科院11国家冰川冻土沙漠科学数据中心中国科学院寒区旱区环境与工程研究所中科院2国家基因组科学数据中心中国科学院北京基因组研究所中科院12国家计量科学数据中心中国计量科学研究院市场监管总局3国家微生物科学数据中心中国科学院微生物研究所中科院13国家地球系统科学数据中心中国科学院地理科学与资源研究所中科院4国家空间科学数据中心中国科学院国家空间科学中心中科院14国家人口健康科学数据中心中国医学科学院卫生健康委5国家天文科学数据中心中国科学院国家天文台中科院15国家基础学科公共科学数据中心中国科学院计算机网络信息中心中科院6国家对地观测科学数据中心中国科学院遥感与数字地球研究所中科院16国家农业科学数据中心中国农业科学院农业信息研究所农业农村部7国家极地科学数据中心中国极地研究中心自然资源部17国家林业和草原科学数据中心中国林业科学研究院资源信息研究所林草局8国家青藏高原科学数据中心中国科学院青藏高原研究所中科院18国家气象科学数据中心国家气象信息中心气象局9国家生态科学数据中心中国科学院地理科学与资源研究所中科院19国家地震科学数据中心中国地震台网中心地震局10国家材料腐蚀与防护科学数据中心北京科技大学教育部20国家海洋科学数据中心国家海洋信息中心自然资源部 1111/17算力新基建国家发改委首次明确了新型基础设施的范围及内容,主要包括:信息基础设施、融合基础设施和创新基础设施,算力基础设施则是创新基础设施的重点建设内容之一。图 我国几个重要算力载体关系 1212/17案例:中国科学院的超级计算环境中国科学院超级计算环境(ScGrid)由总中心、分中心、所级中心组成的三层架构网格计算环境还连接了中国科学院院内多家单位的GPU计算集群,聚合计算能力超过315PF系统使用率超过50%,核心算力为“元”超级计算系统软件体系主要包括:MPI(信息处理界面)、各类数学库、各类工具软件、CUDA(计算统一设备架构)、各类应用软件、针对社会用户的付费应用软件中国科学院超级计算网格 1313/17目录一、算力全景图二、科研算力需求三、教育算力需求四、未来发展思路与建议 1414/17科研范式演进下的算力需求发展态势图灵奖得主吉姆·格雷(Jim Gray)2007年提出科学范式 1515/17第三范式模拟模型优化下的算力需求随着计算资源和技术的升级迭代,未来模型复杂度的深化将亟待超级计算资源和技术的支撑1.模型复杂度提高带来的计算需求3.高性能计算是助力科学研究和工程技术进步的关键•未来随着E超级计算平台的研发,各学科模拟研究的分辨率都将逐步精细化,从而引发新的算力需求。2.模型模拟尺度精细化带来计算需求•格点QCD(量子色动力学)最大的格点体系大小为1283×256,计算规模大约为十万或数十万核;•未来如果规模提高到2563×512,则计算规模将增大到数百万核,必须使用E级计算高性能计算可运用有效的算法,快速完成科学研究、工程设计、金融、工业以及社会管理等领域内具有数据密集型、计算密集型和I/O(数据输入输出)密集型的计算 1616/17第四范式的典型案例2013年诺贝尔化学奖化学反应发生的速度堪比光速。多尺度复杂化学系统模型翻开了化学史的“新篇章”,实现对化学反应的每个步骤进行追踪。2017年诺贝尔物理奖引力波的发现,激光干涉仪前四个月的观测数据量达到500TB,数据分析消耗17亿CPU小时的计算资源。2019年人类首张黑洞照片:3.5PB数据,2万CPU小时计算资源。 1717/17第四范式下的计算需求密集型数据使传统人工处理方法不再有效,而必须使用更为智能的、自动的、高效的现代数据挖掘技术。算力资源呈现出个性化的需求算力资源将更加倾向于商品化未来关于算力共享租赁将逐渐成为一大产业,当前的科研算力租赁模式下的资金主要来源于国家科研项目支持。不同研究领域的科研人员算力需求构成千差万别,即便是同一领域,由于其研究问题的差异,也会表现出不同的硬件和软件资源的需求差异数据存储计算资源私人计算空间定制化的数据资源 1818/17第四范式下数据管理和访问的需求数据来自不同学科、不同行业,既包括结构化数据,也包括非结构化数据,或者半结构化数据,要实现这些不同类型数据的整合使用需要有统一的数据标准和数据接口,促进数据的融合科学数据的长期保持和共享将成为重要的环节,以助于数据的重用和验证。面对海量数据,未来将形成数据全生命周期管理,建立对大数据数据集创建、存储、分析、