AI智能总结
目录 中国信通院数据智能工作介绍01 大模型+数据智能分析应用发展趋势02 大模型+数据智能分析应用标准化工作介绍03 l24个省通信管理局行业支撑中心(210人)l37家院属企业 4•工业互联网与智能制造领域【上海、江苏、湖北、广东、重庆…】•大数据、人工智能、物联网等新一代信息技术领域【江苏、河南、江西…】•车联网领域【上海、四川】•智慧医疗领域【河南】•芯片与集成电路【无锡】•新能源领域【嘉兴】 中国信通院云大所简介:聚焦信息领域新技术、新业态、新模式 大数据与智能化部围绕数据和智能化两大领域,开展技术、标准研究,构建相关技术的测试、试验和统计平台,承担相关服务和产品的测试评估工作,提供相关技术标准的咨询服务。 政府支撑方面工作 l中国信通院作为国家高端智库,支撑国务院办公厅、工业和信息化部、中央网信办、国家发改委等部委起草编制数据领域重要政策文件,推动我国数据领域发展顶层设计构建完成。 2015 2021 2016 国务院以国发〔2015〕50号印发《促进大数据发展行动纲要》成为我国发展大数据产业的战略性指导文件,中国信息通信研究院是主要起草单位。 参与起草工业和信息化部《大数据产业发展规划(2021-2025年)》并参与宣贯实施工作。 牵头起草工业和信息化部《大数据产业发展规划(2016-2020年)》并参与宣贯实施工作。 政策文件起草 2022 2022 2021 参与起草《数字中国建设整体布局规划》,重点支撑数字基础设施和数据资源相关内容。 参与起草工业和信息化部《关于加快推动区块链技术应用和产业发展的指导意见》并参与宣贯实施工作。 参与起草《关于构建数据基础制度更好发挥数据要素作用的意见》,支撑相关政策未来的细化和落地。 政府支撑方面工作 l围绕国家数据领域战略部署,支撑工信部、国家数据局、网信办、国家发改委、科技部等部委,以及地方政府的大数据、区块链相关工作,提供数据相关政策咨询、试点支撑等服务。 •牵头筹备5组的数据基础设施专班,统筹支撑国家数据基础设施设计、建设和运营; •牵头筹备2组的《“数据要素x”行动计划》文件编制,指导数据要素对各行业的赋能过程;•支撑筹备3组的《公共数据开发利用指导意见》文件,跟踪相关政策的规划落地。 •支撑促进大数据产业发展相关工作,对大数据、数据库产业展开调研,梳理产业问题、收集企业需求及痛点,形成大数据产业图谱;•大力推动DCMM全国范围内的贯标工作,实现行业覆盖更广,企业服务更深。培育DCMM评估服务生态,促进产业数字经济发展;•支撑促进区块链产业发展相关工作,支撑Web3.0等新技术新应用研究,区块链典型案例征集等 重要工作支撑 支撑区块链发展管理相关工作;支撑中央网信办、中宣部、国办电子政务办、最高法、最高检等18部委联合开国家区块链创新应用试点工作,承担试点工作组。 数据基础设施政策支撑:牵头支撑国家数据基础设施建设 “数据基础设施的建设将与数据基础制度的落地和数据资源开发利用的实施一起,共同为数据要素产权确权、收益分配、交易流通、安全治理等核心问题的解决发挥作用。同时,数据基础设施也将对扩大数据产业规模、繁荣数据产业生态、促进数字经济高质量发展产生重要意义。” ——国家数据局党组书记、局长刘烈宏 数字科技和基础设施建设司 数字经济司 数据资源司 综合司 政策和规划司 数据领域科学技术的攻关和关键基础设施建设,以及学科体系建设和专业人才培养。 开展数字中国、数字经济国际合作,承接发改委关于人事、财务、纪检等工作。 数据制度、数字经济、数据社会、数据要素等方面政策法规制定。 开展数据确权、数字资源开发利用等工作; 实施数字经济、智慧城市等方面工作; 数据基础设施工作专班 组织架构 工作目标 •加快研究和明确数据基础设施概念、内涵、外延,在业内形成统一共识。•加快研究和明确推动我国数据基础设施建设的重点工作和政策措施,会同有关部门研究出台数据基础设施顶层规划,开展试点验证,培育新型产业生态。 •组长单位:中国信息通信研究院 •副组长单位:国家信息中心•成员单位:国家发展改革委创新驱动发展中心、中国电子技术标准化研究院、中国电信、中国移动、中国联通 部门总体工作框架 数据智能评估测试:国内最全面、深入的数据智能评测体系 l总计已有169家企业参与评估测试,374款产品通过评测,完成测试数量408个。。 数据智能应用方向参与评测的部分企业: 中国信通院数据智能应用产业研究和生态建设工作 在数据应用方向,中国信通院联合各方积极开展产业研究和生态建设工作,联合细分行业内的头部企业,完成多本研究报告、实践指南和白皮书,举办多场数据应用论坛、系列沙龙、星河案例征集等活动。 目录 中国信通院数据智能工作介绍01 大模型+数据智能分析应用发展趋势02 大模型+数据智能分析应用标准化工作介绍03 人工智能技术发展演进,从专家系统到大语言模型 大模型落地关键技术发展趋势 数据智能体技术发展 大模型快速落地,催生数据智能应用新范式 数据智能应用方向标准化工作 l围绕数据智能应用相关技术工具,数据智能服务,业务数智化三大方向开展标准化及评估测试工作。 通用数据智能应用技术标准:面向通用数据智能技术提供方,为数据智能工具平台的研发、选型和评测提供参考。 面向数据服务提供方,为数据分析应用、数据可视化、数据API、音视频等服务实施团队的相关工作提供参考,并助力应用侧开展选型工作。 面向数字营销、智能风控、智慧财务、数字化企业管理等重点业务方向,构建业务数智化能力模型,助力供给侧能力建设和应用侧选型。 •《商务智能分析工具技术要求与测试方法》•《数据开发平台技术要求与测试方法》•《知识图谱工具技术要求与测试方法》•《数据科学平台技术要求与测试方法》•《数据可视化平台技术要求与测试方法》•《用户行为分析工具技术要求与测试方法》•《数字孪生平台技术要求》 供给侧能力标准: •《数据分析应用服务能力分级要求》•《数据可视化服务能力分级要求》•《数据API服务能力分级要求》•《智能化音视频数据服务能力分级要求》 •《数字营销解决方案分级要求:技术能力》•《数字营销解决方案分级要求:服务能力》•《金融风控解决方案分级要求:技术能力》•《金融风控解决方案分级要求:服务能力》•《大模型驱动的数智营销技术能力要求》 •《数据智能管理驾驶舱技术要求》 大模型+数据智能应用系列标准: 应用侧能力标准: •《大模型驱动的数据分析工具技术要求》new•《大模型驱动的知识图谱工具技术要求》new•《检索增强生成技术能力要求》new•《大模型驱动的智能问答系统技术要求》new•《数据智能体技术总体要求》new•《数据分析智能体技术要求》new •《企业数字营销能力成熟度模型》•《企业智能风控能力成熟度模型》•《企业智慧财务能力成熟度模型》 目录 中国信通院数据智能工作介绍01 大模型+数据智能分析应用发展趋势02 大模型+数据智能分析应用标准化工作介绍03 《大模型驱动的智能数据分析工具》标准编制背景 u大模型驱动的智能分析工具通过大模型能力提升分析流程中数据准备、洞察发现、结果输出共享等方面的能力,能够以更低的技术门槛、更高的效率使非技术背景人员实现更具深度的分析。 Co-Pilot随着2023年GPT、AIGC技术的爆火,PowerBI、百度SugarBI、观远BI等团队纷纷推出以BI+GPT为理念的智能数据分析工具。 BI 2.0传统图形化交互式分析工具 数据准备 数据准备 通过智能算法识别数据架构,并推荐数据清洗规则 人工进行数据编目、数据清洗、元数据管理等工作 对话式分析 界面交互分析 洞察发现 洞察发现 支持自然语言方式进行交互;大模型辅助结果分析 通过交互式界面进行数据探索;人工进行建模 结果输出共享 以自然语言或可视化的形式生成见解,推荐后续动作 通过仪表盘等方式输出结果;人工对结果进行解释 《大模型驱动的智能数据分析工具技术要求》标准介绍 为了规范大模型在数据分析领域标准化的应用发展,中国信通院联合50余家企业共同研制完成《大模型驱动的智能数据分析工具》标准。标准包含数据准备、大模型智能分析、智能交互、集成部署、安全管理等六大能力域,18个能力子域,54个能力项。首批通过评估企业:数巅科技、浙江移动、网易数帆、瓴羊quick BI、中电信人工智能、观远数据、数势科技、科大讯飞等10余家企业 编制历程 •2023年8月启动相关工作调研•2023年9月第一次标准讨论会•召开四次全体标准讨论会、十余次点对点沟通会•2023年11月完成定稿•测试证书将于12月数据资产大会颁发 《大模型驱动的智能知识图谱技术要求》标准编制背景 u知识图谱技术自2012年推出以来,取得了极大的进展,但随着知识图谱的深度应用,知识图谱存在构建难度大、知识更新难、人工介入多等问题,限制了知识图谱落地应用。随着人工智能技术的进步,尤其是大语言模型的崛起,为智能知识图谱的构建和应用注入了新的活力。大语言模型和知识图谱作为两种重要的知识处理技术,正在经历着深度的融合发展。 大语言模型的优势与局限 •知识图谱智能生成:借助大模型的助力知识的自动化抽取和知识补全•大模型可控生成:通过外挂知识图谱,控制大模型生成内容•大模型能力评估:知识图谱帮助大型模型的评测和应用 •优势:海量的通用知识,并且在理解和生成文本方面表现出色 •劣势:构建和维护成本高,在自然语言处理方面存在局限性,知识的广度和更新速度也收到很大限制。 •劣势:知识的显式表示、可解释性、偏见处理、泛化能力方面存在挑战 •优势:结构化的知识表示,能够提供清晰、可解释的信息 《大模型驱动的智能知识图谱技术要求》标准情况简介 中国信通院联合厦门渊亭科技共同牵头,依托TC601拟制定团体标准《大模型驱动的智能知识图谱技术要求》,此标准规范了数据准备、模型场景化适配、智能试试图谱构建、智能交互应用、知识图谱存储与管理6大能力域,15个能力子域,120余项技术要求。厦门渊亭科技、中电信人工智能等多家企业进行测试,报名火热进行中标准框架: 编制历程 •2023年12月启动相关工作调研•2024年1月第一次标准讨论会•召开四次全体标准讨论会、十余次点对点沟通会•2024年4月完成定稿•完成首家测试,报名火热进行中 知识图谱赋能大模型内容生成-Graph Rag技术发展 《检索增强生成技术要求》标准研制背景 知识图谱赋能大模型大模型赋能知识图谱u检索增强生成(Retrieval-Augmented Generation,RAG)是一种通过检索外部知识库来获得额外语料,并使用ICL(In-Context-Learning,上下文学习)来改进大型语言模型(LLM)生成效果的范式。RAG能有效地缓解大型语言模型幻觉问题,提高知识更新速度,并增强内容生成的可追溯性,使得大型语言模型在实际应用中变得更加实用和可信,成为大模型在垂直领域落地的重要技术。 领域知识补充 外挂知识库能够为通用大模型的行业化应用提供行业领域知识支撑,弥补通用大模型语料里专业领域知识的不足 内容实时更新 利用检索生成技术,能够使实时检索最新知识,弥补大模型训练数据更新不及时等相关问题 大模型可控生成 可以利用知识图谱等外拐知识库在大模型中引入指定约束,适度控制内容生成,提高大模型在行业应用场景中的适应能力。 检索增强生成(RAG)框架-经典范式(Advanced RAG) 《检索增强生成(RAG)技术要求》标准发布 检索增强生成(Retrieval-Augmented Generation,RAG)是一种通过检索外部知识库来改进内容生成效果的技术方案,通过引入检索过程,从预先构建的数据存储中检索相关的内容,能有效地缓解AIGC技术的幻觉问题,提高知识更新速度,并增强内容生成的多样性