AI智能总结
⼤模型发展历程 回到热点,ChatGPT演进过程 从“量变”到“质变”,AI进入“大模型”时代 从“量变”到“质变”,AI进⼊“⼤模型”时代 国内⼤模型“百花齐放”,产业落地已过“尝鲜期” ⼤模型催⽣“效率⾰命”,为产业提质增效 场景更“广” 能力更“强” 效率更“高” 应用更“深” 百行千模满足更多行业需求 助力生产、经营、管理重塑业务模式 专业知识+推理能力特定领域表现及适应性 大模型+AI原生应用推动业务全链条智能 国内AI政策⼤爆发 5/30,北京市政府发布《北京市加快建设具有全球影响⼒的⼈⼯智能创新策源地实施⽅案(2023-2025年)》、《北京市促进通⽤⼈⼯智能创新发展的若⼲措施》。 国产⼈⼯智能芯⽚和深度学习框架等基础软硬件产品市场占⽐显著提升,算⼒芯⽚等基本实现⾃主可控。国产硬件⽐例显著提⾼,全⾯兼容国产深度学习框架。⼈⼯智能算⼒资源并⽹互联,推动基础软硬件实现⾼质量⾃主可控。AI核⼼产业规模达到3000亿元,持续保持10%以上增⻓,辐射产业规模超过1万亿元。 5/31,深圳正式印发《深圳市加快推动⼈⼯智能⾼质量发展⾼⽔平应⽤⾏动⽅案(2023-2024年)》组建深圳市AI教育联盟和AI讲师团,⽀持⾼校、企业围绕通⽤⼤模型等领域开展⼈才联合培养。形成规模1000亿元的⼈⼯智能基⾦群,⿎励⼤模型企业联合⽣态伙伴加强⼤模型插件及相关软硬件研发;⿎励企业研发基于国际主流⼤模型的创新产品。 6/5,成都市公布《成都市关于进⼀步促进⼈⼯智能产业⾼质量发展的若⼲政策措施(征求意⻅稿)》 ⽀持企业、科研机构开展核⼼算法与专业算法研发,布局⼤规模语义模型、⾏业模型等,对取得国家科技重⼤专项(含科技创新2030-重⼤项⽬)、国家重点研发计划⽴项项⽬成果或国家科学技术奖获奖成果在蓉落地转化的,给予最⾼1000万元经费⽀持。 6/14,⽆锡发布全《⽆锡市⼈⼯智能产业创新发展三年⾏动计划(2023-2025)》 到2025年,⼈⼯智能核⼼产业规模达到400亿元,带动相关产业规模4000亿元。以⾃动驾驶、智能制造、⽣成式⼈⼯智能为主攻⽅向,加快⼈⼯智能关键技术转化应⽤,⽬标是累计认定50个省级以上⼈⼯智能融合创新产品应⽤解决⽅案,打造100个可复制、可推⼴的典型示范应⽤场景。 7/12,福建省⼈⺠政府办公厅印发《福建省新型基础设施建设三年⾏动计划(2023—2025年)》 强化建设⼈⼯智能平台。强化智能芯⽚、基础软件、深度学习、AI模型、智能算法等⼈⼯智能关键环节攻关。围绕制造、农业、交通运输、教育医疗等领域,打造AI深度融合场景。⽀持福州创建国家⼈⼯智能创新应⽤先导区。实施智慧教育⼯程,到2025年,建设10个省级“智慧教育试点区”、100所省级“智慧校园试点校”。 7/24,重庆市印发《重庆市以场景驱动⼈⼯智能产业⾼质量发展⾏动计划(2023—2025年)》 培育10家亿级以上⼈⼯智能⻰头企业,集聚100家⼈⼯智能规模以上企业、建成3—5个⼈⼯智能产业集聚区。⿎励科研机构、⻰头企业积极争取参与⼤模型旗舰项⽬,围绕AI⼤模型、AI开发框架及⼯具体系等⽅向,建设⼈⼯智能开源社区。 8/13,宁夏回族⾃治区⼈⺠政府办公厅印发《促进⼈⼯智能创新发展政策措施》 推动以国产化CPU、GPU等硬件,算⼒平台和⼤模型的⾃主研发,对于参数量超过百亿、典型应⽤场景超过5个的⼤模型,根据相关政策给予不超过项⽬总研发投⼊30%、最⾼1000万元资⾦⽀持。 教育⾏业⼤模型,助⼒教学、科研和管理服务⽣产效能和体验升级 教育⾏业⼤模型:依托知识引擎平台对外提供 •知识引擎产品定义2.0:•知识引擎和教育⾏业⼤模型: 场景⼀:AI 英语⼝语助教 •• 场景⼆:⼤模型助⼒教师备课 场景三:校园⾏政问答助⼿ 场景四:科研⽂献助⼿ 高校/高职院校 高校科研院所 场景五:招⽣咨询助⼿ 高校招生办 高校信息化中心 场景六:⼤模型+医学科研探索 打造“业内领先”的医学⼤模型 以业务流程为驱动的信息化→以知识、模型、算法为驱动的诊疗新范式 场景七-智能图像创作-智能⽂⽣图&智能图⽣图 ••••• ••••• 智能图⽣图 智能⽂⽣图 教育⾏业⼤模型核⼼能⼒ 核⼼能⼒⼀:英语⼝语陪练 核⼼能⼒⼀:英语⼝语陪练 核⼼能⼒⼆:教案⽣成-能⼒展⽰ 核⼼能⼒⼆:教案⽣成-功能列表 核⼼能⼒三:⾏政知识问答 核⼼能⼒三:⾏政知识问答 知识管理 应⽤配置 核⼼能⼒三:⾏政知识问答 从通⽤模型, 到聚焦业务细分场景理解的⾏业⼤模型 ⾏业⼤模型的特点 •• 模型优势:腾讯云教育⾏业⼤语⾔模型研发流程 模型优势:腾讯云教育⾏业领域数据沉淀 教育⾏业⼤模型从模型的预训练、精调和强化学习阶段加⼊了教育⾏业的数据,从基础知识到领域知识全⽅位优化提升模型在教育领域任务表现,数据范围覆盖以下内容 •⽆监督数据:教育领域的海量的⽂本内容 ••• •有监督精调:教育⾏业领域数据 ••• 模型优势:从数据构建到模型训练全周期 细粒度、体系化的数据构建流程 ⾼效的增量预训练策略 SFT+DPO有监督训练 RAG能⼒优势:基于LLM+RAG框架,做深做透全链路能⼒ • 模型阅读理解&答案⽣成 知识检索 • • 安全性优势:三重安全防护,保障⾏业⼤模型可信、可靠、可⽤ ⾏业⼤模型资质 信通院⼤模型标准核⼼编写单位 某出版集团共建中⼩学智慧教育平台 项⽬概述 建设内容 企服场景,结合企业知识库⾃动⽣成专业答案辅助坐席 项⽬背景 产品⽰例及效果 1⼀线客服⼯单效能低,⾃助闭环率有待提升 -理解客户问题的知识专业性要求高-传统“文档搜索”耗时长,理解成本高 长文档自动学习总结,生成答案 产研团队知识运营成本⾼、更新慢 -需要通过人工沉淀faq,产研不清楚一线缺少哪些知识,需要扩充哪类知识-知识覆盖的更新效率慢 优秀话术采纳率提升采纳率(30%) 复杂问题准确率提升25% 文档实时更新、基于反馈机制自主学习进化 某品牌车企,⼤模型助⼒⽤车更轻松 产品⽰例 需要跟传统机器⼈结合⼤模型增强,传统机器⼈⽆法回答时,⼤模型对汽车专业词汇精准理解回复 问答准确率:35%->84% 难点:⽂档庞⼤,图⽂混排复杂 •答案出图率提升:模型出图率0%->70%。(gpt-4出图率20%)••客户反馈:6⽉客户担⼼幻觉及答案出图率低;9、10⽉持续打磨⾄端到端准确率84%;11⽉客户体验满意并已正式下单。 •材料数量庞⼤:有近50款车型,每款车涉及「使⽤说明书」「驾驶指南」「保养⼿册」,合计⼏百份材料。•⼿册混排复杂:每份⼿册⼀百页⾄⼏百页,涉及⼤量图⽂组合。•C端问答要求严谨:客户也担⼼幻觉率影响客服对话体验。 阅⽂集团的⽂⽣⽂/⽂⽣图⼤模型精调 感谢聆听