从技术突破到场景落地:
大模型发展图谱与DeepSeek创新应用
李煜政
中山大学软件工程学院
2025年03月
人工智能大模型发展现状
DeepSeek破圈后的大模型发展趋势
大模型重点应用场景
DeepSeek能力赋能个人发展
2024年3月5日,李强总理在十四届全国人大二次会议上作《政府工作
报告》,其中提出:开展“人工智能+”行动。
人工智能的定义
ArtificialIntelligence,缩写为AI
1955年,约翰·麦卡锡定义为:“制造智慧机器的科学与工程”。
1989年,罗杰·彭罗斯定义为:“通过机器(通常是电子设备)尽可能多地模仿人类智力活动,并可能在这些方面提高人类的能力”。
约翰·麦卡锡
(人工智能之父)
人工智能的分类
弱人工智能ArtificialNarrowIntelligence(ANI)
•擅长于单个方面的人工智能
强人工智能ArtificialGeneralIntelligence(AGI)
•人类级别的人工智能,在各方面都能和人类比肩
超人工智能ArtificialSuperintelligence(ASI):
•“在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能。”——牛津哲学家,知名人工智能思想家NickBostrom
Gartner十大科技趋势预测
2017:人工智能和先进机器学习(第1)
2018:人工智能基础(第1)
2019:自动化的一切(第1)
2020:人工智能安全(第10)
2021:人工智能工程化(第8)、超级自动化(第9)
2022:生成式AI(第12)
2023:自适应AI(第4)
2024:全民化的生成式AI(第1)、AI信任、风险、安全管理(第2)
2025:代理型AI(第1)、AI治理平台(第2) 7000 6000 5000 4000
AI技术积累
推荐系统
决策
决策式AI大规模应用
电商:广告、商品
等推荐
娱乐:新闻、视频、音乐、游戏等推荐
人脸识别:FaceID
身份认证
生成式AI部分应用趋于成熟
生内容科研
成建筑
式航天
AI医疗
式
AI 3000 2000 1000 0
图像识别
内容审核
…
…
材料
自动驾驶能源
文本分类、情感分析、规则引擎等
2015及以前
决策式AI 20162017201820192020 20212022
生成式AI爆发 2023
E 2024
E 2030
E
LLM的原理:大参数函数
GPT4包含18000亿个参数(传言)人脑约有1000亿个神经元
人工智能相比人类的优点
速度:计算(机器2GHzvs人脑200Hz)、信息传播(光速vs人脑120m/s)
容量:机器具有更大的储存空间
可靠性和持久性:晶体管比神经元更加精确可靠
可编辑性、升级性:软件更容易升级、修正、测试
集体能力:机器>人类>其他物种
人工智能的发展需要受到规范
IQ:100
IQ:70
IQ<50
IQ<5
ChatGPT平均智商83、言语智商155
人工智能的发展需要受到规范
无法理解+影响巨大=生存危机?
四次工业革命
第三次工业革命信息化和数字化
第四次工业革命
???
第一次工业革命机械化
机械应用工厂出现工人阶级
第二次工业革命电气化和自动化
电器应用流水线出现专业管理层
信息技术
DeepSeek热潮
DeepSeek版本发布路径
23年11月:DeepSeekLLM
24年1月:DeepSeek-MoE
24年2月:DeepSeekMath
24年5月:DeepSeek-V2
24年11月20日:DeepSeek-R1-Lite-Preview
24年12月26日:DeepSeek-V3
25年01月15日:DeepSeekApp
25年01月20日:DeepSeek-R1
25年01月27日:DeepSeek暴击美股
AI工具软件的日活量、下载量
(紫线-ChatGPT、红线-DeepSeek)
国内AI软件的关注度
(微信指数)
DeepSeek版本发布路径
23年11月:DeepSeekLLM
24年1月:DeepSeek-MoE
24年2月:DeepSeekMath
24年5月:DeepSeek-V2
24年11月20日:DeepSeek-R1-Lite-Preview
24年12月26日:DeepSeek-V3
25年01月15日:DeepSeekApp
25年01月20日:DeepSeek-R1
25年01月27日:DeepSeek暴击美股
全球云服务厂商火速接入
1月31日,英伟达、亚马逊、微软云全部接入DeepSeek
2月1日~2月3日,国内云厂商陆续宣布接入DeepSeek
成为央国企数字化转型“新基建”
通信行业
三大运营商:移动、联通、电信,全面接入DeepSeek,应用于智能客服和云计算赋能
能源行业
电力:南方电网“大瓦特”;国家电网“光明电力大模型”;中国华电“华电睿思”
三桶油:中国石油昆仑大模型;中国石化长城大模型;中国海油海能人工智能模型
汽车行业
东风汽车、长安汽车、吉利、极氪:应用于智能语音交互、AI导航系统及自动驾驶辅助
金融行业
国有银行、十余家券商:完成本地部署,应用于信息检索、行业研究、合规问答等场景
延伸到智慧政务领域
北京市
丰台区、昌平区、海淀区:部署DeepSeek用于优化行政审批流程与数据分析
广东省
广州市:政务服务和数据管理局,部署DeepSeek-R1/V3模型,应用于民生政策解读、12345热线工单分派等场景
深圳市:基于政务云提供DeepSeek模型服务,覆盖龙岗区、福田区、大鹏新区等,实现政务应用一体化升级
佛山市:完成DeepSeek本地化部署,接入“粤治慧·佛山城市大脑”,支撑智能问答、公文写作等政务功能
珠海市:政务服务和数据管理局,在市电子政务外网上线DeepSeek-R1671B大模型
江苏省
南京、苏州、无锡、常州、盐城、连云港等地:接入DeepSeek用于优化营商环境、政策解读及智能客服
江西省
赣州市:作为省内首个部署DeepSeek的城市,应用于政务服务与城市治理
河北省
秦皇岛市:交通运输局引入DeepSeek推动智慧交通建设,数据和政务服务局上线智能审批助手
DeepSeek核心价值赏析
DeepSeek简介
DeepSeek-R1能力
推理模型是什么?
《Modelneedsmoretokenstothink》思维链(Chain-of-Thought,CoT)
案例:
“计算Starwberry里有几个r”
“计算Starwberry里有几个r?请一步步来,先拆解单词拼写,再计算每个字母是否是r,同时注意可能有连续出现的相同字母r”
思维链技术的局限性
对用户的专业技能要求高、使用门槛高
例如:
两个能量分别为E1和E2的量子态,其寿命分别为10^-9秒和10^-8秒。我们希望清晰区分这两个能级,以下哪个选项可能是它们的能量差值,使得二者能够被明确分辨?
请拆解为思维链…
推理模型
自动生成链式思考的过程
非推理模型
推理模型的适用场景
适用:
谜题、数学证明
复杂决策
开放式答案
需要显式的思考步骤
不适用:
简单问题
知识性问答
娱乐聊天
延迟要求高
长思维链的效果
2024年9月GPT-o1发布后,借助LongInternalCoT,在数学竞赛,编程竞赛,科学问答方面显著提升,甚至击败人类专家。
但是,OpenAI的闭源、甚至主动隐藏深度思考过程,有意地避免全球科研团队跟进技术
o1的逻辑能力提升显著向o1询问深度推理过程会收到警告
复现o1推理能力的探索过程
主流探索方向
PRM(过程监督奖励模型)
主流的研发方向没有跳出PRM模式
复现o1推理能力的探索过程
Kimi团队,从蛛丝马迹中,找到关键破局点
TrainLLMsthroughRLtosolveproblemswithexactrewards
Avoidstructuredapproachesastheyultimatelylimitmodelperformance;letthemodelexplorethinkingparadigmsonitsown
Thinkingincludessearchprocessesandallowsformistakes
DeepSeek模型的演化路径–阶段1
DeepSeek团队,提出DeepSeek-R1-Zero的纯强化学习方法(PureRL),以数学、物理、编程等有标准答案的题目进行训练
准确度激励:
问“1+1=?”答2,加一分;答1,零分
格式激励:
问“1+1=?”
答: