您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[至顶科技&至顶AI实验室&至顶智库]:DeepSeek完全实用手册V1.5-技术原理·使用技巧·部署进展 - 发现报告

DeepSeek完全实用手册V1.5-技术原理·使用技巧·部署进展

AI智能总结
查看更多
DeepSeek完全实用手册V1.5-技术原理·使用技巧·部署进展

—技术原理·使用技巧·部署进展— 2025年4月 组织机构/课题组 出品机构:至顶科技执行机构:至顶AI实验室 至顶智库团队成员:孙硕 邓震东 高书葆 路飞 刘文轩 张建课题顾问:高飞媒体支持:至顶网 科技行者Solidot 前言 䔲⵸DeepSeek垷㘗䊺㖈䧮㕂㢴⚡곭㚖㹊梡鿈縭䧭⚹䲿⼮佟䏎剪⸉佪腊ծ⠏⻊⟱⚌絑蠒盗椚ծ㟞䔂絊畮❡ㅷ⸆腊涸ꅾ銳䊨Ⱘկ㖑倰佟䏎㽻꬗DeepSeek涸鿈縭儑衼䲿⼮✫佟⸉剪⸉佪桧⠏⻊✫㙹䋑屛椚⡤禹⸔⸂佟䏎剪⸉➢侨㶶⻊ぢ兰腊⻊駟鴲♶倗䲿⼮ⰖⰟ剪⸉餘ꆀկ㕂㣛⟱㽻꬗䧮㕂侨⼧㹻㣛⟱ㄤ㕂⟱䱹ⰆDeepSeek垷㘗嶍⿺腊彂ծ鸑⥌ծꆄ輑ծ㛇炄霃倶瘝㢴⚡곭㚖剣ⵄ✵⟱⚌㹊梡兰腊⻊鲮㘗䲀⸓❡⚌涸넞餘ꆀ〄㾝կ兰腊絊畮㽻꬗DeepSeek垷㘗⚹湱Ⱒ❡ㅷ䲿⣘䔂㣐涸兰腊㢅椚腊⸂忘駈欽䨪㼆兰腊⸅Ⱆծㅷ餘欰崞涸꨽宠կ 1.5晜劥䫣デ㟞⸈䚪絕✫DeepSeek垷㘗㖈㖑倰佟䏎ծ㕂㣛⟱⿺兰腊絊畮倰꬗涸鿈縭䞔ⲃ䱲雭Ⱖ䎾欽䧭佪ㄤ劢勻〄㾝馋⸷⚹爢⠔Ⱆ⠍刿㥩✫鍒DeepSeek涸〄㾝鵳玐䲿⣘⿬罌կ 三、DeepSeek是谁四、DeepSeek技术路线解析五、DeepSeek调⽤与部署六、 如何使⽤DeepSeek七、趋势判断⼆、DeepSeek部署进展⼀、DeepSeek V3更新 ⽬录 一、DeepSeek V3模型更新 简介 2025年3⽉24⽇,DeepSeek-V3-0324模型开源发布,与之前的DeepSeek-V3使⽤同样的base模型,仅改进了后训练⽅法。模型参数约660B,开源版本上下文长度为128K(网页端、App和API提供64K上下文)。私有化部署时只需要更新checkpoint和tokenizer_config.json(tool calls相关变动)。 DeepSeek V3本次更新主要体现于:推理能⼒提升、前端开发能⼒增强、中⽂写作升级、中⽂搜索能⼒优化。新版V3在⼯具调⽤、⻆⾊扮演、问答闲聊等方面,也得到了一定幅度的能力提升。 •推理能力:新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。•前端开发:在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。•中文写作:在中文写作任务方面,新版V3模型基于R1的写作水平进行了进一步优化,同时特别提升了中长篇文本创作的内容质量。•中文搜索:新版V3模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。 一、DeepSeek V3模型更新 推理任务表现提高 倝晜V3垷㘗0324湱鳅✵♳⚡晜劥•MMLU-Pro䖤ⴔ䲿⼮5.3荛81.2 •GPQA䖤ⴔ䲿⼮19.3荛68.4•MATH䖤ⴔ䲿⼮3.8荛94.0•AIME䖤ⴔ䲿⼮19.8荛59.4•LiveCodeBench䖤ⴔ䲿⼮10.0荛49.2 倝晜V3垷㘗♸Qwen-MaxծGPT-4.5ծClaude-Sonnet-3.7湱嫱 •㖈MATH-500ծAIME2024ծLiveCodeBench崵霉务蜦䖤剒넞ⴔ•㖈MMLU-ProծGPQADiamond崵霉务蜦䖤痦✳ 一、DeepSeek系列模型发布时间线 ♧ծ DeepSeek V3刿倝 ⼆、DeepSeek部署进展 三、DeepSeek是谁四、DeepSeek技术路线解析五、DeepSeek调⽤与部署六、 如何使⽤DeepSeek七、趋势判断 ⽬录 DeepSeek模型部署进展 DeepSeek模型在我国地方政府、央企、四大直辖市国企以及智能终端的部署情况。 1.DeepSeek模型 地方政府部署进展 荛곝兰䎽絕ざぐ㖑佟䏎㸽緸瘝勉㪭庈麤絡雦䧮㕂⚎鿈ծ务鿈ծ銯鿈⟄⿺⚎⻌㖑⼓涸72⚡溁紩䧴䋑紩佟䏎鿈꡶Ⰼ꬗鿈縭DeepSeek垷㘗կⰨ⡤㥵♴ •⚎鿈㖑⼓Ⱏ剣39⚡溁紩䧴䋑紩佟䏎鿈꡶模䧭鿈縭•銯鿈㖑⼓Ⱏ剣14⚡溁紩䧴䋑紩佟䏎鿈꡶模䧭鿈縭•务鿈㖑⼓Ⱏ剣11⚡溁紩䧴䋑紩佟䏎鿈꡶模䧭鿈縭•⚎⻌㖑⼓Ⱏ剣8⚡溁紩䧴䋑紩佟䏎鿈꡶模䧭鿈縭կ 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 1.DeepSeek模型 地方政府部署进展 DeepSeek模型在地方政府的部署主要集中在智能问答、公文起草、政务服务、知识库、政策咨询、智能客服、12345热线等方面。 2.DeepSeek模型 央企部署进展 至顶智库结合国务院国资委以及相关央企网站、公众号等渠道统计。 •全国98家央企中已有60家(集团或下属公司层面)完成DeepSeek模型部署,部署比例超过60%。•DeepSeek模型在央企的应用场景涵盖办公、能源、制造、通信、航运等多领域。 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 2.DeepSeek模型 央企部署进展 DeepSeek模型在央企的部署主要集中在智能问答、知识库、场景应用、智能决策、数据挖掘、智慧运维等方面。 3.DeepSeek模型 地方国企部署进展 至顶智库结合地方国资委以及相关国企网站、公众号等渠道统计,我国四大直辖市国企(北京、上海、天津、重庆) 40+企业已全面部署DeepSeek模型。 •北京18家国企完成DeepSeek模型部署;•上海10家国企完成DeepSeek模型部署;•重庆10家国企完成DeepSeek模型部署;•天津9家国企完成DeepSeek模型部署;•DeepSeek模型在四大直辖市国企中的应用涵盖生产制造、金融创新、智能汽车、交通运营、水务管理等多个领域。 3.DeepSeek模型 地方国企部署进展 北京国企部署进展 3.DeepSeek模型 地方国企部署进展 3.DeepSeek模型 地方国企部署进展 北京国企部署进展 3.DeepSeek模型 地方国企部署进展 北京国企部署进展 3.DeepSeek模型 地方国企部署进展 北京国企部署进展 3.DeepSeek模型 地方国企部署进展 北京国企部署进展 3.DeepSeek模型 地方国企部署进展 上海国企部署进展 3.DeepSeek模型 地方国企部署进展 上海国企部署进展 3.DeepSeek模型 地方国企部署进展 上海国企部署进展 3.DeepSeek模型 地方国企部署进展 上海国企部署进展 3.DeepSeek模型 地方国企部署进展 3.DeepSeek模型 地方国企部署进展 天津国企部署进展 3.DeepSeek模型 地方国企部署进展 天津国企部署进展 3.DeepSeek模型 地方国企部署进展 重庆国企部署进展 3.DeepSeek模型 地方国企部署进展 重庆国企部署进展 3.DeepSeek模型 地方国企部署进展 重庆国企部署进展 3.DeepSeek模型 地方国企部署进展 DeepSeek模型在地方国企的部署主要集中在智能问答、知识库、场景应用、智能助手、代码生成、智能决策等方面。 4.DeepSeek模型 智能终端部署进展 荛곝兰䎽絕ざ⚺崨兰腊絊畮ㅷ晥㸽緸ծⰖ⠍〿⟄⿺湱Ⱒ倝ꢉ㼆✵DeepSeek垷㘗㖈絊畮❡ㅷ涸䵨鲿䞔ⲃ鵳遤絡雦唙椚կ •䩛劼倰꬗⼶⚹ծ㼭碛ծ虽罆ծOPPOծvivo瘝ㅷ晥湱Ⱒ劼㘗䵨鲿DeepSeek垷㘗㹊梡兰腊꡼瘷ծ俒呩欰䧭瘝⸆腊•PC倰꬗翫䟝〄䋒䵨鲿DeepSeek垷㘗涸YOGA禹⴩疴雵劥ㄤ♧⡤劼㖈烁⥂侨䰘ꥧ猙㸝Ⰼ涸⵸䲿♴㹊梡ぐ碫䎾欽•㹻歏倰꬗嵳⥌ծ繠涸ծꟋ赙ծTCL瘝ㅷ晥䲀ⴀ涸兰腊歏錠ծ瑟靈瘝❡ㅷ⦶⸔垷㘗腊⸂㹊梡兰腊露갉㼆霢•导 鲨 倰 ꬗  嫱 ❇ 鶓 ծ ⚎ 굥 ծ 艗 ⸷ 瘝 ㅷ 晥 䲀 ⴀ 涸 湱 Ⱒ 鲨 㘗 䵨 鲿DeepSeek垷㘗㹊梡兰腊䏠菣⸆腊涸Ⰼ꬗⼮紩կ 4.DeepSeek模型 智能终端部署进展 4.DeepSeek模型 智能终端部署进展 4.DeepSeek模型 智能终端部署进展 4.DeepSeek模型 智能终端部署进展 4.DeepSeek模型 智能终端部署进展 4.DeepSeek模型 智能终端部署进展 4.DeepSeek模型 智能终端部署进展 4.DeepSeek模型 智能终端部署进展 4.DeepSeek模型 智能终端部署进展 DeepSeek模型在智能终端的部署主要集中在语音交互、智能问答、AI助手、智能座舱等方面。 ♧ծ DeepSeek V3刿倝 ⼆、DeepSeek部署进展 三、DeepSeek是谁 ⽬录 四、DeepSeek技术路线解析五、DeepSeek调⽤与部署六、 如何使⽤DeepSeek七、趋势判断 1.DeepSeek简介 公司简介 DeepSeek全称杭州深度求索人工智能基础技术研究有限公司,简称深度求索,成立于2023年7月,是幻方量化旗下的AI公司,专注于实现通用人工智能(AGI),具有深厚的软硬件协同设计底蕴。 模型简介 DeepSeek共研发开源十余款模型,目前最受关注的有V3对话模型和R1推理模型,分别于2024年12月26日和2025年1月20日先后发布。从反映关注度的微信指数上可以看出,两次模型发布都造成了后续DeepSeek关注度的飙升,12月28日DeepSeek指数达到约6000万,1月31日达9.8亿。 V3:是采用混合专家架构(MoE)的高性能对话模型,支持多任务处理并在代码生成、数学推理等场景表现优异。 R1:是基于强化学习训练的推理模型,专注于代码生成和复杂数学问题解决,推理能力通过蒸馏技术可迁移至小型模型。 1.通用模型&推理模