目录1DeepSeek基本概况................................................................................................................32.DeepSeek主要版本...............................................................................................................43.DeepSeek审计能力...............................................................................................................54.DeepSeek部署方法...............................................................................................................64.1官方渠道..........................................................................................................................64.1.1网页版使用..............................................................................................................64.1.2手机版使用..............................................................................................................84.2第三方渠道......................................................................................................................84.2.1硅基流动&华为云...................................................................................................84.2.2纳米AI搜索............................................................................................................94.2.3阿里云....................................................................................................................104.2.4百度智能云............................................................................................................114.2.5火山引擎................................................................................................................114.2.6其他平台................................................................................................................124.3本地部署........................................................................................................................124.3.1下载ollama............................................................................................................134.3.2合适版本安装.........................................................................................................134.3.3输入安装代码........................................................................................................154.3.4测试部署模型........................................................................................................174.3.5部署非量化模型....................................................................................................185.DeepSeek审计助手.............................................................................................................205.1基础操作场景...............................................................................................................205.2审计工作辅助...............................................................................................................215.3审计学习考试...............................................................................................................225.4其他提示.......................................................................................................................23 1.DeepSeek基本概况DeepSeek是由杭州深度求索人工智能基础技术研究有限公司(简称“深度求索”)开发的一系列人工智能模型。该模型拥有数以亿计甚至更多的参数,通过在海量文本数据上进行预训练,学习到丰富的语言结构和语义信息;并支持智能对话、准确翻译、创意写作、高效编程、智能解题和文件解读等多种功能。其“深度思考”和“联网搜索”功能能够更全面地理解用户问题并提供准确答案。杭州深度求索人工智能基础技术研究有限公司公司成立于2023年7月17日,专注于开发先进的大语言模型(LLM)和相关技术。自成立以来,公司在AI领域取得了显著成果,主要使用数据蒸馏技术,得到更为精炼、有用的数据。2024年1月5日,发布DeepSeekLLM(深度求索的第一个大模型),目前,DeepSeek-R1、V3、Coder等系列模型已上线国家超算互联网平台。英伟达称,DeepSeek-R1是最先进的大语言模型,亚马逊和微软也接入DeepSeek-R1模型。DeepSeek大模型在多个基准测试中表现优异,尤其是在代码和数学任务上,超越了其他开源模型,甚至与领先的闭源模型(如GPT-4和Claude-3.5-Sonnet)不相上下。DeepSeek被业界认为“以高性价比著称的AI模型服务商”,原因是这家公司的出现极大地降低了大模型训练和应用的成本,如该公司开发的DeepSeek-V3训练成本仅557.6万美元,而OpenAl训练GPT-4所花费的成本高达7800万美元甚至是1亿美元,双方的成本相差至少10倍。DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了GPT-4,可以说是性价比超高。此外,DeepSeek团队只有139名研发人员,而开发GPT的OpenAl团队则有1200名研究人员。在审计领域,DeepSeek大模型能够帮助审计人员高效处理各类多源异构的审计数据、识别风险、提升审计质量;通过自动化的数据处理、智能化的风险识别和定制化的报告生成等功能,帮助审计人员降低人工成本、提高审计质量和效率。 2.DeepSeek主要版本目前,DeepSeek的核心版本主要有DeepSeek-V3、DeepSeek-R1、JanusPro,表1中列出了这3个核心版本的特点和适用场景。模型版本发行时间模型大小DeepSeek-V32024-12-26671BDeepSeek-R12025-1-20671BDeepSeekJanusPro2025-1-287B这三个版本原始模型权重已经在huggingface上开源,用户可以免费下载。国 内 使 用 可 以 通 过 其 镜 像 (https://hf-mirror.com/) 获 取 。DeepSeek-V3和DeepSeek-R1的模型参数量较大,达到了671B,直接部署这两个模型需要1.3~2TB(FP16)的显存支持(如128卡H100的集群)。为方便一般用户本地使用,DeepSeek团队使用Qwen2.5和Llama3.3,以DeepSeek-R1为教师模型,蒸馏了6款小模型,包含1.5B~70B在内共有6个尺寸,如表2所示。表2DeepSeek-R1蒸馏的6个尺寸的模型蒸馏的模型DeepSeek-R1-Distill-Qwen-1.5BDeepSeek-R1-Distill-Qwen-7BDeepSeek-R1-Distill-Llama-8BDeepSeek-R1-Distill-Qwen-14BDeepSeek-R1-Distill-Qwen-32BDeepSeek-R1-Distill-Llama-70B即使经过了蒸馏,7B模型也需要20~25G的显存,即使是24G的4090显卡,部署也存在一定的风险。为此,在个人使用时,很多会将这类模型进行进一步量 表1DeepSeek核心版本与适用场景核心能力适用场景示例通用自然语言处理(NLP),支持长文本理解、多语言交互合同条款解析、政策法规匹配、审计报告生成复杂逻辑推理,强化数学与代码生成能力财务数据分析、异常检测、风险建模多模态(文本+图像+表格)理解与生成票据识别、图表数据关联分析、可视化报告基座模型下载地址Qwen2.5-Math-1.5BHuggingFaceQwen2.5-Math-7BHuggingFaceLlama-3.1-8BHuggingFaceQwen2.5-14BHuggingFaceQwen2.5-32BHuggingFaceLlama-3.3-70B-InstructHuggingFace 化,以缩减模型大小,ollama官方拉取的DeepSeek模型即是通过4bit量化后的