行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

DeepSeek+DeepResearch——让科研像聊天一样简单

2025-02-15 - 清华大学严宏志19905053625

DeepSeek+DeepResearch 让科研像聊天一样简单

一、能做什么？

DeepResearch 是一款AI学术工具，通过多agent协作，实现从数据采集到可视化的全流程自动化。其支持的模型包括：

Claude 3.5 sonnet：平衡性能，支持多模态，可解释性强。
DeepSeek R1：高效推理，轻量化设计，多任务支持。
Kimi 1.5：垂直领域优化，长文本处理，定制化能力。
Open AI o3 mini：小型化设计，快速响应，通用性强。

功能测试结果：

数据采集：DeepSeek R1和Open AI o3 mini在爬虫任务中表现较好，但o3 mini数据采集结果为空；Claude 3.5 sonnet暂不支持联网查询。
文件数据读取：DeepSeek R1和Claude 3.5 sonnet表现良好，但o3 mini不支持附件上传。
文本数据集成：DeepSeek R1在一般文本处理中表现较好，但受大样本或模型稳定性影响；Kimi 1.5在长文本处理中表现突出。
数据分析：DeepSeek R1和Open AI o3 mini表现优异，能够精准抓取数据核心指标并做统计，R1分析逻辑更严谨。
数据挖掘：Kimi 1.5表现最为出色，DeepSeek R1和Claude 3.5 sonnet数据关联挖掘程度较浅。
数据可视化：Open AI o3 mini能力突出，可直接生成多种类型可视化图表；DeepSeek R1和Kimi 1.5需要运行Python代码完成绘图。

二、要怎么做？

DeepResearch 提供多种指令，用于学术研究：

撰写文章标题：根据摘要生成5个英文标题并解释。
中-英、英-中互译：准确、学术性地翻译段落。
中文学术写作润色：改进文本的拼写、语法、清晰度等。
英文学术写作润色：改进文本的拼写、语法、清晰度等。
提升段落间逻辑和连贯性：优化文本逻辑，提高内容质量。
标点符号错误一键修改：确保文本标点符号正确无误。
改写降重：用原文改写段落，降低重复率。
解读文献配图：解读论文中的配图内容。
论文参考文献格式：检查参考文献格式问题。
高阶数据分析：制作多种可视化图表，反映数据集的各个方面。

三、效果如何？

DeepResearch 与其他AI工具对比：

元知AI综述工具：提供一键式自动化流程，适合快速高效的研究需求，支持多版本与模块化，增强版具备绘图功能，无数据检索，低重复率，无限双语数据导入，幻觉克服，高规范格式输出。
中科院PubScholar平台：免费开放使用，海量学术资源整合，无数据检索，较高格式规范输出，中文内容丰富。
知网研学平台：较高格式规范输出，中文内容丰富，无数据检索。
斯坦福STORM：资料整合与文章生成，模拟对话与问题生成，转化文献为连贯文章，多智能体协作对话。

DeepSeek 的优势：

推理能力：强化学习驱动，专项提升数学、代码、逻辑推理等能力，长思维链支持，多模态任务处理。
训练方法：冷启动数据，多阶段训练。
降本提能：架构创新，模型蒸馏技术。
策略优化：开源特性，成本优势。
测试评估：推理任务表现优异，知识类任务表现优异，其他任务表现优异。
本地部署：端侧部署能力，端云协同优化。
对比优势：高性价比，技术普惠。
革新技术标准：低本高能，开放共创。
重塑产业格局：打破桎梏，竞争活跃。
技术深化：突破局限，能力提升。
场景拓展：创新推动，垂直深耕。

Deep Research 的应用场景：

学术研究：自动化处理财务报表，挖掘隐藏的投资机会，评估潜在风险，优化资产配置策略。
金融分析：整合全球金融市场动态，实时追踪行业趋势，为投资者提供深度分析。
消费决策：分析商品数据，对比产品参数，整合用户反馈，提供定制建议，简化决策流程。
商业研究：提供深入的市场趋势、消费者行为洞察及竞争格局，为企业制定精准的商业策略提供支持。

Deep Research 技术架构：

基于OpenAI o3模型：支持多步骤策略实时调整与错误回溯。
性能表现：在“人类最后考试”中准确率26.6%（O1模型的三倍），5-30分钟完成传统数小时任务。
应用广度：覆盖学术、金融、消费、政策四大领域，案例已验证跨领域适配性。
用户体验：零门槛操作，用户仅需输入提示，系统自主规划研究流程。

AIGK+DeepResearch：定制化AI，自动化转型

行业知识库整合：汇聚行业专家经验、案例数据；构建领域知识图谱，为行业定制AI模型奠定基础。
行业定制化AI赋能：金融、法律、制造业等领域应用。
“AI参谋”赋能：7*24小时全天候服务，快速响应行业专业问询，自主开展深度行业研究。
端到端任务自动化：融合强化学习与推理技术，实现多步骤复杂任务的全流程自动化。
人机共生新范式：重塑企业运营效能，简化人机交互，AI系统自主完成规划、执行、优化。
重塑企业运营效能：通过技术创新、优化结构和提升效率，实现企业的可持续发展。

认知协作：异构智能，集群协作

三阶认知生成体系：异构智能体集群，包括数据勘探者、逻辑架构师、批判审查团。
引入优化agent：实现复杂任务的自动化，如智能法律顾问、企业 AI CEO、智能招聘。
增强知识图谱：多维解释，溯源路径，增强可解释性和可信度。

北京航空航天大学高研院助理教授清华大学新闻学院与人工智能学院双聘教授沈阳团队博士后何静 DeepResearch：软件免费公测通过百度网盘分享的文件：AI学术工具公测版.exe链接: https://pan.baidu.com/s/1kPrFGhpWuwB2eiGuP33Qjg?pwd=0417提取码: 0417 能做什么？本质：以多agent实现从数据采集到可视全流程通过编写爬虫代码、访问数据库、读取文件、调用API等方式，采集社交媒体数据、数据库内容、文本数据、接口数据等。通过数据清洗、数据集成、数据变换、特征工程等方式，实现数据纠错、数据整合、格式转换、特征提取等。对数据进行诊断、预测、关联、聚类分析，常用于问题定位、需求预测、推荐系统、异常检测等。对数据进行分类、社交网络分析或时序模式挖掘，常用于客户细分、信用评分、社交媒体营销、股价预测等。将数据转化为统计图、热力图、网络关系图、词云、树形图等，用于揭示数据中蕴含的模式、趋势、异常和洞见。模型特点 Open AIo3mini Kimik1.5 DeepSeekR1 Claude3.5sonnet 小型化设计：轻量级模型，适合资源有限的环境。快速响应：优化推理速度，适合实时交互场景。通用性强：适用于多种自然语言处理任务，如对话生成和文本理解。 高效推理：专注于低延迟和高吞吐量，适合实时应用。轻量化设计：模型结构优化，资源占用少，适合边缘设备和移动端。多任务支持：支持多种任务，如文本生成、分类和问答。 垂直领域优化：针对特定领域（如医疗、法律）进行优化，提供高精度结果。长文本处理：擅长处理长文本和复杂文档，适合专业场景。定制化能力：支持用户自定义训练和微调，适应特定需求。 平衡性能：在模型大小和性能之间取得平衡，适合中等规模任务。多模态支持：支持文本和图像处理，扩展应用场景。可解释性：注重模型输出的可解释性和透明性。爬虫数据采集提示词你需要完成以下两个任务： 1.阅读网页【网址】源代码【对应网页源代码】。提取所有包含“春运2025丨X月X日，全社会跨区域人员流动量完成X万人次”的网址进行去重、筛选，合并成网址列表2.撰写python脚本，基于步骤1输出的网址列表提取所有网址内容“截至目前2025年春运（2025年1月14日到2月8日）相关数据（如日期、全社会跨区域人员流动量、铁路客运量、公路人员流动量、水路客运量、民航客运量等）”完成数据提取并写入文件“2025春运数据.txt” 任务 1、阅读网页源代码，提取特定网页内容；2、撰写python脚本；3、提取并合并网址；4、提取网址内容；5、写入文件。 DeepSeek R1 Open AI o3mini 能够提取所有网址并进行筛选、去重，所撰写代码运行后完成数据爬虫任务，所获取数据准确，少量数据有所遗漏。响应速度快，能够高效提取所有需求链接，输出完整可运行python脚本，代码运行后生成文件，但数据采集结果为空。爬虫数据采集 Kimi k1.5 Claude 3.5sonnet 可以提取所有网址，调整后可输出正确代码，运行代码能生成本地文件，但提取数据结果为空。能够提取所有网址，代码运行后生成本地文件，但提取数据结果为空。结论 目前DeepSeek R1、Open AI o3mini、Kimi k1.5支持联网查询网址，Claude 3.5 sonnet暂不支持；四个模型均能根据上传的网页代码，对多个网址链接进行筛选、去重，完全提取出符合指令要求的所有网址链接并形成列表；在复杂爬虫任务上，DeepSeek R1与Open AI o3min生成的代码均能正常执行数据采集任务，o3响应速度更快，R1数据采集结果更加完整准确；其他2个模型都存在多次调试但代码仍然运行不成功的问题，如代码中罗列URL不全、输出文本中提取数据为空等。文件数据读取提示词任务所上传的“2025春运数据（1月14-2月8日）.txt”包含了从2025年1月14日至2025年2月8日每天各种交通方式的春运客运量信息，请从中读取每一天的信息，并整理成一张表格，要求包括以下几项信息：1.当天日期；2.当天的铁路客运量、比2024年同期多或者少的百分比、环比的百分比。3.当天的公路客运量、比2024年同期多或者少的百分比、环比的百分比。4.当天的民航客运量、比2024年同期多或者少的百分比、环比的百分比。 1、读取文件；2、根据指定内容整理成表格。 DeepSeek R1 Open AI o3mini 能够详细全面地提取文件中的数据，并整理成可视化数据表格，逻辑性强、指标清晰。暂不支持附件上传，响应速度快，能够快速读取粘贴数据，输出结果格式工整、简洁。测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响，仅供参考，无法作为决策制定、质量评估或产品验证的最终依据。文件数据读取 Kimik1.5 Claude3.5sonnet 能够快速读取文件数据，并整理成可视化数据表格，但填入数据有所缺失。很好地完成了数据读取及提取任务，没有漏数据指标，数据逻辑性很好结论 DeepSeekR1与Claude3.5sonnet均能很好的完成文件数据读取任务，生成的表格逻辑性强、数据指标清晰，Claude3.5sonnet一次性完成表格生成后支持直接复制和表格文件下载。OpenAIo3mini能够更加高效地完成数据提取任务，输出表格准确，但暂不支持附件上传，文件读取依靠粘贴稍显不便；Kimik1.5文件数据提取有明显空缺。文本数据集成提示词任务 1、分别阅读约7000token和15000token的文本内容，测试模型对中、长文本处理效果2、整理集成可视化的数据表格3、按照日期规范排序【所需阅读文本】请根据以上文本完成以下三个任务：1、阅读文本内容；2、整理集成可视化的数据表格；3、按照日期规范排序（直接分析并输出结果，不使用python） DeepSeek R1 Open AI o3mini 一般文本（7000token）：能详细全面地提取文本数据，并集成可视化表格，但受大样本或模型稳定性影响，输出表格末尾缺失，需要重复尝试生成。一般文本（7000token）：能够高效提取文本中的数据，并整理成可视化数据表格，格式工整、简洁，数据准确但数据维度有所缺失。长文本（15000token）：反应迅速，高效提取文本中数据，输出格式规范的数据表格，但集成数据维度仍然不够全面。长文本（15000token）：暂时无法给出答复。测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响，仅供参考，无法作为决策制定、质量评估或产品验证的最终依据。文本数据集成 Claude 3.5sonnet Kimi k1.5 一般文本（7000token）：能够准确提取文本数据，并整理成可视化图表，表格文字简洁，没有提及文本中的环比和同比数据。一般文本（7000token）：能够快速提取文本数据，并整理成可视化数据表格，数据准确，所提取数据维度不够全面。长文本（15000token）：长文本粘贴后会自动形成文件，能够准确集成文本数据表格，但数据维度有限。长文本（15000token）：同样能够高效准确地提取文本中数据，较一般长度文本所集成数据维度反而更加全面。结论 一般文本处理任务中，DeepSeek R1所提取的文本数据维度最为全面，但容易受文本长度或模型稳定性影响出现失误；其他三个模型在文本数据提取过程中，都存在对部分数据的忽略问题，没有完整集成到可视化表格中； 长文本处理任务中，Kimi k1.5相较短文本处理表现更加突出，提取准确的同时数据维度更加全面；由于文本过长DeepSeek R1无法完成任务；综合来看，Open AI o3mini响应最快效率最高，但在数据集成维度上稍显不足，同时与Claude 3.5 sonnet所输出的表格更为工整、简洁。数据分析提示词任务 1、读取titanic遇难者名单excel2、找出其中规律请读取所上传的titanic遇难者名单数据文件，并分析找出其中规律 DeepSeek R1 Open AI o3mini 详细展示长思维链，精准提取关键指标“幸存率”，分析多个因素特征对幸存率的影响，结合历史背景对数据及规律进行验证，并敏锐察觉数据异常，提出了异常处理建议。响应速度快，高效输出数据分析结果，分析各因素对关键指标生存率的影响，语言表达自然，重点突出结合历史背景对数据规律进行验证，但没有察觉数据异常。数据分析 Claude 3.5 Kimi k1.5 sonnet 能够精准分析关键指标生存率，但对特征提取不完整，仅能识别较为浅层的数据关联，分析能力相对较弱。提供数据分析程序代码，能够提取大部分特征并对其与生存率的关联进行分析，但最终没有形成明确的结论。结论 DeepSeek R1与Open AI o3mini的数据分析能力相当，且领先其他两个模型，均能够精准抓取数据核心指标并做统计，找到各特征与核心指标的关联，其中R1分析逻辑更加清晰严谨，而o3推理更加高效；Kimi k1.5推理逻辑清晰但分析能力相对较弱，Claude 3.5 sonnet能够提供分析思路但没有明确结论。数据挖掘任务 DeepSeek R1 1、读取即将上映的2025年电影数据集2、对数据集进行深入分析和数据挖掘能够准确对数据进行分类，从多个维度进行梳理和分析，借助可视化图表进行数据挖掘，基于分析结果提供可行建议，但整体数据挖掘深度较浅，缺少对不同类型数据直接关联性的探究。提示词第一轮对话：第二轮对话：（基于初步分析结果，选择其中一部分或某个方向进行深入的数据挖掘）数据挖掘 Kimi k1.5 Claude 3.5sonnet 基于数据集，在整体数据概括后提供多个深入数据挖掘方向，根据需求输入研究倾向，高效生成多个维度的数据分析，语言简洁，挖掘深度较浅。提供数据的潜在用途方向，深入分析过程中，从多个维度（如时间、语言、地区）深入挖掘数据意义和关联性，进一步总结趋势结论并提出相关建议。结论 Kimi k1.5该任务中表现最为出色，对特征进行精准分类，从多维度深入挖掘指定数据的深层内涵和关联性；DeepSeek R1与Claude 3.5 sonnet同样能准确完成数据的分类任务，但数据之间的关联挖掘程度相对较浅；Open AI o3mini受附件上传限制影响，由于数据集较大，暂不能完成该任务。测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响，仅供参考，无法作为决策制定、质量评估或产品验证的最终依据。数据可视化结论任务 Open AI o3mini的数据可视化能力突出，能够直接高效地生成多种类型可视化图表，准确度高；DeepSeek R1、Kimi k1.5均能基于分析结果提供多种可视化图表绘制方案，但都需要依靠运行Python代码才能完成绘图任务，部分代码会出现错误基于titanic遇难者数据分析结果绘制可视化图表 DeepSeek R1 Open AI o3mini Kimi k1.5 结合数据样本和分析结果，提供多种可视化图表绘制方案及对应代码，需采用Python代码完成绘图任务。大样本会省略数据；小样本不省略数据。能够结合数据样本和分析结果，提供多种可视化图表绘制方案，但暂时不能直接绘制出可视图表，需要将对应的绘图代码复制到本地运行制作图表。能够直接调用DALLE，根据分析结果和任务需求高效绘制各类可视化图表，部分较为复杂的图表可能出现数据错误或无法生成的情况。 Claud

点击免费查看完整报告

DeepSeek+DeepResearch——让科研像聊天一样简单