AI智能总结
陈树荣腾讯云智能商业化 2025.03 大模型产业生态图 大模型产业链上的生态,根据大模型生态上不同企业的定位,分成了四个等级的企业: DeepSeek推动国产模型达到新的高度 DeepSeek是“深度求索”开发的一系列人工智能模型。DeepSeek通过持续的技术创新和市场拓展,在自然语言处理和大型语言模型方面取得了显著进展,在国际市场上获得了广泛认可。其中: ●DeepSeek-V3是在14.8万亿高质量token上完成预训练的一个强大的混合专家(MoE)语言模型,拥有6710亿参数(激活参数370亿)。作为通用大语言模型,其在在知识类任务(知识问答、内容生成等)领域表现出色。 ●DeepSeek-R1是基于DeepSeek-V3-Base训练生成的强化推理能力模型,在数学、代码生成和逻辑推断等复杂推理任务上表现优异。 更高效资源利用使用~2,000 GPUs,竞品使用10,000+ GPUs 开源模型比肩头部闭源60%+指标优于Llama3.1Claude-3.5 GPT-4o 更低的研发成本*$5.6M vs. OpenAI’s$100M+ 打破大模型技术壁垒重挫美国科技公司股价,英伟达市值下跌5900亿 人工智能的Sputnik时刻 被美国及其盟友列入各种限制 大模型时代企业AI项目“烟囱式”建设痛点越发严重 智能化趋势下:多品牌多场景下的重复造车轮,导致模型算法和镜像等AI资产管理分散,无法沉淀复用和统一运用。 •模型+训练平台+应用构建平台全链路能力。 •提供从训练——推理——应用的一站式丝滑服务体验 •全面接入deepseek模型 腾讯云TI平台 大模型模型训练和推理开发平台,灵活精调和部署私有DeepSeek 腾讯云TI平台产品核心能力 面向实战的一站式大模型精调部署解决方案 DeepSeek部署方案 DeepSeek全系大语言模型支持服务部署 DeepSeek精调方案 DeepSeek全系大语言模型支持SFT 核心收益 注重灵活性、扩展性的生产级大模型精调工具链 DeepSeek全系列 满血版模型一键精调 •全流程训推工具链,注重实战灵活性、扩展性•内置Angel加速能力,切实提升训推效率•训练过程白盒化、资源碎片监控、训练资源调度灵活可配,切实提升资源利用率 •256卡H20•全参SFT•8小时 DeepSeek蒸馏方案 TI平台的DeepSeek实践 腾讯云大模型知识引擎 基于大模型应用开发平台,助力客户加速大模型应用落地 腾讯云全栈AI服务上线DeepSeek模型 通过DeepSeek API和应用开发平台多级能力,满足用户各类需求 (零代码) (满血版) 知识引擎应用开发平台:面向初级开发者&企业运营 API服务:面向资深开发者&企业开发者 腾讯云DeepSeek API服务调用——安全、高可用 •面向具有一定开发能力的企业/资深开发者,期望通过多款原子能力组建专属服务。 •可结合文档解析、拆分、embedding、多轮改写等服务进行组装,定制企业专属AI业务。 •API服务更稳定、安全、易用;满足大批量使用,可以弹性扩容满足客户需求;支持购买专属并发; •限时免费试用(2025年2月25日23:59:59前); •兼容openai的API接口协议,可快速调用体验。 腾讯云大模型应用开发平台“知识引擎”——免部署,分钟级搭建应用 •面向具备简单开发能力的初级开发者、企业运营人员。•可通过模型选择、提示词模版、RAG配置能力等加速大模型应用构建,实现与自身业务系统的无缝对接。 •国内率先支持「DeepSeek满血版+私域知识管理+实时搜索」于一体•分钟级搭建大模型应用•集成私域知识库,让AI更专业,支持复杂图文混排文档解析 接入搜狗搜索增强API,一键开关,即可让DeepSeek实时获取互联网最新资讯,提升时效性和回答准确度 腾讯云大模型知识引擎:基于大模型的应用开发平台 聚焦严谨场景,打造大语言模型应用开发平台,提供LLM+RAG、工作流、Agent多种应用开发方式,来助力企业及开发者,加速大模型应用落地。 腾讯云大模型知识引擎:三大应用模式,满足客户多样需求 要稳定选标准模式,要定制选工作流,要尝鲜选Agent! 把企业五花八门的知识库喂给大模型,没那么简单! 难点:企业知识格式多样、图文并茂 传统OCR技术局限:识别精度低、元素易丢失 大模型知识引擎:强大RAG能力加持,搭建精准的知识问答应用 复杂文档解析、切分、检索、推理、生成准确率保持领先 高准确的综合检索能力 高准确的复杂文档解析、切分能力基于OCR大模型,打造的解析引擎,突破图文混排版面分析、复杂表格识别等文档解析技术瓶颈,支持超过20类文档类型。 上线基于LLM的embedding模型,多文档信息召回率从85%提升到92%;混合检索+Text2SQL能力,提升超大表格单表检索及跨表检索准确率,SQL执行准确率80%+ Ø业界首个支持200MB以上超大文档vs.业内普遍100MB内Ø丰富的文档类型,超过26类vs.业内普遍10类以内Ø支持图文混排(多列排版)版面分析、图文表/公式/页眉等元素识别 Query“非智能且在售,并且一级分类是天棚灯的产品包含哪些” 通过SQL检索表格信息 腾讯云RAG+DeepSeek:充分考虑文、图两种模态的检索优化、能力打磨 腾讯云RAG+DeepSeek:图文并貌的产品操作说明 说明书样例 “制动系统怎么保养?” 适合处理过程复杂且分支较多、对结果准确性要求高的业务场景 大模型知识引擎“工作流”:支持用户快速编排复杂应用 面向复杂业务流程场景,升级复杂应用构建能力 提供10+画布节点,编排复杂应用,复杂流程的执行准确率和对话完成率效果领先。 Ø通过可视化拖拉拽的方式编排不同的原子能力,零代码/低代码构建业务流程。 Ø其中参数提取节点,支持多参数同时提取、基于对话历史进行多轮反问澄清等优势能力,对话效果更优势。 Ø大模型相关的节点均接入DeepSeek R1和V3模型,可支持自由选择和切换。 大模型知识引擎“Agent模式”:自主规划和工具调用 由大模型自主拆解任务和规划路径,模型主动选择和调用工具,并能够主动纠错和反思,回复效果更灵活。 创造价值,赢在一起!