行业研究公司研究宏观策略财报招股书会议纪要 seedance2.0 低空经济 DeepSeek AIGC 大模型

多元模型企业级精调推理构建高质量AI基座

2025-06-18 腾讯 yuannauy

混元大模型持续演进，在认知空间理解、多模态交互和物理世界交互方面取得新突破。混元 TurboS 和混元 T1 模型分别升级，在推理效率和深度思考能力上显著提升。混元 T1 Vision 模型实现视觉深度理解和端到端语音通话，解锁全新交互体验。混元 Image V2.0 和混元 3D V2.5 模型分别实现毫秒级生图和可控超高清 3D 生成，并发布工业级游戏资产生成引擎。腾讯云 TI 平台全面升级，支持大模型精调推理，提供高效的数据准备、训练和部署工具链，助力企业高效开发和应用大模型。典型场景实践显示，精调后的模型在 AI 搜索、知识问答和交互式 Agent 方面效果显著提升。腾讯混元大模型全系持续开源，覆盖文本、视觉、语音和 3D 等多模态基础模型及配套插件模型。

多元模型企业级精调推理构建高质量AI基座程雪璨丨腾讯云智能解决方案专家腾讯混元向智能的深度和广度持续演进多模态模型物理世界理解和仿真新发布视觉理解新发布图像2.0 新发布 3D生成新发布语音端到端新发布游戏视觉预告 3D场景混元大语言模型理解认知空间新升级混元T1 深度思考模型混元TurboS快思考模型新升级深度探索智能的边界广度拓宽与物理世界的交互方式新升级创新混合MambaMoE架构：混元旗舰快思考模型TurboS ChatbotArena综合排名全球#8 理科能力全球Top10 理科推理提升超10% 代码能力提升24% 竞赛数学提升39% *相比前代版本 100 90 80 70 60 50 40 30 20 10 0 MMLU-proGPQA_diamond DROP LiveCodeBenchAIME2024 LiveBench ArenaHard Hunyuan-TurboS（首发版） Hunyuan-TurboS（最新版） GPT4o-0806 Claude-3.5-Sonnet 100 80 60 40 20 0 MMLUPRODROPF1AIME2024LiveCodeBenchC-SimpleQAT-EvalCEvalHunyuan-T1（首发版）Hunyuan-T1（最新版）GPT4.5o1 竞赛数学8%↑知识问答8%↑智能体能力13%↑ *相比前代版本奖励系统的全面升级扩充执行沙盒的覆盖多阶段效果好速度快擅长超长推理强化学习训练新升级持续快速迭代：混元自研深度思考模型T1 复杂指令跟随准确解码速度提升2倍文风简洁新发布混元视觉深度推理和端到端语音通话模型解锁全新交互体验视觉深度推理模型混元T1Vision 多模态深度思考原生长思维链视觉深度理解提升5.3% 响应时间更快速度提升50% 端到端语音通话模型混元Voice 端到端延迟1.6s 提速30%↑ 拟人性27%↑ 情绪应用25%↑ 出图速度快约15倍业界平均混元ImageV2.0 1024x1024分辨率生成时间(s) 全新技术架构 •超高压缩率编解码器 •对抗蒸馏加速新发布混元ImageV2.0：首个毫秒级商用级生图模型语音输入实时出图字符级响应生成混元3DV2.5 混元3D白模细节质量端到端评测指标大幅领先文生3D 15/17类目第一图生3D 17/17类目第一全新3D生成模型质感大幅提升混元3D-V2.0 混元3D-V2.5 3D建模空间体积 5600万 10亿几何白模面数 4万 50万纹理贴图分辨率 2k 4k 新发布混元3DV2.5实现可控、超高清生成能力 HuggingFace模型下载量超160万友商A模型友商B模型混元3D-2.5 新发布混元游戏模型：工业级游戏资产生成游戏资产生成系列模型 ✧游戏角色动态立绘 ✧实时交互游戏世界模型首个一站式AIGC 游戏内容生产引擎 ✧专业AI美术管线全系列模型开源 Hunyuan-DiT图像 Hunyuan-Large文本开源企业级混合推理模型 •面向AI工作站（7B-14B） •面向AI服务器（MoE80-A13B、32B）开源端侧混合推理模型面向端侧（0.5B-4B）等各种边缘计算场景 Hunyuan-Video视频 Hunyuan-3D 多模态基础模型（HunyuanImageVideo3D等)以及配套插件模型将持续开源腾讯混元大模型全系持续开源模型很强大，为什么还要精调过度推理场景指令遵循场景推理效率场景具备一定算法知识和开发能力的AI工程师以更高效率精调并部署可真正落地的大模型高效灵活的数据准备稳定可控的训练调度实用工具链方式齐全的模型评测易用可靠的的模型部署可灵活扩展的多模态数据标注可自定义的任务调度策略可即时发起的模型效果检验可自动弹缩的分布式部署 4大类场景全面支持3层机制保障减少中断 3阶段评测全面覆盖稳定支持高并发强大内核模型框架算力腾讯云TI平台TI-ONE：面向实战的大模型开发平台内置主流开源大模型混元+DeepSeek模型精调部署内置自研Angel推理加速框架业内第一梯队的大模型加速效果 X86+ARM异构算力纳管极致满足多厂商AI芯片管理和调度企业级训练工具精调训练–面向实战 全开源可扩展的数据构建pipeline 数据准备 自适应可配置的多模态标注 灵活可配的任务调度策略模型训练 故障主动恢复的长时任务保障 100+场景的精调配比数据 边训边测的3阶段模型效果评测 TI平台升级精调工具链，支持训推一体潮汐调度全面升级训练能力蒸馏精调强化学习自驾模型训练 BEVFormer 自驾模型训练教师模型学生模型强化学习 FastBEV 自驾模型训练原生支持强化学习快速启动自驾训练框架 Ray分布式计算框架支持训推一体潮汐调度训推潮汐调度灵活排队策略排队策略可配置，满足企业个性化调度需求严格先进先出灵活开启抢占资源最大化利用在线推理闲时算力用于离线训练服务弹性伸缩统一优先级配置某头部消费电子企业基于TI平台集约管理算力，研发大模型和传统CV模型，应用在电视产品文案生成、视频分析等场景 A研发提效 50%以上 覆盖大模型和传统CV场景充分使用精调工具链，无需配置繁琐开发环境资源利用率提升 80%以上 集约算力管理，高效任务调度充分运用GPU虚拟化技术和分布式计算能力 TI平台加速能力全面升级，推理加速效果领先某头部新能源汽车制造商基于TI平台统一纳管云上GPU资源，部署专属 DeepSeek模型，应用在知识问答等多领域 PD分离 DP+EP 并行化 DeepEP 计算与通信融合手段 Angel加速套件全面升级架构延展双引擎支持精度几乎无损前提下，提升吞吐能力部分能力已贡献至开源社区推理加速效果业界领先典型场景QPM行业领先在首Token延时<2s、吐字速率>=20Tokens/s前提下，QPM达到100+ 降低服务时延 MTPEP多专家并行解码并行 int4量化 Kernel 优化算子优化深挖内核 SGLangvLLM 支撑企业多业务场景知识问答营销座舱语音助手使用TI平台Angel加速后 DeepSeek推理性能显著提升资源成本显著降低场景实践1–AI搜索与角色扮演 AI搜索问题：AI搜索场景在表格检索、数据库检索效果不佳，答案准确率期望进一步提升方案：集成R1优化阅读理解能力，同时使用DeepSeekcoder训练Text2SQL模型效果： 提供中间思考过程，提升答案准确率5%以上，并且支持长上下文（128Ktokens）的多轮交互 表格检索和数据库检索的效果提升6%以上角色扮演问题：V3/R1原模型在角色扮演场景下存在括号文学单一、重复等问题，效果不佳方案：基于V3模型SFT精调角色扮演专属模型效果： 提升模型对角色指令遵循能力 借助V3拥有更全、更新的知识储备激发出更丰富的剧情、更准确的IP角色对话动态对话与剧情生成场景实践2–知识问答问题：V3/R1原模型有较强的先验知识，指令遵循弱，导致不按内部文档库回答，例如忽略业务场景过度推理、超出已知内容时根据模型自身知识回答等情况方案：结合指令遵循和阅读理解数据对V3/R1进行SFT/DPO训练效果：指令遵循增强回答安全可控，不做过度推理模型高效推理，推理过程简洁高效精调前精调后精调前精调后问题：V3/R1指令遵循能力较差，表现为“不听话” 方案一：仅利用R1长思维链，借助Instruct模型（如qwen2.5-72B-Instruct、LLaMA3.3-70B-Instruct等）给出最终答案效果：方案二：结合Agent关注的指令遵循能力数据集使用SFT、 DPO/GRPO微调R1或R1蒸馏版模型效果：场景实践3–交互式Agent 使用常规训练集（涵盖QA、数学、代码、写作、翻译等领域）进行训练得到具备指令遵循能力的baseline模型。在baseline基础上，使用数据飞轮技术针对性构建指令遵循训练集强化指令遵循能力，其微调效果已经得到了确认(+3.6%) 微调R1或R1蒸馏版模型预期有类似效果提升结合R1思维链后，Instruct模型可在现有REACT框架下无痛升级启动阶段启动阶段开源资源分散，准备周期长不知怎么基于R1蒸馏模型痛点 TI平台价值内置蒸馏方案，开箱即用内置全系模型，一键精调痛点解决技术问题，体验效果滞后免费体验，快速验证效果内置全系模型，一键部署开源框架繁多，不知怎么选 TI平台价值探索期痛点 TI平台价值探索期 TI平台价值痛点工具链易上手，快速验证效果验证效果链路长，耗时久蒸馏精调服务部署算力空闲情况多，ROI低统一资源纳管，灵活腾挪算力根据业务量探索资源用量统一资源纳管，灵活切换配置自主可控，快速验证并发用量机型差异大，选型难稳定期稳定期 TI平台×大模型痛点TI平台价值故障多，无法长时间稳定运行故障感知修复+监控，高可用规模扩大，人/物料管理难度高细致的资源级权限管控 TI平台×大模型痛点业务量变化，服务调整难度大一键多副本，快速线性扩缩容持续升级推理加速，降本增效 TI平台价值算力投入大，优化成本长期存在 Thanks

点击免费查看完整报告

你可能感兴趣

多元模型企业级精调推理构建高质量AI基座

你可能感兴趣

TI-ONE：多元模型企业级精调推理

3 亚马逊云科技-构建生成式 AI 时代的数据基座.pdf

DeepSeek专题研究：“低成本、高性能、强推理”三位一体，DeepSeek驱动高质量模型平价化

人工智能周报（24年第29周）：微软AI设计应用全平台上线，阿里云开源两款新语音基座模型

构建企业级生成式AI应用：从起步到实践指南