全链路⾃主研发,从零训练⾃主创新 腾讯混元⼤模型体系从稠密模型架构向稀疏化架构演进 Ø稠密模型矩阵提供不同尺寸的选项,覆盖不同场景,提供针对业务应用落地的最优性价比的推理解决方案Ø持续探索稀疏化模型架构,突破模型规模和性能天花板,寻求兼顾模型能力和资源利用效率的更佳方案 模型体系 包含全尺寸多个版本 腾讯混元通过采用混合专家模型(MoE)结构,已将模型扩展至万亿级参数规模,推动了性能提升和推理成本下降。在中文表现尤其是文本生成、数理逻辑和多轮对话上性能表现卓越,整体处于业界领先水平 模型覆盖多个领域 解决多领域任务 数学、编程、网络安全和搜索等,去适配各特定场景的需求,并结合垂直领域的数据,完成领域专属模型的落地 冷启动全链路自研究 数据、模型、策略和架构从训练数据、模型架构、训练策略,训练框架,软硬件体系等多个方面切入,提出了有特色的自研方案,从零开始训练 腾讯混元⼤模型特点 腾讯混元大模型目前提供3个版本:可根据不同业务需求按需选择。 hunyuan-standard hunyuan-lite hunyuan-pro 千亿级参数规模,支持32k与256K长文模型,256k具备超长上下文处理,单次处理字符数超过38万个。采用更优的路由策略,同时缓解了负载均衡和专家趋同的问题。长文方面,大海捞针指标达到99.99%。 当前混元模型中效果最优版本,万亿级参数规模32K长文模型。在各种benchmark上达到绝对领先的水平,复杂指令和推理,具备复杂数学能力,支持functioncall 是⼀个效果、推理性能和成本控制相对平衡的百亿级⼤模型,在中文NLP、英文NLP、代码、数学、权威榜单等多方面达到业界领先水平 模型介绍 文本创作、文本摘要、文本理解对话生成、知识问答 文本创作、长文摘要、长文理解对话生成、知识问答 复杂指令的文本创作、逻辑推理、数学计算智能NPC、专业领域应用场景 适⽤场景 暂不支持 暂不支持 支持 总长度不超过8000tokens 总长度不超过256000tokens 总长度不超过32000tokens 上下⽂长度 第三⽅评测腾讯混元⼤模型位于国内第⼀梯队 混元已接⼊600+腾讯内部业务实现技术与应⽤同⾏ ⼤模型能⼒⽂本、图像、视频⽣成 产品能⼒—⽂⽣图 能力介绍:根据输入的图片及辅助文本描述,智能生成与之相关的结果图,支持动漫、古风等多种风格的图片生成。 文本描述prompt 按照文本描述生成的图片 输出 支持动漫、水墨、油画、插图等20+种文生图风格生成 风格 主体在前,形容在后,规避长句,按照生成优先级输入关键词 使用建议 文生图大模型全面升级,通过文生图(高级版)API接入使用。 更便捷的操作体验 更多样的绘画风格 更便捷的操作体验 更高质量的图像创作 更强大的中文语义理解能力 支持prompt智能扩写功能,提供多样化的prompt模板参考和优化灵感,让生成图片的效果更精美、质量更稳定、细节更丰富,无需专业的图像处理技能和复杂的操作步骤,大大降低使用门槛。 准确理解中文文本,并根据描述中的关键词和语义信息生成与之相匹配的图像,这使得在描述复杂场景或者特定要求时也能得到令人满意的图像结果。 具备更通用、更专业图像理解与创作能力,支持人物、风景、动物、建筑、LOGO等多种类型的图像内容生成,可广泛应用于创意营销、广告设计、游戏开发、影视制作等多个领域,帮助快速生成创意图像素材或灵感,提高工作效率和创作质量。 采用更先进的深度学习技术,生成的图像具有高质量、高清晰度和高精美度的特点,画面内容在视觉上更具吸引力,满足各行业对高质量图像的需求。 既支持通过prompt高度自定义风格,也提供动漫、插画、水墨、写实等多样化的绘画风格选项供一键选择,也打造统一稳定的视觉效果。 API接入:https://cloud.tencent.com/document/product/1668/104583 智能内容创作 Ø腾讯混元大模型可以满足多种场景的文本生成需求,包括但不限于营销文案、生活休闲、文章生成等场景,企业/个人开发者用户可通过腾讯云API接入,提供hunyuan-pro、standard、lite3个版本,可根据不同业务需求按需选择。 智能助⼿ 智能客服—提高客服效率和用户满意度 工作助手—提升工作效率,为企业创造更大价值 会议纪要 问答系统 语义分析 文本摘要 情感分析 1.问答系统:腾讯混元大模型具有丰富的语义理解和计算能力,能够回答用户提出的各种问题,如售前咨询、售后支持、使用方法和疑难解答等。 1.文档处理:腾讯混元大模型提供各类文档进行编辑、排版、翻译等服务,快速撰写分析报告、实施方案、文本摘要等,提高工作效率。 2.会议纪要:腾讯混元大模型提供智能化的会议纪要服务,生成会议摘要、关键点、TODO项、议程等等,提高会议效率。 2.个性化推荐:腾讯混元大模型能够根据用户的历史行为和偏好,为其提供个性化的服务推荐。 3.方案策划:腾讯混元大模型能够根据用户的需求和目标,提供智能化的方案策划服务。为用户提供创意点子、解决业务问题、优化产品设计等。 3.语义分析:腾讯混元大模型能够对用户的问题进行深入的语义分析,理解用户的需求和意图,从而提供更准确的服务。 4.数据分析:腾讯混元大模型能够对各类数据进行处理和分析,如市场调研结果、实验数据等等,生成智能报告,提高数据的决策和指导作用。 4.情感分析:腾讯混元大模型能够对用户的语言进行情感分析,判断用户的态度和情绪,从而提供更人性化的服务。 ⾓⾊扮演 Ø基于腾讯混元大模型并进行简单的角色设定,具备强大的拟人化的对话能力、中文语境理解能力和复杂任务执行能力,可应用于智能数智人、游戏NPC、情感陪伴、专业服务、角色复刻等多个场景。 专业服务 角色复刻 情感陪伴 游戏NPC 智能数智人 通过设定特定任务和场景,设定游戏NPC,提升与玩家交互的随机性,优化玩家体验和沉浸感,提升用户粘性与活跃度。 扮演模拟面试官、教育专家、智囊团等角色,基于特定场景提供个性化专业建议,与用户进行深度、有思考的交流。 扮演与用户有链接的角色如AI女友、虚拟好友等,与用户产生深度情感链接,提供情感共情、情感支持、情感回应。 扮演某个知名人物、热门IP、历史人物等人物角色,学习人物的背景信息和语言特点,以此角色视角与用户交互。 打造品牌IP虚拟人,提升品牌形象,助力虚拟人更好地与用户沟通和互动。 直播带货场景实现不间断直播,与观众进行更自然的交流与问答互动。 法律 Ø智能法律顾问:回答法律问题,提供法律建议,如解释法律条款、法律基础知识等。Ø法律文书生成:协助用户生成法律文书或基本框架,如起诉状、答辩状、合同等。Ø法律案例分析:根据案例信息进行分析和推理,提供类似案例的判决结果和法律依据。 金融 Ø智能投研:通过数据收集和处理、基本面分析、估值分析等,进行智能投资策略推荐。Ø金融产品推荐:根据理财需求和风险承受能力,推荐合适的产品如股票、基金、保险等。Ø其他金融分析:包括但不限于财务分析、市场分析、风险管理、咨询报告生成。 医疗 Ø智能诊疗:根据患者症状和医疗信息,进行疾病诊断,提供可能的疾病列表和诊断建议。Ø健康管理:提供健康管理和生活方式建议,如饮食、运动、睡眠等,帮助用户维持健康。Ø普惠医疗:集成于医疗软件,提供基础医疗知识普及和信息查询。 代码 Ø代码生成/补全:根据用户需求生成或补全代码,提升代码效率。Ø代码错误检测:模型可以检测代码中的错误和潜在问题,提供修改建议。Ø代码重构:模型可以帮助用户重构代码,优化代码结构和性能。 应⽤案例混元助⼒多产品AI应⽤ 腾讯会议AI小助手 国内首个全面上线会议小助手功能,助力腾讯会议商业化 AI大纲 微信读书 大模型长文能力落地的典型场景,混元长文练兵场。 QQ智能体 通过混元精调上线30+智能体 应⽤案例混元助⼒多产品AI应⽤ 全品类文档生成:「一句话」即可生成Word/Excel/PPT/思维导图/收集表等多品类,满足不同场景使用诉求跨品类信息处理:在数据收集/处理/呈现环节,随心切换文档形态,可数据同步更新打破隔离。「帮我基于当前思维导图生成一份PPT」 助力搜狗输入法提供AI帮写等多种玩法能力 多模态⽣⽂ Ø核心支持输入【图/视频+文】,输出文本的能力Ø可以解决图/视频+文联合理解、推理的问题 ØVisual Encoder:提取单图、多图视觉表征ØAdapter:将视觉表征token与语言token对齐ØLLM:具有世界知识的大语言模型 多模态⽣⽂应⽤场景 内容创作 基础理解 请给图片写一句广告词 这是什么商品 这件格子外套,既是一件保暖的夹克,又是一件时尚的衬衫。它由蓝色、棕色和白色制成,拥有格子图案和连帽设计。它的剪裁流畅而舒适,适合各种场合穿着。在白色的背景上,这件外套显得格外醒目,让人不禁想要拥有它。 科技双生,高效办公!笔记本电脑与手机的完美搭配,让工作一触即达! 分析推理 知识问答 这种情况下我可以步行吗? 简单介绍这部电影 在这种情况下,人行横道信号显示行人过街信号为绿色时,可以安全过街。根据信号灯,行人可以继续前进,继续进行日常活动或前往下一个目的地。重要的是要注意,即使此时绿灯亮着,在人行横道上行走也必须保持谨慎,因为行人和机动车驾驶员都必须遵守交通规则。 电影《交换人生》由苏伦导演,雷佳音、张小斐等出演,讲述了平凡人张小斐的一场意外之旅,与令人惊喜的“交换人生”故事,欢笑不停,情感真挚。这部电影温暖励志,适合和家人朋友一起观看哦! 视觉数学推理 图表分析 回答图片中数学几何问题 图中那几个比重超过10%? 图中有3个超过10%,分别为动作角色扮演类,战术竞技类,回合制角色类。 求边的长度和角度。蓝色箭头指向的边是8.94.绿色箭头指向的角度是26.57° 多模态⽣⽂应⽤场景 Ø看图写对联功能:产品服务24年春节活动推广 视频⽣成-应⽤场景 专业视频制作 趣味营销 社交娱乐 高质量广告素材生成,满足多样的投放载体、投放人群、投放形式。 可玩性强,美且出众,让单调的图片&视频,秀起来! 赋能传统剪辑工具,突破创意瓶颈,一飞冲天! 夺人眼球,急速裂变,引爆流量! 视频⽣成-应⽤场景 专业视频制作 突破创意瓶颈,让专业视频制作一飞冲天! 适用能力 运动笔刷(图生视频)|视频插帧|文生视频视频画布拓展 成功案例及价值分享 •某头部媒体联合腾讯混元,运用诸如文生视频、视频风格化、图生视频、视频插帧、艺术字视频等多项能力,推出了《江山如此多娇》宣传短片,全网反响热烈。 •专业视频制作场景:某运动健身类app,通过将传统运动指导视频转换为3D动画风格,让画面更具有亲和力和美感,用户参与度明显提升。 感谢观看Thank you