行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

解码AI时代的实时交互秘籍：万物互联，实时互动

2025-09-13 腾讯 Zt

TWeTalk Voice Agents for Hardware 研报总结

产品介绍

TWeTalk 是腾讯云面向智能硬件的 AI 对话软硬一体化产品方案，提供端侧、云端与通信能力，与主流嵌入式芯片及模组厂商合作，实现人与硬件的自然“对话”。产品特点包括：

语音端到端：快速接入，积木式组装，提供语音智能体。
情绪识别：独特的意图理解 ASR 引擎，精准捕捉用户情绪与意图。
音色定制：TTS 支持音色定制，结合实时交互与灵活打断。
对话集锦：智能生成与 AI 的精彩对话片段，留存暖心交流瞬间。
应用技能：支持微信通话、音乐播放等。
微信与设备双向音视频呼叫：支持 P2P/TRTC/WebSocket 通道云端通信。

应用场景

TWeTalk 适用于 AIoT 多个场景，包括：

消费电子：AI 陪伴玩具、智能耳机/手表/AI 眼镜、故事机/AI 拍学机等。
泛互/出海：智能点餐、导览、AI 面试等。
家居、工业制造：设备控制、AI 机器人等。
芯片原厂：嵌入式语音模组开发。

功能与特点

独特的意图理解 ASR 引擎：支持语音识别、情绪识别和意图理解。
TTS 音色定制：支持输入情绪标签与音色克隆功能。
精调大模型：适配玩具、机器人等场景，提供准确执行 function call 的引擎。
TWeTalk 方案架构：提供可扩展、可定制的灵活架构，适用于具体场景下的 AI 应用扩展。
TWeCall（微信通话）：支持设备与微信双向音视频呼叫。

技术架构

TWeTalk 采用端云协同多模态引擎，包括：

Hear-感知层：搭载 TWeTalk 场景精调大模型，优化玩具、机器人等场景。
Think-大脑中枢层：独家自研的 TTS 引擎支持情绪标签与音色克隆功能。
Talk-声音表现：整套对话系统支持实时交互与灵活打断。

标杆案例

TWeTalk 透明屏：在 2025 年巴黎 Viva Tech 大展中亮相，应用于智能点餐和导览场景。
腾讯 QQ 公仔：在 WAIC（世界人工智能大会）亮相，展示智能硬件语音交互系统。
玩具大 IP：奥飞喜羊羊 3.0 和汤姆猫通过 TWeTalk 全球化产品方案实现出海。
飞利浦：为飞利浦 TAT5599 耳机提供智能摘要及耳机同传服务。
AI 面试官：TWeTalk 实现了 24*7 AI 面试官，自动分析候选人语音情感波动，生成综合能力评估报告。

AIoT 行业趋势

智能硬件行业趋势：商业之外，核心是产品解决什么问题，新兴赛道预测 AI 玩具 + 具身智能 + 智能穿戴。
生态协同：覆盖客户+模组集成商+芯片原厂，验证场景深入场景，收敛行业方案。
方案按行业细分落地、出海、生态协同优化：智能体，以项目沉淀标品标杆客户服务好头部客户，持续拓展标杆行业。

产品演示

提供 TWeTalk 透明屏和鹅厂 Demo 的近距离围观体验。

RTC-IoT 芯片平台覆盖介绍

目前 RTC-IoT 设备端 SDK 可以全平台支持（Linux/RTOS/Android），并已覆盖 5 大场景的 26 个主流芯片平台的上百款芯片，特别针对一些低功耗、轻资源的芯片也能很好的支持，同时对于新出的芯片也会不断跟进适配。

黄成言腾讯云音视频TWeTalk产品负责人 03 产品介绍技术架构功能与特点应用场景 AIoT行业趋势06 05 07 产品演示标杆案例产品介绍 TWeTalk:重塑AIoT的语音交互体验腾讯云音视频TWeTalk是面向智能硬件的AI对话软硬一体化产品方案。TWeTalk与主流嵌入式芯片及模组厂商合作，整合端侧、云端与通信能力。该方案已应用于AI陪伴玩具、具身智能、智能穿戴（耳机、手表、眼镜）、智能点餐、导览、AI面试等AIoT场景，实现人与硬件的自然“对话”（Talk）。 •音频处理：3A音频降噪、唤醒•编解码：支持opus格式 •微信与设备（VoIP）的双向音视频呼叫•P2P/TRTC/WebSocket通道 TWeTalk：快速接入按业务需求，积木式组装。同时提供语音智能体，开箱即用。应用场景 TWeTalk应用场景与行业方案方案核心：端云协同+场景化AI，支持AIOT一站式接入。功能与特点 TWeTalk：快速接入按业务需求，积木式组装。同时提供语音智能体，开箱即用。音色定制语音端到端情绪识别对话集锦独特的意图理解ASR引擎，不仅支持语音识别，更能精准捕捉用户的情绪与意图；TTS支持音色定制；精调大模型适配玩具、机器人等场景，提供准确执行function call的高性价比引擎。依托先进的语音处理技术与精调场景大模型，精准捕捉语调、语速、语义的细微特征以感知用户情绪，及时给予礼貌、贴合心境的回应。智能生成与AI的精彩对话片段，留存暖心交流、趣味对话、Baby’s firstword等瞬间，搭配情感化交互与BGM动效。“声波日记”就是您的时间胶囊！可根据IP打造专属声音，结合实时交互与灵活打断，定制音色，让我们的AI伙伴更鲜活，带来独特的陪伴体验。音乐播放设备控制微信通话微信支付安防、家居场景下语音控制设备。语音指令直达，操控便捷，让您轻松用语音掌控物联智能生活。支持微信与设备双向音视频呼叫，设备可直接拨打微信电话。支持音乐的点播功能（音乐版权方对设备端有单独的授权）。智能手表、AI眼镜，支持可穿戴设备一站式接入微信支付（探索中）。 TWeCall（微信通话）应用场景：消费电子（AI玩具、机器人）、穿戴（智能耳机/手表/AI眼镜）、家居（中控屏、音箱）、安防（门铃、门锁）。基于微信原生VoIP 高触达率的微信原生音视频通话 •设备一键呼叫，微信持续响铃提醒，保有与微信原生音视频通话一致的触达率和流畅通话体验•秒Call，设备拨打微信可以做到秒级响应广泛适配主控芯片平台，资源占用低 •支持Linux/RTOS/Android•适用于低功耗、轻量化系统，资源占用低低成本一站式接入 •提供设备端和小程序SDK，快速完成全功能接入•无须额外搭建服务器，维护云端呼叫状态 TWeTalk技术特色 TWeTalk智能硬件AI对话解决方案驱动，深度集成三大核心技术模块。搭载TWeTalk场景精调大模型，优化玩具、机器人等场景，语言风趣拟人，函数调用精准，支持长记忆。还能讲故事、播音乐、查天气，可微信通话。 Hear-感知层 Talk-声音表现 Think-大脑中枢层独家自研的TTS引擎支持输入情绪标签与音色克隆功能，让硬件的每一句话都充满情感，并能化身为任何您喜爱的声音。整套对话系统支持实时交互与灵活打断，打造出真正“活”起来的AI伙伴。采用独特的意图理解ASR引擎，不仅能准确识文，更能精准捕捉用户的情绪与意图。结合自研的语义端点检测技术，实现了流畅、无感的语音交互起点。 TWeTalk方案架构提供可扩展、可定制的灵活架构，适用于具体场景下的AI应用扩展。SDK支持小存贮需求。技术架构腾讯云AIoT整体产品功能架构 TWeSee与TWeTalk的协同价值 TWeSee与TWeTalk共同构成腾讯云AIoT交互矩阵：能力互补、场景融合、交替进化。标杆案例 2025巴黎Viva Tech：TWeTalk透明屏一鸣惊人腾讯云CEO Dowson邀请国际友人体验鹅厂特产：TWeTalk解决方案（智能点餐）。Enjoy the coffee in Central Perk! TWeTalk透明屏：Smart Ordering智能点餐场景泛互、出海：智能点餐、AI面试消费电子：智能穿戴（耳机/手表/AI眼镜）家居、工业制造：设备控制、AI机器人特点嘈杂环境抗噪拾音多轮对话精准点餐，自动同步订单算法工程化优化时延软硬一体深度融合，1+1＞2 2025巴黎Viva Tech：TWeTalk透明屏一鸣惊人腾讯云CEO Dowson邀请国际友人体验鹅厂特产：TWeTalk解决方案（导览）。语音控制页面浏览，从此解放双手。 TWeTalk透明屏：Tour Guide导览场景泛互、出海：导览、中控屏、文旅政务大厅出行：智能车载金融：智能客服消费电子：故事机、拍学机特点多轮对话精准理解意图语音控制页面滚动、播放、暂停（解放双手）高性价比（最小可用v.s.足够精准专业配比）深度适配主流芯片腾讯QQ公仔：TWeTalk亮相WAIC（世界人工智能大会）2025 腾讯鹅仔，从此会说话了！Bring the latest technology to QQ and You. QQ公仔语音体验：智能硬件语音交互系统场景消费电子：AI陪伴玩具、机器人智能穿戴：儿童手表、智能眼镜特点情绪识别音色定制对话集锦（“声波日记”）场景化AI（如理解儿童模糊指令）智能硬件生态协同：AI+模组方案商+芯片原厂玩具大IP：奥飞喜羊羊3.0 +汤姆猫出海北美腾讯AIoT团队为奥飞娱乐喜羊羊3.0最新款产品提供全栈式TWeTalk语音方案，包括微信通话及音色定制服务。汤姆猫通过TWeTalk全球化产品方案实现英语深度适配、出海北美市场，以“中国芯+国际IP”组合定义AI玩具出海范式。飞利浦：Meeting Assistant耳机摘要腾讯云AIoT基于TWeTalk端云协同架构，为飞利浦TAT5599耳机提供提供智能摘要及耳机同传服务，助力飞利浦智能耳机从硬件设备升级为“智能会议助理”与“随身翻译官”。飞利浦：Translator耳机同传智能穿戴，耳机、儿童手表、AI眼镜..ing适配中。 TWeTalk：AI Interviewer面试官 24*7 AI面试官always on，面试者挑选时间更自由，交流更放松。会议结束，AI自动分析候选人语音情感波动，生成综合能力评估报告。 AIoT行业趋势智能硬件行业趋势的一点思考智能硬件新兴赛道预测商业之外，核心是产品解决什么问题 AI玩具+具身智能+智能穿戴洞察布局新兴赛道&生态协同合作布局标杆牵引按行业细分落地、出海、生态协同优化智能体，以项目沉淀标品形态：“无用之用”玩具，客群高收入中年女性特点：反向暴击，强调失控、无负担的陪伴价值优势：高客单价（单机3w+880元/月软件订阅服务费），创新商业模式标杆客户服务好头部客户，持续拓展标杆形态：挂件/宠物形态玩具特点：不说话，表情反馈和动物声音为主优势：温暖戳人，不用担心宠物生老病死，寄托感情消费电子、制造、泛互、家居通信等出海形态：具身智能/机器人特点：主打机器人关节动效+原版IP台词优势：IP粘性极大，且只需简单语音指令，硬件触感是亮点自有IP →产品技术验证→头部IP跟进→国际IP突围→生态定价权垄断快速交付生态协同覆盖客户+模组集成商+芯片原厂准确、快速交付，提升SLA标准形态：宠物硬件赛道特点：给宠物玩的AI玩具，模拟声音、球球脖圈感应、智能喂养等优势：较为蓝海，与视觉多模态融合产品演示 THANKS Contact usEmail: twetalk@tencent.com, twesee@tencent.comWechat: TWeTalk｜TWeSee 附录：RTC-IoT芯片平台覆盖介绍目前RTC-IoT设备端SDK可以全平台支持（Linux/RTOS/Android），并且已覆盖5大场景的26个主流芯片平台的上百款芯片，特别针对一些低功耗、轻资源的芯片也能很好的支持，同时对于新出的芯片也会不断跟进适配。 TWeTalk：Smart Ordering智能点餐（鹅厂Demo）近距离围观黑科技背后的团队实战。 THANKS Contact usEmail: twetalk@tencent.com, twesee@tencent.comWechat: TWeTalk｜TWeSee 音视频实时互动如何走进千行百业腾讯云音视频创新解决方案首席布道师章怡成 AI对话应用场景自24年下半年以来，涌现了哪些新场景？应用场景01：大模型/搜索——实时AI对话已经成为标配从「会思考」到「能对话」未来挑战与演进方向 RTC+AI的方案不断优化 •在嘈杂的地铁场景中，用户仍可通过语音与大模型完成复杂问题交互，且支持随时打断和话题切换，接近真人对话体验 •当前仍需解决长时对话中的意图漂移问题（如30轮以上对话的上下文丢失率约12%）有效提升对话轮次和客户粘性 •相比仅用IM单次对话，加入AI实时语音对话平均轮次提升3-5倍应用场景02：AI+泛娱乐头部产品——加入voicecall功能后留存和对话轮次均大幅提升 APP：Talkie发行商：Minimax APP：C.ai发行商：Character.AI •在C.ai24年6月发布语音功能后，7月相比6月下载量有96%的增长•对话轮次随着voicecall能力的增长显著，从20次/天上升到27次/天•主要付费来源是美国用户，20%的下载量贡献了60%的收入•57.07%的用户是18-24岁的青少年，平均使用时长达2小时 •Minimax的出海产品Talkie于24年7月发布了calling实时通话功能，留存和对话轮次都有显著提升•Talkie主要受众在美国，40%的用户为18-24岁的青少年，其中女性较多•平均每天使用时长约70分钟 Sources:Sensor tower 应用场景02：AI主持人——全民K歌通过AI主持人提升效率用户场景刚需 •主持需同时承担房间管理（迎送用户、控制麦序）、氛围营造（活跃冷场、活跃引导）、送礼答谢等多种类型的任务实现效果 •AI主持大拿可通过语音播报和弹幕消息与用户进行双向互动，对于歌房内的点歌、演唱、上下麦、送礼等事件均能产生有效的反馈应用场景03：对话式AI在教育行业的应用场景 •LLM+VoiceAgent是下一代交互的开始：低延迟、高智能。 •长链路的延迟是用户难以接受的，RTC+LLM使得延迟降低，加入了智能打断等功能让用户交互起来更像在于真人交流。•这对于互动/实时要求性高的教育场景具有显著意义。典型场景如语言学习、儿童兴趣引导、阅读伴侣等。软件类 AI大模型参与教学的能力逐渐增强，难度逐渐增大硬件类应用场景03：AI+教育——典型客户案例，AI教学语音+多模态实时对话 •App：伴鱼智学•开发者：WuhanQinxuanTechnology Co., LTD•区域：中国 •伴鱼凭借差异化的产品矩阵和长期技术深耕，已稳居中国少儿英语教育领域头部阵营，覆盖0-14岁全年龄段，形成“AI工具+直播课+分级阅读”的闭环生态。•伴鱼智学首创“AI私教全程个性化教学”体系，基于伴鱼7000万用户和3000万节课的实践积累，打造了AI智慧学习产品——“AI私教”，以“因材施教”的学习模式，为6-12岁青少年提供优质的英语教学辅导。 •客户需求： •需整合语音识别、圈选提问、情绪感知等多模态交互能力，满足学生通过语音、触屏、文字等多种

点击免费查看完整报告

解码AI时代的实时交互秘籍：万物互联，实时互动

TWeTalk Voice Agents for Hardware 研报总结

产品介绍

应用场景

功能与特点

技术架构

标杆案例

AIoT 行业趋势

产品演示

RTC-IoT 芯片平台覆盖介绍

你可能感兴趣

解码现代消费者：万物皆可购时代的数字广告策略

交易点的实时 AI 交互

互联网行业：万物互联时代的操作系统研究报告

万物互联时代的地球空间信息学2021

物联网系列报告之一：迎接万物互联时代的到来

【海通计算机】算力网络，AI应用/万物互联的支撑核心推荐，运营商：三家；

国君传媒|豆包实时语音大模型上线,AI交互水平再升级

AI+RTC：如何用实时音视频技术创造AI实时对话自然交互

万物皆可CP，钟薛高现象级联名的打法秘籍

销量腰斩倒逼行业革新：解码中国头部房企的不死秘籍

解码AI时代的实时交互秘籍：万物互联，实时互动

你可能感兴趣

解码现代消费者：万物皆可购时代的数字广告策略

交易点的实时 AI 交互

互联网行业：万物互联时代的操作系统研究报告

万物互联时代的地球空间信息学2021

物联网系列报告之一：迎接万物互联时代的到来

【海通计算机】算力网络，AI应用/万物互联的支撑核心推荐，运营商：三家；

国君传媒|豆包实时语音大模型上线,AI交互水平再升级

AI+RTC：如何用实时音视频技术创造AI实时对话自然交互

万物皆可CP，钟薛高现象级联名的打法秘籍

销量腰斩倒逼行业革新：解码中国头部房企的不 死秘籍

销量腰斩倒逼行业革新：解码中国头部房企的不死秘籍