双向奔赴·纵深触达 ——大模型构筑传媒新质生产力 腾讯云智慧传媒行业曾亮 大模型对媒体发展的机遇 通用大模型与传媒垂直领域的结合,将会对产业发展产生真正深远的影响 增强生成 内容创作 搜索推荐 风控模型 内容交互、知识服务、栏目助手、专家咨询、政策助手、心理咨询、智能助教、培训辅导…… 视频标签、跨模态检索、多模态检索、小样本特征、广告投放、用户运营、内容运营…… 视频审核、文本审校、评论审核、账号安全…… 访谈提纲、选题助手、文案初稿、新闻综述、分镜脚本、视频合成、稿件插图、广告创意…… 应用开发 精调模型 腾讯云行业大模型 检索增强生成(RAG)推动服务创新 举个例子:某教育类客户-政策解读大模型 结合大模型客服,使得政府公共教育数据更好服务市民,体现上海教育咨询智能化。 基于大模型的政策咨询智能化平台优势: 7*24小时服务 对接渠道: 不需要休息,永不间断,年服务可用率不低于99.9% 1.微信公众号:【XX教育】…2.官网:某教育客户官网…3.现有呼叫中心4.对接方式:供应商提供API 响应速度快 1秒内响应,快速回复 服务标准化 避免了不同人的不同解读,给市民造成困扰 服务面广 覆盖范围: 为全市幼升小及小升初的孩子、家长及负责老师提供平台的操作指导和部分入学事项的解答服务。提供技术类问题和政策类问题的咨询服务。 1.基础教育:技术操作类、政策资讯类;2.开放大学、教育考试院、法律职业资格考试… 对接多个渠道(微信公众号、小程序、官网等),扩大服务面 服务成本 对运营侧,知识生产效率提升,替代人工、节约成本; 智能精准 能对接海量知识库,语义理解更强,回复更精准 大模型RAG(检索增强生成) RAG示例 3增强检索生成的回答 基底模型通用回答 导入知识文档 •支持导入word、PDF等格式•支持对表格、图片等进行解析 大模型RAG在媒体的应用场景 02 01 04 03 内容交互 栏目服务 本地服务 专业服务 学习既往王牌栏目的内容,接受观众对话式咨询,提升栏目关注度,同时拉动私域流量。 接受本地观众或外地游客的相关资讯,提供美食、旅行、酒店、特产、外卖等服务。 财经类节目,接受财经类问答,接受输入财报等PDF,输出简报或总结分析。 阅读理解,用户可以对发布的报道提出问题,要求摘要总结,找到和我观点一致的受众等。 06 05 07 08 政策咨询 四史百科问答 外挂大模型RAG的数字人,多轮交互、强意图理解,不再“不知道”和“乱答”。 提供《党史》、《新中国史》、《改革开放史》、《社会主义发展史》等百科问答。 输入单位政策文件、技术资料等,接受员工问答型资讯。 接受本地入学、购房、社保等各类政策咨询服务,拉动私域流量 媒体行业内容创作场景能力进展 大模型强大的内容生成能力 用户可以通过传入不同的参数控制生成内容的类型,并通过自然语言给模型以内容生成的指令,可以满足多种场景的文本生成需求,包括但不限于文章写作、营销文案、视频脚本、电商文案、纪要整理、翻译等。目前支持以API形式接入。 安全、合规的解决传媒供给侧内容不足与传播的问题 •分发渠道不同,观众阶层不同; AIGC(一):选题、文稿生产 2新闻稿件 AIGC(二):分镜头脚本、采访提纲生产 AIGC(三):报道撰写、新闻摘要 新闻Push场景 1.要点精炼2.时间紧张3.吸引用户 AIGC(四):音乐自动生成 智能音乐平台基于序列生成技术支持作词、作曲、演唱、改编等智能化生产能力 歌声合成 智能作曲 视频配乐 从歌谱中自动合成具有高保真音色的歌唱干声;应用场景包括数字音乐会、晚会演出等 基于音符、情绪、节奏、复杂度等条件提示,自动创作单轨或多轨乐曲,创造音乐无版权风险,其中多轨作曲能力为国内首创;应用场景包括曲库构建、音乐宣发、数字藏品等 分析视频的场景、物体、事件等信息,在曲库里推荐风格、情绪、节奏相匹配的背景音乐,并生成新的视频,支持自定义曲库。 风格转换 将原始音乐转换中国风、民谣、歌剧、摇滚等指定风格的音乐 AIGC(五):文生视频 基于指定视频库&基于指定视频 生成视频 原始视频 AIGC(六):视频翻译 大模型ASR+智能翻译+声音复刻+唇形对齐 相对传统ASR,支持混合语种(普粤英日韩)、嘈杂背景(音乐、日常背景声)、方言口音等更精准的识别。 大模型ASR 智能翻译 一键、准确完成普粤英等语言的翻译。 基于少量录音数据,自动进行模型训练,实现对发音人音色语音合成的音色定制。 声音复刻 改换语言后,让唇形自动对齐所发音的内容。 唇形对齐 AIGC(七):广告素材创作场景 THANKS!感谢聆听