您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[腾讯]:大模型时代的内容治理 - 发现报告

大模型时代的内容治理

2025-09-05腾讯起***
AI智能总结
查看更多
大模型时代的内容治理

更多智能,更多内容,更多知识 腾讯云传媒物联与新⽂创业务中⼼ 03 02 01 内容治理方案建设 内容治理业务分析 内容治理技术发展 内容治理业务分析 现有治理依旧存在痛点 媒体⾏业的内容是丰富的、多元化的,是重要的业务资产 各类栏⽬成品视频、素材、赛事、活动、历史影像等视频 拍摄图⽚、历史图⽚、地标风光图⽚等图⽚ ⼴播、采访、⾳乐、播客等⾳频 新闻稿、采访稿、规章制度、⽩⽪书、书籍、政策等⽂稿 运营报表、节⽬播出统计表、活动调研表、语料数据等企业知识 内容管理现状:缺乏全域的内容管理,内容应⽤受技术和数据限制 内容数据烟囱化 需要建设可信数据 需要发展特⾊内容 AI应⽤存在局限 AI应⽤没有全⾯渗透⾄媒体各个业务,尽管诸如ASR、翻译、转码等在⽣产场景中有 ⼀ 定 提 效,但 从 内 容 检索、内容运营上,依旧存在AI处理结果与业务标注需求的明显差异、检索⽅式和召回不够、已建AI平台不满⾜多业务调⽤等。 随着⼤模型和Agent的技术发展,不管是知识问答、内容⽣产等场景,在实际应⽤后,都体现了好的落地 业 务,除 了 依 赖 于 技术,更需要有“可信内容数据”基础,进⼀步建设媒体⽣产模型、⾼质量数据集基 座,打 造 媒 体 数 据 飞轮。 融媒转型中,内容管理和应⽤/⼯具系统拓展,因多⽅⼚商参与建设,标准及拓展性各有差异,导致⼤部分项⽬业务系统带对应的内容库,落 地 成“烟 囱 式”的 系 统 架构,实则重复建设、数据割裂。 内容需要进⼀步盘活、挖掘价值,⽣产、管理、运营⾃⾝的特⾊内容,是新型媒体的内容范式趋势。 现有媒资系统或内容管理系统 体 系,因 智 能 化 ⽔ 平 不⾜、流程设计固化、数据信息⽋缺等原因,⽆法⽀撑特⾊品质内容的⽣产范式。 回到需求思考,新型的内容资源管理中⼼落地关注点和建设⽬标 AI时代的内容管理中⼼,需要多元、灵活、特⾊、可靠,才能进⼀步增效、创收 内容治理技术发展 ⼈⼯——AI原⼦能⼒——⼩模型智能应⽤——⼤模型⼯作流 内容治理随着AI的发展,开始从单模态、离散状态,转变为跨模态、强关联状态 AI原⼦能⼒ 多数服务于单点业务 跨模态能⼒弱,落地场景不全 全⾯、灵活、聪明 •智能编⽬:结合基础信息识别AI能⼒、视频场景拆条算法、摘要算法等进⾏•智能审核:融合涉政、涉黄、涉暴等多个⼩模型算法打造审核应⽤ •语⾳识别:字幕⽣成、播报转写•翻译:新闻⽂稿翻译•⼈脸识别:系统登录、安防场景•⽂字识别:发票扫描、 •更强的语义理解、⾳视频理解模型,带来更有关联性的跨模态理解•更灵活接⼊媒体AI处理插件•能更充分解析到内容的深层含义,让治理更准 以视频治理为例: 基于智能标签的视频治理应⽤现状: 通过多项AI能⼒的融合串联和并⾏处理,实现结果信息全⾯⾼效输出。 存在的问题:视频类型发⽣变化后,需要重新训练;难以将视频画⾯、⾳频做关联理解的打标。 基于跨模态理解的视频治理现状: 基于⽂本-图像对的跨模态学习⽅法,能够理解并关联视频中的图像、⽂本信息,⼤⼤改善了传统⽂本关键词检索的局限。存在的问题:主要是画⾯镜头维度配对,⽆法检索到如具体事件、具体话题的检索(如**领导站在**地⽅,发表**演讲的⽚段)。 基于全⽂+向量检索的视频治理 基于媒体AI类能⼒,将视频的⾳频、画⾯信息,结合LLM\MLLM,转成⽂本描述,并存⼊⾄向量库中,结合RAG检索增强⽣成的能⼒,对内容检索。优势:能更全⾯地考虑到视频的多维度信息,并且建⽴关联,处理更加⾼效。 内容治理⽅案建设 ⾳视频治理——⾼质量⾳视频数据集——⽂档数据治理——企业知识管理 ⾳视频治理——新闻类、赛事类、资讯类视频治理 视频类媒资 业务应⽤ 基于媒资内容的专业知识问答,如养⽣助⼿、财经助⼿等 该场景的媒资要求: 有完整的节⽬台本,或是播报/访谈类的节⽬等。可基于视频的⼝播内容让进⾏内容理解和切⽚ ⽰例: 新闻联播、财经新闻、养⽣堂... ⾳视频治理——纪录⽚、电视剧类治理 视频类媒资 业务应⽤ 该场景的媒资要求:镜头变化明显,⾮固定场景画⾯(如采访等),视频⽆明显质量问题。 •专栏内容快速⽣产,如某⼈物的集锦回顾•赛事⾼燃集锦•地标特⾊内容库 ⽰例:乒乓球⽐赛、航拍中国... 图⽚类治理⽅案 ⼩模型+MLLM分析,保证细分标签的同时,更懂图像内容,⽅便后期检索 全模态内容管控与搜索⽅案 ⾼质量视频数据集建设 以镜头为例讲解⾼质量镜头数据集建⽴ 建设数据处理流程管线,打造精品训练视频集 混元⼤模型视频镜头分析参考 镜头内容分析 美学分析 ⽔印识别 ⼈脸识别 视频分类 镜头分析 视频是⼀个中景镜头,展⽰了四位年轻⼥性在公园⾥享受野餐的场景。她们坐在⼀块铺在草坪上的⽩⾊毯⼦上。左边的⼥性是⾦发,⽪肤⽩皙,穿着⼀条带有花卉图案的⽩⾊连⾐裙。她旁边的⼥性有着长长的棕⾊头发和⽩皙的⽪肤,穿着⼀条⽩⾊连⾐裙。右边的⼥性有着长长的⿊发和⽩皙的⽪肤,穿着⼀条浅蓝⾊连⾐裙。中间的⼥性有着长长的棕⾊头发和⽩皙的⽪肤,穿着⼀条⽩⾊连⾐裙。前景中有⼀个装着⾯包的篮⼦和⼀束黄⾊的花。背景是⼀⽚郁郁葱葱的森林。摄像机是静⽌的,捕捉到了⼥性们的互动和野餐的宁静氛围。视频风格写实,描绘了⼀个随意⽽愉快的户外聚会。 视频以⼀个中景镜头开始,展⽰了⼀位⽪肤⽩皙、红发的男⼦,他穿着蓝⾊西装和⽩⾊衬衫,从电梯⾥⾛出来。紧随其后的是⼀位⽪肤⽩皙、长棕发的⼥⼦,她穿着灰⾊西装和⽩⾊衬衫。摄像机跟随他们⾛出电梯,进⼊⼀个有⼤理⽯地板和玻璃墙的⼤厅。摄像机向右平移并向上倾斜,跟随这对男⼥⾛向接待台。接待台由⽊材和玻璃制成,后⾯有两位接待员。男⼦和⼥⼦⾛近接待台,男⼦向接待员打招呼。摄像机拉近镜头,聚焦在这对男⼥与接待员交谈的场景。视频以⼀个中景镜头结束,展⽰了站在接待台前的男⼦和⼥⼦。 ⽂档数据治理——⽂档结构化切分 ⼀级标题 ⼆级标题 技术部 操作⼿册 播出标准 运维⼿册 ⼀级标题 ⼊特定知识库 原始⽂档 ⼆级标题 栏⽬部 办公相关 节⽬库 ⽂稿库 ⽂档类数据治理——数据问答 关键能⼒ •⾃动数据链路:⽀持⽤户上传⽂档,⾃动进⾏数据处理、解析、向量化等步骤•DocumentAI:解析⽂档中的多模态数据,针对结构化数据,进⾏⾃动提取,并导⼊数据库进⾏精准分析•知识库集成:内置全托管ES知识库,知识基于⽤户第三⽅知识库创建⾃有知识库•联⽹搜索:融合公共知识和私有知识,对数据进⾏全⾯检索和解析 应⽤场景 •⾏业研报解读、咨询报告智能检索•企业知识管理 客户价值 •开放数据存储,⽆缝对接原有⽣态•DocumentAI多种格式⾃动⽂档解析,结合⽂本检索和数据分析 ⽂档数据治理——数据分析 关键能⼒ •丰富数据源:⽀持通过标准MCP协议连接多种数据源,⽆需移动数据即可⽆缝对接DataAgent•多模态数据融合:Agent⾃动拆解问题,规划任务,⾃主协调结构化数据分析与⾮结构化数据检索•语义理解:⽀持语义知识配置,智能关联⽤户数据与业务⽬标,实现数据深度分析与洞察•分析报告:通过对结构化数据的查询分析与⾮结构化数据的解读,⽣成分析结果和洞察建议 应⽤场景 •低门槛数据问答、数据查询•数据智能分析,提供深度分析与建议•报告解读等多模态融合场景 客户价值 •⼤幅降低数据分析门槛,⽀持业务同学•打破数据孤岛,跨系统、跨场景⽆缝协作•智能体提供深度洞察与⾏动决策建议 ⽂档数据治理——数据科学 关键能⼒ •Pipeline规划:DataAgent⾃主拆解问题、规划任务,构建数据科学Pipeline,包括数据加载、数据预处理、预测分析与总结报告等步骤•多种类模型:⽀持时序预测、回归、分类等模型,⽀持不同场景下的预测分析•总结报告:针对预测数据进⾏可视化建模,直观展⽰数据趋势,输出洞察简介与⾏动建议 应⽤场景 •数据预测分析、异常分析•预测性可视化建模•趋势洞察与⾏动建议 客户价值 •⾃动化构建数据科学链路,降低模型构建难度,缩短模型构建周期•辅助未来业务决策 ⽂档数据治理——智能问数 ⽤户提问后,⽀持根据数据表名称、数据表备注、字段名称、字段备注、关联配置等信息进⾏语义理解后,智能选表/关联回答 企业知识治理也是企业数字化管理、内容管理的关注点 •构建标准化营销、销售知识体系,系统化掌握所需知中识•基于SOP的营销知识专题,助⼒营销快速提升业务能⼒•产品售后知识点集中化管理•故障问题统⼀管理,避免以往错误复现 企业知识治理——与知识管理⽣命周期结合 企业知识治理——多⼊⼝融⼊AI⼯作流程,让知识可即时取⽤ 站内问答⼊⼝1:独⽴问答主页 企业融合⽅案1:界⾯侧边栏,⽅便知识获取 企业融合⽅案2:API调⽤,融⼊业务流程 企业知识治理——合规内容防泄密 内容安全审查 敏感操作记录 内容防泄漏 内容操作防泄漏 ⾃定义敏感词 异常下载记录 •分享权限•复制权限•打印权限•截屏提醒•下载权限 •个⼈单⽇超过10次触发•可查看下载详情 •可设置敏感词库,对平台内容进⾏脱敏处理 ⾃选审查级别 •可查看移交详情内容移交记录 管理员操作⽇志 内容显⽰防泄漏 •记录单个管理员⾏为记录•按应⽤查询•按时间范围查询•按操作终端查询 •页⾯⽔印•成员信息展⽰•搜索热榜管理 THANKS