人民中科:人工智能算法与内容安全风控
公司介绍
人民中科由人民网与中科院自动化所共同建设,聚焦内容智能理解核心技术,以内容安全为初始应用场景,逐步成为全球内容智能理解的领导企业。公司使命是“让机器理解视频,赋予数字世界认知能力”。
股东背景
- 人民网:国家级重点融媒体,国内舆论生态的“领航者”。
- 中科院自动化所:国内唯一全建制从事人工智能领域研究的国家级科研机构。
核心实验室
- 人民日报社传播内容认知国家重点实验室:专注于内容智能理解。
- 中科院自动化所模式识别国家重点实验室:研究模式识别基础理论、图像处理与计算机视觉等。
网络空间内容治理
内容安全政策背景
- “十四五”规划:首次提出“维护政治安全能力”,将网络安全保护工作从行为安全升级为内容安全。
- 国家网信办规定:明确禁止“十一类违法信息”和“九类不良信息”,出台《网络短视频内容审核标准细则》等。
内容安全风控大脑
- 应用场景:互联网内容风控、舆情感知、情报研判、对象管控、目标落查。
- 服务对象:中宣、网信办、公安等监管部门及地方合作机构。
内容安全应用中的问题
- 传统人工智能审核局限性:
- 有限算法应对多样内容。
- 政策动态变化、地域区域差异、行业专有特点难以覆盖。
- 准确率与召回率:
- 敏感内容审核:准确率95%,召回率90%。
- 行业违规审核:准确率60%,召回率60%。
- 开放场景审核:准确率80%,召回率50%。
对人工智能技术的新挑战
- 无样本、小样本训练:多个算法效果不理想。
- 视频时空信息识别:需识别完整视频时空信息而非图片。
- 自然语言策略调整:使用广泛自然语言随时调整策略。
- 情感或思想内容识别:识别愤怒、悲伤、侮辱等情感或思想内容。
- 非实体类内容识别:支持开集标签跨模态算法。
跨模态算法
技术方案
- 多模态数据集:百万级视频-中英标题-中英标签数据集,千万级粗标数据。
- 跨模态预训练模型:基于图片文字理解,学习视频时序信息,深度理解视频情节、物体、场景及事件。
跨模态内容智能理解
- 应用:跨语种视频文字描述、多源异构跨模态预训练模型。
- 功能:文本图像视频AR/VR跨模态内容搜索、标题个性化生成、开集视频标签生成。
跨模态内容搜索
- 示例:以文本搜视频,如“穿红色裙子的小女孩在跳舞”。
跨模态应用-视频打标签
跨模态算法内容安全场景应用总结
- 优势:
- 视频理解。
- 跨模态直接检索。
- 具备开集标签检索能力。
- 支持非实体类检索。
- 单个算法检索多种内容。
- 缺点:
- 训练成本高。
- 需搭配特定算法提升准确率、精准识别能力,不能完全替代其他算法。