您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[数美科技]:数字风控行业手册:AIGC专题 - 发现报告

数字风控行业手册:AIGC专题

信息技术2023-11-10数美科技尊***
AI智能总结
查看更多
数字风控行业手册:AIGC专题

北京(总部) 北京市朝阳区来广营望京诚盈中心 3 号楼 14 层 上海上海市静安区南京西路 580 号仲益大厦 8 楼 8020 室深圳广东深圳市南山区粤海街道华润置地大厦 C 座七楼 F718 室杭州浙江杭州市余杭区仓前街道 1008 号乐富海邦园 J 座 701 室广州广东深圳市南山区粤海街道华润置地大厦 C 座九楼 F906 室 AIGC内容风控图谱和解决方案AIGC企业合规指南与实践案例 目录CONTENTS 「前言」 我们所处的时代正在经历一场数字革命,人工智能技术的快速发展已经改变了我们的生活和工作方式。其中,AIGC(AI generated content,人工智能生成内容)是一个备受关注的领域。AIGC 技术可以用来生成文章、图片、音频、视频等各种类型的内容,极大节省了人力成本,进一步提高生产效率,增强娱乐体验。与此同时,AIGC 技术也带来了一系列风险和挑战,例如违规信息、虚假信息、低质内容、恶意攻击、人工智能劣化等。 前言01 AIGC 发展沿革07 为了解决这些问题,数美科技提供了一系列针对 AIGC 的风险控制服务,旨在帮助客户规避潜在的风险和损失。我们通过对 AIGC 生成过程的分析、监控和审核,确保所生成的内容符合相关法规和行业标准,从而维护互联网的健康和稳定发展。 AIGC 内容风险和解决方案13 1)AIGC 内容风险详解2)AIGC 内容风险解决方案3)数美科技产品优势131518 本手册将会探讨 AIGC 技术的发展趋势、应用场景以及相关的风险和挑战,并介绍数美科技的 AIGC 风险控制服务及其应用案例。我们希望通过这份手册,帮助读者更全面地了解 AIGC 领域的现状和未来,同时也希望为相关行业的从业者提供一些可行的解决方案和思路。 企业在开发应用 AIGC 中如何坚守合规底线21 数美数字风控研究院致力于打造数字风控行业根据地,为从业者带来最前沿的产品、技术、政策解读及深度报告研究。汇聚专业力量,洞悉行业趋势。针对不同区域和行业,数美数字风控研究院将推出数字风控行业系列白皮书和手册,AIGC 数字风控行业手册为系列第四册。 案例解析1)案例 12)案例 2252527 「公司介绍」 核心团队 ㇫会ⱙ 公司简介 南开大学硕士,百度、360大数据奠基人中国信通院互联网新技术新业务安全评估中心高级评估专家拥有10余年超大规模大数据平台数据挖掘等领域经验,是国内早期研究大数据领域的专家 数美科技是一家专业的在线业务风控解决方案提供商,成立于 2015 年 6 月,总部位于北京,并在杭州、上海、深圳、广州设有研发中心和子公司。公司提供天网-全栈式智能业务风控和天净-全栈式智能内容风控两大核心产品,致力于帮助客户解决在线业务中广泛存在的业务风险与内容风险,为企业数字化转型保驾护航。 天网,是数美科技结合多年黑产对抗经验打造的全栈式智能业务风控产品,旨在为客户解决营销欺诈、交易风控、数据盗爬、欺诈广告等风险问题。 ڝ೧຋联合创始人&总裁 上海交通大学,曾任阿里巴巴副总裁,百度首席架构师在分布式算法、大数据、云计算、广域架构、量子技术等领域拥有16年技术与管理经验,多领域世界领先 天净,是数美科技结合人工智能技术打造的全栈式智能内容风控产品,旨在为客户提供一站式的内容风控方案,帮助客户识别文本、图片、音频、视频中出现的敏感、违禁、暴恐、色情、导流广告等风险内容。 ໴䁌联合创始人&CTO 北京大学计算机硕士,国内知名机器学习与数据挖掘专家曾任百度、小米,高级工程师、架构师,拥有多年机器学习和人工智能领域经验两次获得百度MVP(最具价值员工) 发展历程 2019 2021 2022 2017 2018 获 腾 讯、襄 和 资 本、顺 为、清 流、百 度 风投 7300 万 美 金 C 轮融资全年调用量超万亿次 标 杆 客 户 突 破百家人 工 智 能 研 究院正式成立首 次 在 香 港 部署 SaaS 风 控服务网络 AI 研究院论文被顶级会议 IEEE SLT 收录入选信通院“业务安全推进计划”首批成员单位成立新加坡办事处入选 IDC 人工智能厂商全景报告的银行智能风控代表厂商 与 阿 里 云 达 成 战 略合作荣 获《银 行 家》“十佳 智 能 风 控 管 理 创新奖”完 成 1.35 亿 美 元 D轮融资数美科技党支部正式成立 获 顺 为、清 流、360、百度风投 B轮融资与 中 科 院 计 算 所达成战略合作累 计 保 护 全 球 用户达 30 亿 + 获 顺 为、清 流、360、百度风投 A轮融资累 计 保 护 全 球 设备达 20 亿 +在 法 兰 克 福、弗吉 尼 亚 等 地 部 署全球 SaaS 风控服务网络 日调用量达 30 亿 +累 计 过 滤 风 险 行 为600 亿 +互联网头部客户突破千家 正式成立并获 360天使轮融资数 美 反 欺 诈 引 擎正式上线 业务领域 数美优势 黑产攻防 产品矩阵 深入挖掘黑产威胁情报和自动化作恶模式,做到防御方案全方位知己知彼,有的放矢。 纵深防御 从设备启动到用户注册、登录再到绑卡、转账、支付、领券、积分兑换等业务行为的各个环节来进行纵深防御。 全方位策略体系 通过 IP、设备等全球风险画像、团伙行为风控引擎,内容智能风险识别引擎等组成全方位策略体系。 AI 风控机制 结合深度学习、社群发现等 AI 风控机制,通过全行业共享的海量特征样本判定深度异常。 通常认为,AIGC 在 2022 年的爆发,主要是得益于深度学习模型方面的技术创新。不断创新的生成算法、预训练模型、多模态等技术融合带来了 AIGC 技术变革,拥有通用性、基础性、多模态、参数多、预练数据量大、生成内容高质稳定等特征的 AIGC 模型成为了自动化内容生产的“工厂”和“流水线”。 处理信息,比如提取图片中的信息并进一步处理。这不仅呈现了技术进步的方向,也展示了 AIGC 在商业化上的更多可能。 「AIGC发展沿革」 首 先 界 定 AIGC 的 概 念,AIGC 指 的 是 AIgenerated content,是继 PGC、UGC 之后的又一种内容生产方式。 个 月 时 间 用 户 破 亿,创 下 了 用 户 最 快 破 亿 程 序 的记录。 仅在 GPT-4 发布两天后的 3 月 17 日,微软也在Microsoft 365 Copilot 发布会上,正式把 OpenAI 的GPT-4 模型装进了 Office 套件,推出了全新的 AI 功能Copilot(副驾驶),成熟到能自己办公,写文档、做表格、写 PPT。 ChatGPT 属于生成式 AI,红杉资本将生成式 AI分为文本、代码、图片、语言、视频、3D 等数个应用场景。红杉资本认为,生成式 AI 至少可以提高 10% 的效率或创造力,有潜力产生数万亿美元的经济价值。 2022 年,OpenAI 推 出 对 话 式 聊 天 程 序ChatGPT,借助 AI 系统,用户可以让程序写出一段文案、代码,或一些实际的问题,其智能程度远超以往的聊天机器人产品,因此 ChatGPT 也迅速火出圈,两 早在 2021 年,Gartner 预测,至 2023 年将有20% 的内容被生成式 AI 所创建;至 2025 年生成式 AI产生的数据将占所有数据的 10%(目前不到 1%)。 目前来看,AIGC 已经应用于文本、音频、跨模态、策略生成,在设计、内容创作、广告营销、游戏、企业服务等领域开启商业化,有望开启新一轮内容生产力革命。 而在 2023 年 3 月 15 日发布的 GPT-4,作为“最先进的系统,能生产更安全和更有用的回复”,拥有了更广的知识面和更强的解决问题能力,甚至能跨模态 量极大、不确定性大 图像生成 AIGC 发展沿革涉及大量技术发展因素,本手册将重点聚焦 AIGC 的各种模态表现,以及它可能产生的风险。 应用于图像ps、图像生成、传㯮、蠒Ꝉ瘝场景。 代表案例:美图秀秀 文本生成 2022 䎃,美图公司偫下应用玐䎸美图秀秀.eitV上新 AI 絚歘⸆能,在使用过玐中溁殜✫关ꝶ词鳕入,⟄皍峇僈✫的곜꬗⚹用户提⣘图片创意解决方案,佅䭯一ꝶ生成多种歘风。 应用于鳇⸔ⱗ⡲、蠒Ꝉ、社交、崹錢㐼、企业紩服务、䗱理ㅐ霧瘝곭㚖。 代表案例 1:Jasper.ai Jasper.ai 成立于 2021 年 1 月,以“AI 文字生成”为主打产品,通过其文字生成功能,用户可以轻松生成 Instagram 标题,编写TikTok 视频脚本、广告营销文本、电子邮件内容等工作。Jasper.ai 于 2022 年 10 月宣布完成了 1.25 亿美元的 A 轮融资,估值达到了 15 亿美元。 音频生成 应用于智能客服、有声读物制作、配音、导航、虚拟歌手、作曲等领域。 代表案例:喜马拉雅 代表案例 2:glow 聊天室 在喜马拉雅的 TTS(语音合成)技术的佅䭯下,创⡲罏一天内可⟄ⵖ⡲和刿新上涰꧋内容。ꤑ姼⛓㢪,AI 鵮可⟄与⚺乄湱结合,鸑过 AI 多乄⸆能,䌐⸔⚺乄⚹不同錭蒀匹配不同的㡮音,䘯鸟ⵖ⡲“AI溫人”联合怵結的多乄⚁辑。 glow 聊天室是北京稀宇科技有限公司旗下虚 拟 聊 天 软 件,基 于 AIGC 技 术 打 造,2022 年 8 月上架,用户可以与 AI 人工智能技术创造的“智能体”实时交流、沉浸互动并建立情感羁绊。 跨模态生成 视频生成 包括文生图、文生视频,图片视频生成文字等应用。 应用于视频编辑、特效渲染等场景下,影视、营销、游戏等行业都得以应用。 代表案例:一帧秒创 代表案例:微软 Copilot 一帧秒创产品基于 AIGC 引擎进行视频内容生成,可以快速实现图文转视频、音频匹配等功能。 2023 年 3 月 Microsoft 365 Copilot 发布会上,微软正式把 OpenAI 的 GPT-4 模型装进了 Office 套件,推出了全新的 AI 功能 Copilot(副驾驶)。借助 Copilot,用户可以一键生成文本、ppt、表格,管理邮箱,整理会议等。 「AIGC内容风险和解决方案」 侵犯版权 AI 生成的内容可能在一定程度上模仿现有的受版权保护的作品,可能导致版权纠纷。 截至目前 AI 不是我国《著作权法》所认可的“作者”。《著作权法》第二条规定“中国公民、法人或者非法人组织的作品,不论是否发表,依照本法享有著作权。”根据前述规定,我国《著作权法》认可的作者只有自然人、法人或非法人组织,著作权法将人(包括拟制的人)作为享有权利、义务的唯一主体。 理论上说,AI 生成的内容基于大量的数据筛选和模型训练,不具备任何价值观,但数据的筛选、清洗,以及不同地区的内容监管尺度差异,会导致最终的内容产出存在不同的风险。AIGC 的内容风险主要包括以下几个方面: 不当或违法内容 AI 生成的内容可能包含煽动性、恶俗、暴力、色情或其他违反法律法规的内容。 偏见和歧视 误导性或虚假信息 由于训练数据可能包含偏见,AI 生成的内容可能反映出种族、性别、年龄等方面的偏见和歧视。2021 年,在韩国十分火爆的人工智能聊天机器人 Lee Luda,由于一些用户在对话交互时,故意输入污秽和暴力言语,导致 Lee Luda 在接收这些不符合主流价值观的内容后,开始输出一些涉嫌性别歧视、种族歧视、对弱势群体的歧视的内容,该产品因此广为诟病而于上线不到一个月就中断了服务。 AI 生成的内容可能包含 a 不准确、误导性或虚假的信息,导致用户对事实产生误解。 案例:2019 年 2 月 15 日,AI 研究机构 OpenAI 展示了一款软件 GPT-2,只需要给软件提供一些信息,它就能编写逼真的假新闻。 OpenAI 公布了软件编写新闻的过程。研究人员给软件提供如下信息:“一节装载受控核材料的火车车厢今天在Cinci