您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:生成式AI重塑银行对公信贷业务报告 - 发现报告

生成式AI重塑银行对公信贷业务报告

2024-07-06孔维高未知机构杨***
生成式AI重塑银行对公信贷业务报告

势:金融“五篇大文章”与AI时代 [...]2道:AI重塑对公信贷业务 [...]3术:AIGC的5个信贷用例 [...]4法:1433-1框架,4个模式,3阶段、3路径、3抓手 1、取势:金融“五篇大文章”之科技金融 生产力:科技金融支持“科技+产业+金融”的良性循环:✓直接融资:资本市场+风投✓间接融资:信贷,投贷联动 生产关系与全要素生产率实现“跃升”相匹配 1、取势:金融“五篇大文章”之数字金融 中国金融行业整体处于“四期叠加”:信息化末期、移动化成熟期、开放化成长期、智能化探索期 1、取势:AI时代+数智化 AI时代,日新秒异,AI一天,人间一年: ✓上半场:卷大模型,下半场:卷基于大模型的AI原生应用;高估未来两年的成果,低估了五年的进展?✓数字化转型更多发力于个金ToC业务,而百花齐放的AI智能体将更深刻,更彻底地改变复杂业务的ToB领域? 工业革命是生产力的变革,带来生产关系、社会结构的演进:✓农业:19世纪后半叶,80%的劳动力从事农业;现在约为3%;✓工业:20世纪中期,工业工人占比约为50%,现在约为19%,多数人转向了服务业;✓知识工作者:央媒报道游戏公司用AI节省了50%美术成本;麦肯锡预计在2045年前后,AI将取代50%的职业… AI已经成为我们身边的同事 取代我们的不是AI,而是善于与AI智能协同的人 双智协同时代已来…… 2、明道:对公信贷,从管控走向赋能,修通“最后一公里” 人才难组织难 2、明道:生成式AI,将重塑银行信贷业务 7类可复用生成式AI服务,可满足如下业务需求 A.辅助银行专员回答问题:利用对话界面或聊天机器人满足客户请求(如查询交易状态等)B.销售话术生成:结合通用信息和客户个人信息生成话术C.正式报告生成:生成材料,作为信贷申请资料或交易后文件D.便捷访问其他类似信贷/交易产品(信息数据库):为决策提供信息和对标数据E.智能搜索引擎:解析分散在各文件和数据源(如基金招募说明书、法务/人力资源聊天机器人)中的数据F.外部数据发现:从半公开数据库等外部数据源中发现数据G.信息整合和洞察:为用户智能化提取相关信息 端到端转型成效最高的4大高优先级价值链(包括预测式AI) 1.信贷流程支持2.跨部门客户服务3.金融市场交易4.ESG监测与报告 2、明道:数据中台→AI中台将重塑信贷业务 3、信贷数智化架构:基于“场景+数据“的架构蓝图 AI原生应用:自然语言交互,多模态交互,AI智能体 3.1营销助手–业务需要既懂信贷,又懂财务,还懂产业,再懂风险融资? 1、某民营银行:”基于大模型,提高模型预测企业贷款意向的精准度“,助力挖掘潜在信贷商机2、金融大模型+企业专属知识库=城商行:联合实验室,自研-检索增强生成RAG 知识图谱:✓在微调或RAG中使用,增强AI的可靠性、有效性和透明度 上下文,降低技术和监管风险,避免幻觉/偏见。数据抽取:结构化、半结构化、非结构化信息提取-知识融合(消解-消歧)-知识加工-知识图谱三元组:实体|关系|实体,实体|属性|属性值 向量数据库,性能更好,相似性、更隐式的相关结果;某城商行: ✓组建由业务、科技、研究院等,开展数据采集和标注工作。✓基于开源技术路线,自主建设语义向量库、多路召回搜索引擎。 关系型数据库,某国有行的三点经验: ✓准确性:通过叠加专业知识库,避免“幻觉”✓知识库更新:定期全量更新知识库✓权限管控:对接行内文档权限控制系统 3.2财报与尽调助手–企业财报、现金流分析,偿债能力智能分析 对公信贷业务流程长,其间需要客户经理撰写大量文档,耗占大量生产力:✓文档:营业执照、财务报表、税务记录、征信报告等,形成KYC客户尽调报告、贷前信贷备忘录、信贷合同、贷后风险评估报告等; ✓在传统NLP方案基础上,借用大模型内容生成、推理能力与提示工程,自动生成报告,实现从co-polit模式到agent模式的提升;✓综合解决方案:结合传统自动化技术的结构化刚性,生成式AI的探索性流动性,服务于业务场景创新。 尽调助手:基于生成式AI的解决方案,江苏某城商落地 传统尽调报告:上一代NLP技术 集成LLM、OCR、规则引擎、指标分析引擎等技术,利用大模型开发平台构建Agent体系,财报数据准确率达95%以上,报告生成可接受率达85%以上,特别在财务比率自动化分析,行业基准值对标,偿债能力分析等,助RM提效60%以上。 大数据公司生成的尽调报告、信贷报告等,仅含公开信息,未能公、私域数据融合,难以迭代需求 3.3定价助手–NL2SQL技术,业务流程x数据驱动=利润提升 ✓某城商行使用提示词工程+LangChain组件搭建NL2SQL的数据查询助手,利用元数据和查询模板训练,实现自然语言交互的取数✓数据治理与数据质量是基础:某城商行实现“看得清、看得全、看的透”,构建了x用户标签、x项经营指标,x实时数据指标和标签 3.4会议助手+知识助手–实现一户一册,“事事有着落”抓风控 ✓在审结阶段,通过自动收集业务审批结论、流程中意见和审贷会会议纪要,通过大模型组织生成信贷审批书初稿;✓并支持用户通过提示语调整风格,用户只需简单修改即可作为最终审批书下发,大幅减轻审批书编写工作量;✓自动生成有关会议讨论的跟进事项,生成跟进任务,指派责任人跟进,并跟踪是否落实等。 3.5风控助手–小模型+大模型,科技金融做精做深,向专业行 经济下行,息差收窄,信贷质量质量面临压力。信贷管理的核心是风控:✓数智化风控:专家经验判断+模型算法、机器学习+迭代大模型逻辑推理能力,更全面风控 ✓某民营银行申请专利:普惠金融125个行业,补充上下游信息,完善产业链关系图谱,基于大模型开展客户画像工作,提效5倍。✓某互联网民营银行:利用大模型构建9条产业链图谱,识别超2100万家潜客,客户画像提效10倍,提升信贷覆盖率和满足度。✓双智协同:“幻觉”不可避免,大模型绘制的产业链图谱会向风控系统提供客户识别、经营评分和画像,最终仍由风控系统多维度交叉验证后,仍由人做决策。 4.1择法:4种组织运营模式 4.2择法:落地实施的“三个阶段” AIGC是一个新的“大航海时代”,挑战重重:缺人才,缺场景,成本高,风险高-有幻觉,我应该封闭等待,还是积极拥抱未知? 落地实施的三个阶段:✓AI筹备期,缓坡地貌:每天的日常,公有模型+公有数据辅助处理;右图的左下角象限,办公场景,生产力工具,嵌入式协同如代码生成 ✓AI的探索期,小径地貌:从0到1,尝试从低成本、高回报的业务用例出发,探索私有化部署,或有失败;进入前中台业务场景,流程重构✓规模化实施期,陡壁地貌:从1到N构建多场景、多应用,创新重塑业务;成熟期后,面向客户服务,甚至成为核心业务能力的一部分 4.3择法:有关大模型选择的“三个路径” 场景垂类专用大模型L2 通用基础大模型 L0 L1 •专业单模态大模型:单模态通用大模型–语义、语音、视觉、策略等•行业大模型部署:借力大型商业银行,发挥行业大模型优势,实现银行在理财、计量等专业场景的建设,同时降低重复训练算力资源投入。值得注意的是,通用大模型+知识库≠行业大模型。•借力:大型商业银行,金融科技公司输出 •模型:通用大模型,支持多模态,底座•部署:通用大模型+企业知识库,即完成企业自身大模型开发与工具链建设,包括企业向量知识库建设,在此基础上基于开源(甚至是多模态大模型)等通用大模型完成通用场景建设。•借力:大模型公司 •模型特点:按需快速引入满足特定业务场景、流程的端对端成熟解决方案,实现快速的业务价值。如行业内引入的开发大模型、测试案例大模型等。 •借力:借力行业解决方案提供商,或自研 路径之争的非共识:业数科融合MVPv.s.平台整体规划?开源与闭源?外购v.s.产学研用模式? 4.4择法:科技团队的“三个技术抓手” ✓抓手一检索增强生成RAG:利用嵌入(embedding),使大模型能基于给定的数据库来生成答案。系统首先到向量数据库检索出相关信息片段,之后再将问题和搜索到的信息片段传送给大模型,由大模型整合形成最终的对话式答案。 ✓抓手三微调:修改模型的参数,使得模型在有限提示词下,一次性生成答案的质量更高。精调模型需要更多的数据和一定的算力资源(需高算力芯片)。需关注轻量级fine-tune的模型的发展:LoRA, P-Tuning等 RAG,每个环节都有难点 ✓抓手二提示工程:利用强有力的提示词设计,使模型给出契合专业性要求的准确答案。利用LangChain把问题解决的长线逻辑和相关例子全部融入进去,使大模型能按照预设的步骤、思维链、回答格式来产生答案。 4.3择法:AIGC落地实施的RoI论证 部署生成式AI的成本估算模型:✓固定成本:上图蓝色,大模型成本,算力成本,应用开发成本等✓变异成本:上图粉色,数据,数据标注,并发用户,token长短,推理,持续优化的成本 实施原则:垂直应用为先,以私有化部署为主;与现有系统松耦合,由点及面分步实施;大模型、小模型、AI原生应用协同发展 4.4择法:AI-Ready的组织,人才是起点,高价值场景是突破点 痛点即突破点,难以找到适合的业务用例:✓52%的AI项目依然无法从原型验证转化为生产✓AI方案平均需要超过8个月才能从原型转化为生产 最大障碍:✓53%-缺少业务与技术领域的AI人才✓30%-尚未找到匹配的业务用例与价值✓14%-难于选择合适的大模型与培训 4.4择法:ALLIN AI?好奇→恐惧→尝试→接受 2023年3月启动AIGC技术调研2023年6月上科管会,科技牵头立项2023年7月第一次开源大模型部署2023年9月完成初次算力采购与部署2023年Q4客服、电销、贷后场景2024年5月多个AI助手应用上线 某民营银行近一年的AI历程 在2023年二季度开了三次合伙人会议,形成了共识即“大模型很重要”。10月份各部门骨开会讨论2024年的商用用例。花了整整半年的时间,团队自上而下、自下而上的在“要做大模型”上逐步达成了一致。“知道要做”和“动身去做”是两回事。 某咨询公司全员学AI 与人类大脑处理语言极其相似:1800-2000亿个神经元,GPT3.5: 2千亿参数;通过预测编码来处理语言,学习与适应等,多模态 Generative生成式:模型学习如何通过上下文预测句子中被Mask的单词;扩大语言模型的规模,可以显著提高零样本与小样本学习的能力. Pre-Trained预训练基础大模型预训练:万亿级低质量互联网数据+非监督学习算力:预训练,耗占了总体算力资源的98%微调:质量数据-全参微调SFT+人类标注RLHF Transformer模型Google-《Attention is All You Need》Transformer:向量的解码器与编码器算法族谱:BERT / GLM / GPT 预训练模型:是一个未加控制的“怪物”(图:修格斯怪物H.P. Lovecraft),训练数据来源于对互联网,其中可能包括点击诱导、错误信息、政治煽动、阴谋论或针对特定人群的攻击等内容 ➢沿革:深度学习,特定模型,模式识别→海量数据训练大模型,泛化能力,多模态NLP+CV+ASR+TTS+ML+DL+RL+GAN;➢行业:提前10年-尚不完美,足够强大;Gartner:处于膨胀期望的峰值,2-5年将被市场主流采用;启明创投:类似互联网的97-98年➢全球:麦肯锡-每年贡献“一个英国的GDP”-2.6-4.4万亿美元;2030-2060年间50%的知识工作者的工作将逐步被AI替代➢中国:大模型-282个;人才-41%@大学,清华领先;商业:+AI, AI+;市场规模:亿欧咨询预计到2030年,万亿规模 宏观: 是另一个区块链,元宇宙?还是第四次工业革命? 微观:对于银行,业务部门,个人生产力的意义与价值,拥抱AIGC 个人生产力常用:ChatGLM/gamma/讯飞