AI智能总结
演讲人:蔡华华院计算/大模型算法负责人 CONTENTS目 录 02 01 04应用案例 03 法律大语言模型的相关背景 1.法律大模型|语言模型发展阶段 FOUR 1.法律大模型|语言模型发展阶段 1.法律大模型|大语言模型在法律领域的表现 GPT-4表现“可与人类相媲美”,其在律师资格考试(UBE)分数超过90%考生。 ChatGPT在两项试题达到了合格率,其中一项还跟人类水平持平。 •这是文字这是文字 •这是文字这是文字•这是文字这是这是文字 THREE•这是文字这是文字 TWOONE 1.法律大模型|法律大语言模型 2023年8月,浙江大学、阿里巴巴达摩院和华院计算联合发布了法律大模型。 1.法律大模型|挑战 “幻觉” 知识融合不足 可解释性欠缺 法律任务通常需要数据驱动和知识指导相结合,通用的大模型在这方面的能力尚显不足。 在法律人工智能中,模型的可解释性至关重要。然而,大模型往往是“黑箱”操作,难以让用户理解其决策过程。 模型有时会生成不真实或虚构的法律内容和案例,误导用户。 知识图谱关联 法律大语言模型的训练和评估 2.训练与评估|领域数据收集 •收集了多源异构知识数据,不仅包含6种类型的知识:法条类、案例类、模板类、书籍类、法律考试类、法律日常问答类,我们还以法条和案件为中心节点构建了它们的关系图谱数据。 2.训练与评估|领域数据清洗 2.训练与评估|领域知识融入模型训练 2.训练与评估|参数调优和资源需求 2.训练与评估|法律大语言模型评测指标体系 2.训练与评估|法律大语言模型能力体系 法律大语言模型的应用框架 3.应用框架|华院RAG平台——本地专有知识融合 3.应用框架|华院RAG平台——性能优化 推理设计 根据应用场景的不同设计实时推理、批量推理以及异步推理,利用缓存策略和预计算来减少重复计算,提高系统响应速度。 模块化 数据处理模块、模型推理模块、知识管理模块、用户交互模块等。以确保系统的可扩展性和可维护性。 可解释性 提供推理结果的可溯源,便于用户理解和信任模型的输出。 分布式 交互反馈 可调度的分布式计算资源来处理海量数据和高并发请求 用户友好的交互界面,使用户能够提供有效反馈,将用户的反馈融入模型迭代和优化中,进一步提升模型的实用性和准确性。 3.应用框架|华院法律大模型——RAG知识检索增强 •将法条库、案例库、工作条例、相关政策等本地多源数据导入知识库,自动理解学习沉淀为知识,借助混合知识检索和大模型总结归纳的能力,精准回答特定业务场景的问题。 3.应用框架|华院RAG平台——本地专有知识融合 •利用认知智能引擎支撑检索知识增强(RAG)模块化、流程化,实现模型的快速迭代优化,对本地知识进行导入,理解,沉淀和管理,借助大模型总结归纳的能力,精准回答特定业务场景的问题。 3.应用框架|华院法律大语言模型 拴绳遛狗时,其他人逗狗,结果伤了人,狗主人该赔偿吗? 法律大语言模型的应用案例 法治决策 法治业务 4.应用案例介绍|赋能社会治理 法律大语言模型赋能 案情分析 法律文书生成 根据案件描述,结合知识库进行案情分析 根据案件描述,快速生成准确的法律文书 法律问答满足法律咨询等日常场景 法条推荐 根据案件描述,推荐相关的法条 4.应用案例介绍|类案推荐 发挥已完结案件剩余价值,将过往依托于工作人员办理的“经验之谈”转化为可全员可用的“利器”,依托数字档案中的“案例库”,借助自然语言处理和智能搜索技术,为基层工作人员提供相似案例作为参考依据,并利用大模型分析总结当前案例和推送案例的异同点,提高工作处理的效率和准确率。 4.应用案例介绍|判决文书生成 案例背景 法院案多人少,案件审理周期长,每个法官都有多个案件并行审理,法官庭审结束不能及时制作判决书,容易遗漏庭审细节。 解决方案 导入起诉状、答辩状、证据证物等材料,借助文本抽取算法理解材料内容,最终通过大模型总结归纳的能力,生成判决书。 价值成效 只需小幅修改,即可发布正式判决书,在提升精度的同时,大幅提升工作人员效率。 4.应用案例介绍|法条推荐 基层工作人员在办理过程中相对缺乏全面的法律知识,存在事项责任不清,办理效果不佳的情况,法律大模型可基于案件办理登记的案件细节,进行深度法律分析推理,给予相关智能法条推荐,同时也支持工作人员进行自定义法条检索,增强办理人员的权威性。 4.应用案例介绍|法律AI助手 •以法律大模型为大脑,数字人为载体,构建普及法律、化解矛盾、答疑解惑的法律AI助手。 针对性:借助RAG能力,轻松让大模型理解本地业务文档和知识,精准回答特定场景问题。 交互性:低延迟流式生成的数字人,支撑顺畅又智能的对话体验。搭载多样终端,带来更大想象空间。 4.应用案例介绍|小雪人法律智能助手 总结展望 内容总结 回顾了语言模型的发展:介绍法律大语言模型的训练评估、应用框架和应用案例; 技术发展 大法律语言模型将更加智能化和个性化,为法律领域提供更精准的解决方案,提高法律服务的效率。 隐私安全 在训练和使用大语言模型过程中,如何保护用户数据的隐私和安全是一个重要的挑战,需要采取有效的措施来应对。 华院计算技术(上海)股份有限公司 •以算法研究和创新应用为核心,着力发展认知智能技术,为社会治理,工业制造,生物医药,金融零售等行业提供智能化的产品和服务,推动行业智能化的转型和升级。 •致力于数学应用与计算技术发展,提供底层智能引擎,引领算法自主创新,实现数据的价值化,世界智能化。