从“通用智能”走向“行业可信智能” 张成奇香港理工大学人工智能讲座教授深圳研究院院长 目录 ◼一、从通用大模型走向垂直领域应用:一场深刻的范式转变 ◼二、垂直领域的数据:“最有价值”,也“最难直接利用” ◼三、外挂知识库:当前垂直领域最现实的落地路径 ◼四、用基于数据的大模型补足知识的不足 第一部分:从通用大模型走向垂直领域应用:一场深刻的范式转变 一、从通用大模型走向垂直领域应用:一场深刻的范式转变 通用大模型的核心优势 垂直领域的本质挑战 广泛知识覆盖 极高专业性 极低容错率 基于海量互联网公开数据训练,拥有百科全书式的通用知识库。 需精准理解行业术语与业务逻辑,具备专家级深度。 回答错误可能导致经济损失、法律风险甚至人身安全事故。 强大生成能力 在自然语言处理上表现卓越,可流畅、连贯地生成高质量文本。 业务流程深 数据封闭性 知识迭代快 必须深度嵌入企业复杂的工作流中,而非独立存在。 核心业务数据属企业资产,严禁用于公开训练。 法规与技术标准更新迅速,模型需具备快速学习能力。 跨领域泛化性 无需针对特定任务微调,在各类不同任务上都能表现出良好的适应性。 “行业智能系统” 一、从通用大模型走向垂直领域应用:一场深刻的范式转变 垂直领域首先关注的不是“能回答”,而是“能答对” 司法领域 工业领域 金融领域 政务领域 医疗领域 错误的投资分析或风险评估可能导致巨大的经济损失。 错误的设备故障诊断或操作指令可能引发生产事故。 错误的法律条文解释或案例引用可能影响司法公正。 错误的政策解读或流程指引可能损害政府公信力。 错误的用药建议或诊断结论可能危及患者生命。 “能力优先”➔“可靠性优先” 这意味着,在评估垂直领域解决方案时,我们首先要问的不是“模型有多强”,而是“这个错误是否可接受?” 一、从通用大模型走向垂直领域应用:一场深刻的范式转变 高风险场景下,大模型必须从“生成能力”走向“可信能力” 通用场景关注·生成能力 关键升级:从“会表达”升级为“有依据、可验证、知边界”但即便我们明确了提升可靠性的方向,行业仍面临现实挑战:行业数据本身往往很难直接用于模型训练和应用。 一、从通用大模型走向垂直领域应用:一场深刻的范式转变 中风险场景:追求效率与可靠性的平衡 典型场景举例 场景特点 知识库查询员工查询制度检索流程规范 智能客服 错误影响可控 解答常见问题引导用户操作 错误通常仅降低效率或体验,不会引发严重的安全、合规或重大财务风险。 核心诉求 流程可干预 存在人工复核或后续修正环节,允许一定的容错空间与试错机会。 辅助内容创作生成文案初稿撰写新闻摘要 代码辅助生成非核心模块开发提供代码建议 成本与效率敏感 对部署成本、响应速度及整体处理效率有较高要求,性价比是重要考量。 一、从通用大模型走向垂直领域应用:一场深刻的范式转变 低风险场景:效率与创意优先 错误影响轻微 鼓励探索与创新 速度与多样性优先 错误主要影响内容的质量或趣味性,不会产生实际的财产或人身安全损失。 场景本身对标准化要求低,更需要多样化、有新意的内容输出。 快速生成大量不同角度的内容是核心目标,以此拓宽思路边界。 文学艺术创作 头脑风暴与创意激发 游戏内容生成 语言学习辅助 丰富游戏NPC对话、生成简单的任务文本或背景故事。 写诗、写故事、生成绘画或文案的灵感描述。 提供多轮次的对话练习、语法解释及口语纠错等。 为新产品构思名称、策划营销活动的金点子等。 核心诉求:快速、多样、有趣地生成内容,激发灵感,作为人类创造力的助推器。 第二部分:垂直领域的数据:“最有价值”也“最难直接利用” 二、垂直领域的数据:“最有价值”也“最难直接利用” 高质量样本少 保密性强 核心业务数据往往涉及商业机密、用户隐私甚至国家机密,无法对外公开或进行大规模流通,形成了天然的数据孤岛。 相比互联网上的海量通用文本,垂直领域中经过深度业务梳理、专业人工标注且符合高质量标准的行业数据样本数量极其稀缺。 知识分散且隐性 标准不统一 大量高价值的行业关键知识和业务逻辑,往往散落在非结构化文档、专家经验库和日常操作流程中,难以直接被算法利用。 不同企业、不同部门之间的数据存储格式、业务术语体系和接口规范往往差异巨大,缺乏统一标准,导致整合难度高、成本大。 因此,垂直领域的困境往往不是“没有数据”,而是“数据出不来、用不好、难治理”。 二、垂直领域的数据:“最有价值”也“最难直接利用” 行业数据建设的关键:不在于“多”,而在于“可用、可信、可治理” 时效性 可解释性 一致性 真实性 合规性 保证数据能够及时更新,快速反映最新的业务状态与行业动态。 统一数据格式、术语和标准,打破壁垒,消除组织内部的数据孤岛。 这也正是行业里最务实、最可落地的路径——“外挂知识库”诞生的现实土壤。 第三部分:外挂知识库:当前垂直领域最现实的落地路径 三、外挂知识库:当前垂直领域最现实的落地路径 1.知识资源整理 5.附带来源 3.精准检索 2.用户提问 4.生成回答 系统在结构化知识库中,快速查找与问题最相关的信息片段。 将检索到的信息作为上下文,传递给大模型,生成准确回答。 将企业内部文档、手册等处理并结构化存储到检索库中。 最终的回答会附上详细的信息来源链接或原文引用,确保可追溯。 用户针对特定业务场景或知识盲区提出具体的问题。 这相当于让模型从一个可能“凭印象和猜测回答”的“聊天者”,彻底转变为一个“基于证据和依据作答”的专业“研究员”。 三、外挂知识库:当前垂直领域最现实的落地路径 外挂知识库能显著提升可控性,但不是终点 主要价值与适用场景 局限性与挑战 ●显著降低幻觉:基于真实数据生成,大幅提升答案可靠性,避免模型胡编乱造。 不擅长复杂推理:难以独立完成需要多步逻辑推理、多主体博弈或深层分析的复杂任务。 ●增强可追溯性:可追溯回答来源,便于企业进行合规审核与责任追溯。 强依赖知识库质量:“垃圾进,垃圾出”,知识库的准确性与完整性直接决定了最终效果。 ●支持快速更新:无需重新训练模型,修改知识库内容即可快速同步知识更新。 难以覆盖隐性经验:无法模仿专家的直觉、隐性经验和跨领域的类比思维。 ●适用场景:智能客服问答、企业政策解读、金融/医疗合规查询等场景。 总而言之,外挂知识库有效解决了模型“知道什么”的问题,但无法完全解决“怎么理解、怎么判断、怎么执行”的问题。 第四部分:用基于数据的大模型补足知识的不足 四、用基于数据的大模型补足知识的不足 数据来源 基于数据的大模型补足了什么? 行业文档•业务流程•专家经验•标注样本•反馈数据 补足知识库的深层理解不足补足复杂场景下的推理判断不足补足行业任务中的执行能力不足补足实际业务中的场景适配不足 优化方式 指令微调•领域适配•偏好对齐•评测迭代 目标能力 术语理解•流程理解•任务执行•合规控制 四、用基于数据的大模型补足知识的不足 知识不足的具体表现(一):信息收集的不足 核心问题:大模型难以主动、精准地从海量、动态、非结构化的信息源中获取特定知识,获取能力存在明显短板。 信息源局限 搜索能力欠缺 无法像人类一样主动发起多轮、递进式的精准搜索来定位所需信息,难以处理需要“查资料”的复杂问题。 主要依赖于预训练数据截止日期前的公开互联网信息,对最新动态、内部文档、隐性知识覆盖严重不足。 信息整合困难 隐性知识盲区 面对来自不同渠道、格式各异的数据,难以有效进行交叉验证、去重和逻辑整合,易产生碎片化的回答。 对于仅存在于专家经验、企业内部操作流程、非正式沟通中的“隐性知识”,模型几乎无法触及和理解。 导致结果:模型因信息不全,极易产生“幻觉”,给出过时、片面甚至完全错误的回答。 四、用基于数据的大模型补足知识的不足 知识不足的具体表现(二):信息解读的不准 核心痛点:即使获取了完整信息,大模型也可能因缺乏深层的逻辑推理能力和语境感知力,导致对信息的“误读”与“曲解”。 02.上下文理解不足 01.字面理解偏差 容易望文生义,无法准确理解比喻、反讽、双关等复杂语言现象,仅停留在对文字表层含义的机械匹配上。 难以有效把握长对话或复杂文档中的上下文逻辑关系,极易出现“健忘”,导致回答内容前后矛盾、逻辑断裂或偏离主题。 03.专业术语误解 04.深层意图误判 对特定行业的专业术语、缩写词或领域“黑话”缺乏深度认知,无法精准把握其在特定专业语境下的真实含义。 缺乏共情与高阶推理能力,难以准确推断用户提问背后的真实意图、潜在需求或隐性诉求,导致看似回答了问题实则“答非所问”。 四、用基于数据的大模型补足知识的不足 知识不足的具体表现(三):知识关系的不确定 核心痛点:大模型擅长机械记忆孤立的知识点,但缺乏构建和运用知识间复杂、动态关系网络的深层理解力。 逻辑推理受限 缺乏常识推理 因果关系混淆 知识关联僵化 容易将“相关性”误认为“因果关系”,或在涉及多步逻辑链条的归因问题上出现逻辑跳跃与错误。 面对需要连续演绎、复杂归纳或跨领域类比的问题时,模型推理能力会快速衰减,难以完成长链路任务。 存储的知识间的联系较为固化和静态,难以根据新的上下文信息,灵活地调整和动态更新内部知识网络。 对于人类社会生活中显而易见、不言自明的常识性关联(如物理规律、社会伦理),模型往往无法进行有效直觉推理。 最终局限:模型在需要复杂逻辑推理、战略决策判断的高价值任务中表现受限,难以像人类专家一样提供具有洞察力和前瞻性的见解。 四、用基于数据的大模型补足知识的不足 垂直领域大模型的完成路径 以知识库保证回答“有依据”,以行业数据优化保证模型“能理解、会执行” 行业知识库 行业数据优化 通用模型底座 业务闭环 沉淀行业权威知识与业务规则,确保模型输出的内容准确、可追溯。 通过行业特有语料进行微调,使模型理解专业术语并具备业务逻辑推理能力。 提供基础的语言理解与生成能力,作为垂直模型的底层支撑。 结合真实业务场景与反馈,持续迭代模型,确保模型解决实际业务问题。 →真正可落地的垂直领域大模型 实现“懂行业、懂业务、能落地”的企业级AI应用价值 谢谢大家!