AI智能总结
大模型赋能网安新范式,人工智能安全可信护航 关于绿盟科技 绿盟科技集团股份有限公司(以下简称绿盟科技),成立于 2000年 4 月,总部位于北京。公司于 2014 年 1 月 29 日在深圳证券交易所创业板上市,证券代码:300369。绿盟科技在国内设有 50 余个分支机构,为政府、金融、运营商、能源、交通、科教文卫等行业用户与各类型企业用户,提供全线网络安全产品、全方位安全解决方案和体系化安全运营服务。公司在美国硅谷、日本东京、英国伦敦、新加坡及巴西圣保罗设立海外子公司和办事处,深入开展全球业务,打造全球网络安全行业的中国品牌。 版权声明 为避免合作伙伴及客户数据泄露 , 所有数据在进行分析前都已经过匿名化处理 , 不会在中间环节出现泄露 , 任何与客户有关的具体信息,均不会出现在本报告中。 01 新趋势:ChatGPT 技术加速安全革命5 02 新范式:安全行业大模型核心框架8 2.1 安全模型发展面临困境92.2 安全模型的研究新范式102.3 安全行业大模型的升级技术112.4 安全行业大模型的分层框架13 03 新技术:安全行业大模型关键技术17 3.1 数据增强:高质量安全语料双飞轮183.2 训练加速:高效并行加速增量训练193.3 任务微调:安全下游任务高效微调203.4 推理加速:多维优化推理任务加速213.5 内容管控:人机对齐内容安全管控223.6 工具协同:复杂任务安全工具学习243.7 私有部署:安全模型私域私密交互25 04 CONTENTS新实践:安全行业大模型赋能应用274.1 研究:专业沉淀,智能问答28 4.2 情报:信息整合,情报挖掘334.3 攻防:模拟演练,辅助决策394.4 运营:人机协作,提升效率51 05 新安全:大模型安全风险与防护策略5.1 大模型安全框架625.2 大模型安全风险645.3 大模型安全防护策略68 06 结语75 07参考文献 77 执行摘要 在ChatGPT呈现全球现象级热度时,通用大语言模型(Large Language Model, LLM)技术成为了推动创新和变革的关键驱动力。但由于安全行业的特殊性和复杂性,LLM并不能满足其应用需求。因此,绿盟科技基于“人工智能+安全”多年积累的安全专业经验和高质量数据,稳扎稳打地推出安全可信的安全行业大模型(Security Large Language Model, SecLLM)。SecLLM目标是智能化解决攻防实战场景中所面临的复杂安全问题,提供更专业、高效和定制化的威胁应对和安全防御能力,更好地满足安全行业的特殊需求,为安全行业提供量身定制的大模型解决方案。 绿盟科技同步推出安全行业大模型技术白皮书《大模型赋能网安新范式,人工智能安全可信护航》,分享绿盟在SecLLM研发过程中所积累的最佳实践和经验教训,并探讨其在安全领域的重要性和价值。本技术白皮书从SecLLM的研究新趋势、新范式、新技术、新实践和新安全几方面展开探讨。主要观点如下: ●大模型赋能网安新范式:SecLLM应用于安全行业,充分利用其强大的学习和适应能力,能够在复杂的攻防实战中逐步学习并提升威胁检测和防御能力,为网络安全提供更智能和更高效的解决方案。SecLLM引领了一系列技术突破,解决了传统安全方法在应对复杂威胁和新型攻击时的局限性,为安全行业带来崭新的发展方向和范式。 ●高质量数据助力成功落地:安全行业真正有价值的安全数据和知识无法从公开渠道获取。绿盟科技所特有的安全经验、知识和数据的积累,有助于训练大模型更好地理解和学习各种安全特征和行为模式,从而提高威胁检测和防御的准确性和效率,更好地适应 特定的安全需求。 ●实战化攻防推动学习成长:SecLLM实践出真知,从实验室走入实战化的安全攻防场景中,参与常态化的安全运营,辅助安全监测中复杂问题的解决。通过不断助力解决实际难题,促进SecLLM自我学习和安全能力的持续提升,增强其在实际应用中的可靠性和实用性。 ●人机协作增强安全动能:SecLLM转化为安全人员的“伙伴”,快速融入已有的智能安全运营、威胁情报分析、零日攻击和新型威胁应对等日常安全处置工作流中,提升安全信息处理和分析、智能安全建议和反馈等能力,与安全人员紧密协作,共同应对不断升级的安全威胁。 ●云端服务结合本地部署:SecLLM提供云端服务和本地私有部署两种方式。云端MaaS服务享受节约资源、简化管理和覆盖全球等优势;本地化部署提供了更高的定制性、控制权和数据隐私保护。两种方式可以相互配合或独立应用。 ●人工智能护航安全可信:大模型自身安全的保障是应用LLM和SecLLM等大模型的必要条件,保护用户隐私和数据安全,防止大模型被滥用,预防新型攻击和未知威胁,从而保障大模型自身的安全可靠性,推动SecLLM成为安全护航的可信之选。 绿盟科技将持续投入研发和创新,不断优化SecLLM的功能、性能和自身安全性,提供更具创新型和实用性的安全解决方案。SecLLM作为每一个用户定制化的安全协作“伙伴”,致力于成为各行业持久可信的安全护卫。在该过程中,绿盟科技愿意贡献自身能力,与各行业合作伙伴共同应对日益复杂的安全挑战,携手促进安全行业大模型生态建设。通过积极交流合作,共享安全专业知识和技术经验,共同促进“人工智能+安全”的加速发展。 术语和定义 人工智能(Artificial Intelligence,AI):是计算机科学的一个分支领域,旨在研究和开发能够模拟、模仿和执行人类智能活动的技术和系统,使其具备像人类一样的智能。人工智能按发展程度可以分为狭义人工智能、通用人工智能和超级人工智能。 通用人工智能(Artificial General Intelligence,AGI):是指一种具有类似于人类智能的智能系统。它具有感知、认知、思考、学习和创造等能力,能够在各种不同领域和任务上表现出类似于人类的智能水平。 大语言模型(Large Language Model,LLM):是指具有巨大参数量和复杂结构的自然语言处理模型。这类模型利用深度学习技术,能够在大规模的文本数据上进行预训练,并通过微调等技术完成各种自然语言处理任务。 行业大模型(Industry-specific Large Model):是基于特定行业的大规模数据构建的大模型。学习特定行业的特征和规律,以实现在该行业中高准确性和可靠性的分析和预测,能够更好地适应特定行业的需求。 预训练语言模型(Pre-trained Language Model,PLM):是指在大规模语料库上以无监督方式进行预训练的语言模型。在大量的未标记数据上进行预训练,大模型得以学习数据的内在表示和特征。 微调(Fine-Tuning,FT):是指基于已经训练好的预训练语言模型,在有标注数据上进行有监督的学习。目的是让模型通过学习激活特定能力以适应特定的任务和场景。 推理(Model Inference,MI):是指使用训练好的模型对新的数据进行预测或分析的过程。目的是模型应用于实际任务中,利用其学习到的能力,快速、高效地对未知数据进行计算和处理,以获得预测的结果。 模型即服务(Model as a Service,MaaS):是指基于云计算提供一种将人工智能模型转换为可重复使用服务的方式,实现模型的快速部署、弹性伸缩和按需使用,允许用户不需要硬件设备和专业技能情况下可以使用模型。 人工智能安全(Artificial Intelligence Security):是指针对人工智能算法和系统在设计、实现、训练和应用等全生命周期中可能面临的各种风险和威胁进行安全防护,促进人工智能的可靠、可控、可信和可持续发展的过程。 新趋势:ChatGPT 技术加速安全革命 ChatGPT爆火背后的推动力是通用大语言模型(Large Language Model, LLM)。LLM是指具有巨大参数量和复杂结构的自然语言处理模型。这类模型是深度学习在自然语言处理领域的典型技术范式,能够在大规模的文本数据上进行预训练,并通过微调等技术完成各种自然语言处理任务。“读书破万卷,下笔如有神”在一定意义上反映了LLM的运作模式。LLM是具备强大表示能力和广泛适用性的模型,一个模型就能够处理各种自然语言处理任务。LLM的关键发展可以追溯到2018年,彼时Google推出了BERT模型。BERT采用了预训练加微调的方法,通过在大规模数据上进行预训练,模型学习到了广泛的语言知识,然后在特定任务上微调模型参数。BERT在多个任务上取得了优异的表现,引发了全球各大公司、研究机构对通用大模型的普及应用。同时,ChatGPT作为现象级的LLM,为学术界和工业界呈现了一种通用大模型技术实现的技术路径。ChatGPT的发展(图1)经过了多个版本的技术迭代演化,在保持Transformer核心特征抽取结构框架的同时,模型的整体参数规模、训练数据规模呈现爆炸式增长。现阶段,典型LLM的参数规模已达到千亿级别。这些模型不仅在表现上超越了之前的模型,同时也具备更高效的训练和推理能力,可以处理更加复杂的任务。 随着模型参数规模和训练数据规模的爆炸式增长,通用大语言模型LLM的涌现能力 (Emergent Ability)凸显。相对于经典规模尺度较小的机器学习或深度学习模型,LLM在上下文学习(In-Context Learning)、复杂推理、知识容量、泛化性等方面的能力大幅提升。那么,这些提升的能力是否能够成为LLM在安全行业的应用潜能呢?具体包括: ●知识语义增强:通过在大规模通用文本数据上进行训练,LLM得以掌握广泛的语言知识和语义理解能力。相较于小模型,LLM能够更全面地理解词汇、句法和语用,生成的文本更加准确、连贯,同时保留了语义特征。在安全行业中,知识语义增强有助于理解和分析安全领域特定的数据内容,如安全威胁、漏洞、攻击技术等相关知识和安全语义,从而更为准确地识别风险、提供建议或生成报告。 ●逻辑分析增强:LLM可以理解和应用逻辑原则来推理和分析输入文本中的信息。相较于小模型,LLM经过训练可以更好地理解和应用逻辑规则,能够产生更为合乎逻辑的输出结果。在安全行业中,逻辑分析增强可以更好地分析不同事件之间的关系、理解上下文相关性、挖掘潜在的威胁情报等,进一步推断可能的攻击路径和攻击团伙,并分析推荐可采取的安全措施。 ●交互决策增强:LLM在与用户的交互过程中表现出更高水平的决策能力和响应性能。相较于小模型,LLM可以更好地根据输入的上下文和目标指令,综合利用所学习到的语言知识、语义理解能力以及可能的逻辑推理和决策策略,生成更智能和个性化的回复,这使得LLM在对话系统、问答系统中具备更强的交互决策能力。在安全行业中,交互决策增强提供与安全专家、分析师等不同角色进行智能交互,更好地理解不同需求并提供个性化的安全指导和辅助决策,协助安全团队开展应急响应和威胁管理等工作。 LLM的通用知识语义、逻辑分析和交互决策这三个增强能力在安全行业中具有重要作用,有助于提升安全系统的感知、分析和决策能力。通过从特殊的安全数据中提取关键信息、识别潜在威胁,并能够提供恰当处理建议,LLM可以进一步提高安全系统的效率和准确性,使其能更好地应对不断演变的安全威胁。随着LLM技术的不断创新发展,有望推动安全行业向智能化和自动化的方向发展,从而提升网络空间的安全性和可信度。 新范式:安全行业大模型核心框架 本章首先介绍安全模型的发展困境和研究新范式,接下来阐述安全行业大模型的必要性和创新价值,并深入分析安全行业大模型的升级技术和分层框架。 2.1安全模型发展面临困境 安全模型发展面临多重困境,其中包括威胁演化速度快、数据量和复杂性增加、数据偏差和不均衡,隐私和合规性问题、自适应能力缺乏,以及对抗攻击挑战等。克服这些困境对于推动安全行业的发展具有重要意义。 传统安全模型如机器学习小模型已在网络安全中得到了部分应用,但是其发展却不尽人意。《Dos and Don'ts