行业研究公司研究宏观策略财报招股书会议纪要 seedance2.0 低空经济 DeepSeek AIGC 大模型

AI 生成代码的网络安全风险

信息技术2024-11-01CSET陈***

AI智能总结

核心观点

AI 代码生成能力提升：大型语言模型（LLMs）在生成功能性计算机代码方面的能力显著提升，被广泛应用于软件开发领域，提高生产力并带来积极影响。
AI 代码生成风险：然而，AI 代码生成也带来网络安全风险，主要体现在三个方面：
- 生成不安全代码：AI 模型可能生成包含漏洞的代码，如缓冲区溢出、内存泄漏等，可能被恶意利用。
- 模型易受攻击：AI 模型本身易受攻击，如数据中毒攻击、后门攻击等，可能导致模型行为异常。
- 下游网络安全影响：AI 生成的代码可能进入开源仓库，影响未来模型的安全性；此外，AI 工具的普及可能导致技术债务增加、劳动力市场变化等问题。
评估挑战：评估 AI 代码生成模型的安全性面临挑战，包括编程语言差异、模型类型多样性、评估工具和基准缺乏、提示影响、随机性和可重复性问题、人机交互复杂性以及实验方法学差异等。
研究方法：本研究评估了五种代码生成模型（GPT-4、GPT-3.5-turbo、Code Llama 7B Instruct、WizardCoder7B 和 Mistral 7B Instruct）生成代码的安全性，使用 ESBMC 代码检查器检测漏洞。
研究结论：
- 高错误率：所有测试模型都存在较高的验证失败率，约 48% 的代码片段包含可能导致恶意利用的错误。
- 模型差异：不同模型之间存在显著差异，Mistral 模型错误率较高，Code Llama 模型生成代码能力较弱。
- 严重漏洞：生成的错误往往较为严重，如缓冲区溢出和解引用失败等。
政策影响：
- 软件供应链安全：AI 代码生成模型的应用可能对软件供应链安全构成风险，需要建立相应的风险管理框架。
- 多方责任：减轻 AI 代码生成风险需要 AI 开发者、工具提供商、用户和政策制定者等多方共同参与。
- 安全最佳实践：应将现有的安全最佳实践应用于 AI 代码生成，如安全软件开发生命周期和 NIST 网络安全框架。
- 模型评估：需要开发更完善的模型评估基准，评估模型生成安全代码的能力。
进一步研究方向：未来研究应关注模型性能与安全性的关系、训练数据的安全性、模型评估方法、用户自动化偏差、技术债务影响、现有安全最佳实践的适用性等问题。

AI 生成代码的网络安全风险作者 Jessica JiJenny Jun Maggie Wu Rebecca Gelles 执行摘要近期的发展提高了大型语言模型（LLMs）和其他人工智能系统生成计算机代码的能力。虽然这对软件开发领域来说是个积极的信号，但这些模型也可能直接或间接地带来网络安全风险。在本文中，我们识别了与AI代码生成模型相关的三大类风险：1) 生成不安全代码的模型；2) 模型本身易受攻击和操纵；3) 下游网络安全影响，如训练未来AI系统时产生的反馈循环。现有研究显示，在实验条件下，AI 代码生成模型经常输出不安全的代码。然而，评估 AI 生成代码的安全性过程极为复杂，并包含许多相互依赖的变量。为进一步探索不安全的 AI 编写的代码的风险，我们评估了五种语言模型生成的代码。每个模型都收到了相同的提示集，这些提示旨在测试可能产生错误或不安全代码的常见场景。我们的评估结果显示，这五种不同模型生成的代码片段中几乎有一半包含往往具有重大影响且可能导致恶意利用的错误。这些结果仅限于我们评估的狭窄范围，但我们希望它们能够为围绕AI 代码生成模型影响的研究贡献力量。鉴于当前代码生成模型的实用价值及其能力未来继续改进的可能性，管理其政策和网络安全影响至关重要。关键发现如下。 ● 行业采用AI代码生成模型可能对软件供应链安全构成风险。然而，这些风险在各组织之间的分布将不均匀。资源更为丰富、规模更大的组织将比面临成本和劳动力约束的组织更具优势。 ● 多方利益相关者在减轻与AI生成代码相关的潜在安全风险方面都扮演着重要角色。确保AI生成代码输出的安全性不应仅依赖于个别用户，还应包括AI开发者、大规模生产代码的组织以及能够提升整体安全性的政策制定机构或行业领导者。现有的指导原则，如安全软件开发生命周期实践和NIST网络安全框架，仍然是确保所有代码（无论作者是谁）在进入生产环境前都经过安全性评估的基础。其他网络安全指导原则，如“设计即安全”原则，可以进一步扩展应用。包括影响软件供应链安全的代码生成模型和其他 AI 系统。 ● 代码生成模型也需要从安全角度进行评估，但目前这方面的评估较为困难。现有的代码生成模型评估基准通常侧重于模型生成功能性代码的能力，而不评估其生成安全代码的能力，这可能会导致在模型训练过程中优先考虑功能而非安全性。由于缺乏对模型训练数据的透明度或对其内部工作机制的理解，无法探索诸如表现更好的模型是否会产生更多不安全代码这类问题。目录执行摘要 .......................................................................................................................................1 引言 ...................................................................................................................................................4 背景 ...................................................................................................................................................5 什么是代码生成模型？............................................................................................................5 行业对AI代码生成工具的采用不断增加..............................................................................7 与AI代码生成相关的风险.....................................................................................................9 代码生成模型生成不安全的代码 ....................................................................................9 模型的攻击脆弱性....................................................................................................................11 下游影响......................................................................................................................................13 评估代码生成模型安全性面临的挑战..............................................................................15 AI生成的代码是否不安全？....................................................................................................18 研究方法......................................................................................................................................18 评估结果......................................................................................................................................22 验证失败率..............................................................................................................................22 不同模型之间的差异............................................................................................................24 生成错误的严重程度..............................................................................................................25 局限性............................................................................................................................................26 政策含义和进一步研究......................................................................................................28 结论 ..................................................................................................................................................32 作者 ....................................................................................................................................................33 致谢 .......................................................................................................................................................33 附录A：研究方法.....................................................................................................................34 附录B：评估结果.......................................................................................................................34 参考文献 .................................................................................................................................................35 Introduction 人工智能的进步导致了AI系统生成功能性计算机代码能力的飞跃。尽管大型语言模型的进步在过去几年推动了对AI的广泛关注和投资，但代码生成一直是AI系统的可行应用场景。专门的AI编码模型，如类似于“代码自动补全”的代码填充模型，以及通用型基于LLM的基础模型，目前正被用于生成代码。越来越多的应用程序和软件开发工具将这些模型整合进来，以供更广泛的用户群体轻松获取和使用。这些模型及其相关工具正迅速被软件开发社区和个体用户采纳。根据GitHub 2023年6月的调查，受访的美国开发者中有92%表示在工作内外使用AI编码工具。1另一个于2023年11月进行的行业调查显示，使用率非常高，96%的受访开发者使用AI编码工具，超过一半的受访者几乎总是使用这些工具。2如果这种趋势继续下去， LLM 生成的代码将成为软件供应链中不可或缺的一部分。人工智能代码生成政策挑战在于，这一技术进步虽然带来了实际益处，但也可能对网络安全生态系统带来潜在系统性风险。一方面，这些模型可以在漏洞发现和修复等领域显著提高工作效率，并对网络安全产生积极贡献。另一方面，研究显示这些模型也会生成不安全的代码，如果未经适当审查便被整合，将直接构成网络安全风险；此外，不安全的代码还可能进入开源仓库，进而影响后续模型的安全性，带来间接风险。随着开发者越来越多地采用这些工具，软件供应链各个环节的相关利益方都应考虑广泛使用由AI生成的代码所带来的影响。AI研究人员和开发人员可以从安全性的角度评估模型输出；程序员和软件公司可以考虑这些工具如何融入现有的安全导向流程；而政策制定者则有机会通过制定适当指南、提供激励措施和支持进一步研究来应对与AI生成代码相关的更广泛的网络安全风险。本报告概述了由AI生成的代码可能带来的网络安全风险，并讨论了社区内剩余的研究挑战及其对政策的影响。

点击免费查看完整报告

你可能感兴趣

AI 生成代码的网络安全风险

核心观点

你可能感兴趣

人工智能行业双周报：宁夏印发促进AI发展相关政策，Meta开源代码生成模型Code Llama

AI动态汇总：上交AI智能体表现亮眼，AlphaEvolve生成代码反超人类20250707

协同生成 AI 、低代码和无代码实现创新

2024年中国AI代码生成市场报告

代码生成Copilot-大语言模型在真实开发场景下的实践