您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[清华大学]:2025年机器语言大模型赋能软件自主可控与安全可信报告 - 发现报告

2025年机器语言大模型赋能软件自主可控与安全可信报告

AI智能总结
查看更多
2025年机器语言大模型赋能软件自主可控与安全可信报告

背景 关键问题 智能化方案 典型应用 总结 背景-软件是网络空间的基石 01背景-需求1:软件生态面临自主可控难题 背景-需求2:软件生态面临安全可信难题01 背景 关键问题 智能化方案 典型应用 总结 关键问题-软件开发与安全 反汇编 问题总结02 背景 关键问题 智能化方案 典型应用 总结 03智能化解决方案:大语言模型 03现有大语言模型难以分析二进制程序(闭源软件) 机器语言是网络空间基石,但是缺少智能化解决方案 方案简介:大语言模型 关键技术突破 技术 数据 工程 ·自研机器语言模型训练方法完善的机器语言模型基础设施 全自动数据生成、标注、对齐优化模型设计,深刻理解机器语言,对齐人类专家 大规模机器语言-自然语言-源代码多模态对齐数据·100TB规模,业界公开数据<100GB 03关键技术1:融合领域知识的模型优化 修改模型设计,融入代码领域知识(指令语义、跳转关系等) jTrans:Jump-Aware Transformerfor BinaryCodeSimilanityDetection."/SSTA 2022 关键技术2:103基于对比学习的语义理解 利用对比学习技术,使得语义相似的二进制代码embedding接近 关键技术3:基于多模态学习的语义理解03 利用多模态技术,将语义空间与人类意图对齐,更准确地表示二进制代码语义 背景 关键问题 智能化方案 典型应用 总结 04Demo-颠覆工作模式的智能逆向分析 mlm01.com 将黑盒二进制程序变成白盒代码首次实现像人类专家一样理解二进制程序语义将专家从繁琐的底层代码分析中解放出来,专注高层分析任务 背景 关键问题 智能化方案 典型应用 总结 05软件自主可控、安全可信 拥抱人工智能智胜网络空间 https://mlm01.com