公司概况
Marvell 是一家成立较早的公司,在 2021 财年实现 30 亿美元的营收,员工遍布全球,并在美国、以色列、印度、德国和中国设有研发中心。公司提供领先的数据基础设施产品线,涵盖存储自定义 ASIC、计算、光纤通道 HBA、安全解决方案、数据处理器组件 (DPU)、硬盘控制器和前置放大器、SmartNIC、以太网 PHYs、以太网开关、DCI 光学模块、汽车以太网高速光电 (PAM4 DSP、相干 DSP、TIA、驱动器和硅光子学)、闪存 SSD 控制器和 NVMe 加速器。
主题介绍
机器学习和人工智能在网络上已广泛应用,但主要用于网络自身的情况较少,且通常围绕专用、封闭的解决方案构建。开放接口和智能特征提取将推动 AI/ML 在网络领域的应用,通过结合网络设备与 AI/ML 解决方案实现分解。
议程
- 示例用例:高速率异常检测
- AI/ML 用于联网的用例
- OCP 在 AI 网络中的作用
- 用于网络的 AI/ML 工具
AI/ML 用于应用程序分类
通过监督学习将流量分类至应用程序,处理加密数据包,为分类的流量分配服务类别(CoS)配置文件,并为不同应用程序分配访问控制列表(ACL)规则。
AI/ML 用于异常检测
识别网络中的异常行为,如恶意流动、拒绝服务攻击、设备故障、配置错误导致异常行为和内容盗窃。异常检测可以基于监督和无监督学习。
用于自动化网络的 AI/ML
分析复杂和大型日志文件,关联事件以识别网络故障和配置错误,进行网络规划和配置,以及基于设备识别关于交通行为。
用于联网的 AI/ML 工具
- 集中式 AI/ML:共享资源并为许多网络设备提供服务。
- 分布式 AI/ML:更接近数据源,需要对网络行为进行连续和实时的 AI/ML 监控。
智能特征提取
每秒 AI 操作远小于每秒网络数据包,智能特征提取启用连续交通推断。需要远程和本地 AI 引擎,以及智能连续特征提取特征提取器和快速管道。
OCP 在 AI/ML 中的作用
- AI 应用程序 (NOS)
- SAI API:标准功能提取器、HW 加速器、SAI 驱动程序和特定于供应商的特征提取器快速管道。
- 增强 SAI TAM 2.0:以解决 AI 用例,包括数据格式优化/压缩的数据结构和数据传输的触发器。
- SONIC AI 应用程序:构建 AI 应用程序作为 Sonic 的一部分。
数据缩减技术
- 流量特征:75% 的流量是 4 个数据包或更小,85% 的数据包是从流量更大超过 1000 个数据包。
- 数据缩减:仅分析所有流的前 N 个数据包,当 N = 4 时,将监控的流量减少到约 5%。
- 交通签名:连续队列或流行为监控,通过基于数据包大小和数据包到达时间的智能统计创建流签名,提供流量模式的压缩表示。
开放 AI/ML 网络模型
- 网络日志:由 AI 机器处理相关事件的商定数据结构取代人类得出结论。
- 流分类:良性的特征和恶意流。
- IOT 设备签名:ONNX 型号设备识别和正常行为。
示例用例:高速率异常检测
- 异常检测框架:数据包捕获、数据包解析器、特征提取器、异常检测器、减少的事件、Flow 分类、智能统计、N:1 已更新特征提取器、Feature 映射器、合奏的自动编码器、新型特征提取器 (NFE)。
- 自动编码器模型体系结构:编码解码、输入图像、重建图像、潜在空间、神经元、隐藏层。
- 神经网络集成:一个神经网络输入统计信息。
试验台推理阶段
- 识别异常:在传感器行为中培训阶段已经完成,运行正常的交通、Wireshark、Port 镜像、目标其余网络(引起噪音)、正常 - 异常 1 - 不同的相机设置、异常 2 - 向相机发送的流量、异常 3 - 潜在的未经授权的客户端消耗流量。
异常检测 - 试验台结果
- 异常重建损失 (MSE) > 阈值。
- 正常重建损失 (MSE) < 阈值。
总结
用于联网的 AI/ML 有许多令人兴奋的用例,如异常检测。联网设备为 AI 处理提供智能简化的统计/遥测,OCP 定义网络之间的开放接口,设备和 AI 引擎在高速网络中可以进行准确和高性能的异常检测。