登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
稀土
低空经济
DeepSeek
AIGC
智能驾驶
大模型
当前位置:首页
/
行业研究
/
报告详情
Windows 和 Azure 中的多层内存
信息技术
2022-06-24
2021 OCP Global Summit 会议
小***
AI智能总结
查看更多
Windows 和 Azure 中的多层内存
Windows 中的多层内存
多层内存分类
:
通用存储器
:当前系统上的可用内存,可由任何人分配,性能等同于或相当于 NUMA 节点的 DDR DRAM DIMM。
专用内存
:仅通过专用 API 可用,不影响系统提交,具有不同于一般的性能特点,如更低或更高的性能。
专用内存的发现
:
通过 ACPI 报告性能特征(HMAT 表、ACPI SRAT 中的纯内存 NUMA 节点)。
系统上的专用内存标记为预留或特殊专用内存。
专用内存的软件发现
:
系统可以有多种专用内存类型,每个类型有独特的属性组合。
新 API 用于枚举可用类型、报告性能特征(读/写延迟和带宽)。
专用内存的使用
:
OS 内存管理器中的潜在用法:
备用页面的辅助存储。
更快的页面文件。
用于压缩内存页的辅助存储。
Azure 中的多层内存
多层存储器的潜在场景
:
Microsoft DeepSpeed 和 Zero Infinity 软件堆栈
:
管理不同类别的媒体。
在 Zero-Infinity 上运行无需模型代码重构。
研究与微软亚洲研究院合作。
Zero-Infinity 的优势
:
AI 模型击中内存 Wall
:
GPU 内存大小无法随 AI 模型扩展,特别是自然语言训练。
利用另一层更慢、更便宜的大型媒体。
高级架构
:
拆分训练任务、调度并跨不同类别的介质(GPU 内存、CPU 内存和 NVMe)传输数据。
无需模型代码重构。
线性缩放 AI 模型
:
通过用远内存代替 DRAM 获得更好的 COG(更便宜,更慢)。
示例工作负载:机器学习的纯内存应用程序,严重依赖内存缓存。
使用 Windows 操作系统将 DRAM 中的冷内存页交换到远内存,对应用程序透明。
工作负载配置文件延迟百分位数:
32 个线程;内存已提交 ~150GB。
延迟:2500(远内存) vs 2000(DRAM)。
总结
趋势
:
Azure 对使用多层内存感兴趣。
优化现有服务,为客户创造新服务。
具有多层内存的系统即将到来。
需要工作
:
利用新硬件需要进一步研究。
你可能感兴趣
Linux 和 Windows - Bates - Christiansen 中的 PM 支持
信息技术
PM Summit 2019 持久化内存峰会
2022-06-24
【电报解读】微软在Windows 11设置中测试其AI智能体,机构称模型迭代和技术进步将继续利好AIAgent应用,这家公司将于下周发布AI智能体
未知机构
2025-06-16
电驱动石墨烯多层介质中的空间孤子
基础化工
Nature
2022-06-29
APT10 : 在 A41APT 活动中发现的复杂的多层装载机 Ecipekac
信息技术
卡巴斯基
2021-03-30
现代人工智能PC设计:介绍Windows和Copilot+ PC的未来
信息技术
Insight
2024-08-13