行业研究公司研究宏观策略财报招股书会议纪要海南封关低空经济 DeepSeek AIGC 大模型

武卓 AI软件布道师 - 赋能边缘实时 AI 推理的技术解密

信息技术2022-05-19DataFunSummit2022：大数据计算架构峰会杨***

AI智能总结

挑战

几乎每位深度学习工程师都面临在CPU上运行深度学习模型的性能瓶颈问题，即“运行在CPU上很慢”。

解决方案

OpenVINO™通过视觉推理优化、神经网络+NLP、音频等技术，提供从模型开发、优化到部署的全流程解决方案，支持CPU、GPU、VPU等多种设备，实现实时AI推理。

开发者旅程

开发：使用Model Optimizer将模型转换为优化后的中间表示（IR），支持FP32、FP16等数据类型。
优化：利用Post-Training Optimization Tool（POT）和Neural Network Compression Framework（NNCF）进行模型压缩，包括量化、混合精度、剪枝等技术。
部署：通过OpenVINO Runtime（Core）编译和运行模型，支持动态形状输入，并提供CPU、GPU等设备的自动插件选择。

关键功能

预训练模型：提供270+预训练和优化模型，涵盖PaddlePaddle等框架。
动态形状支持：允许模型处理不同形状的输入数据。
性能优化：通过配置优化（如CPU、GPU加速）提升推理性能。

应用案例

实时AI推理：以OCR为例，展示OpenVINO Runtime在CPU和GPU上的推理性能对比。
MQTT集成：通过MQTT将OpenVINO™推理结果推送给EdgeX Foundry，实现全流程部署。

实践指南

OpenVINO Notebooks：提供环境搭建、代码示例和教程，方便开发者快速上手。
Intel® DevCloud for the Edge：提供云平台，支持开发者自行尝试和优化模型。

性能基准

平台配置：测试配置包括Intel® Core™ i7/i5/i3处理器、不同主板、内存和操作系统，确保测试环境的多样性。
性能指标：测试结果基于FP32精度，批量大小为1，并发请求为4，性能因配置和使用场景而异。

结论

OpenVINO™通过全面的优化工具和部署方案，有效解决边缘实时AI推理的性能瓶颈，支持多种设备和框架，助力开发者高效部署AI应用。

武卓 AI软件布道师 - 赋能边缘实时 AI 推理的技术解密

点击免费查看完整报告

你可能感兴趣

hot

微软“ChatGPT全家桶”上线安卓，这家公司研发的平台利用AIGC技术进行多样化内容生产；这家公司为苹果提供LED光显产品及一体化解决方案，公司有望赋能MR空间视频拍摄及内容制作

未知机构2023-12-27

hot

计算机行业快报：华为发布五大AI发展战略，赋能全业务场景，解密达芬奇关键技术，引领AI生态走向成熟

信息技术

华金证券2018-10-11

hot

国君电子加码AI云服务器苹果云侧推理赋能AI端侧投资建议

未知机构2024-06-17

hot

国君电子加码AI云服务器苹果云侧推理赋能AI端侧投资建议

未知机构2024-06-18

hot

AI端侧系列推荐之九：加码AI云服务器，苹果云侧推理赋能AI端侧

电子设备

国泰君安证券2024-06-16