淘宝端计算平台介绍
一、整体架构
淘宝端计算平台是一个面向端侧算法任务的一站式研发平台,包含基于Python的多端一致计算容器及计算框架、端云数据通道以及任务发布和管理控制台。该平台旨在解决云计算在端侧应用中的实时响应延迟、数据隐私安全、传输量大和云端资源消耗大等问题,通过端侧计算和存储实现实时响应、保护隐私并提升移动终端算力。平台整体架构包括端计算统一高效的计算环境、灵活的发布实验策略、便捷的研发调试能力,以及端计算任务管理与调度基础能力。
二、计算环境
平台采用MNN推理引擎和AliNN Python VM。MNN推理引擎支持TensorFlow、Caffe、ONNX等主流模型格式,支持CPU、GPU、NPU,并具备高性能和易用性。AliNN Python VM精简了Python环境大小,支持多线程并发执行,提升了端侧计算效率。
三、研发运维
平台基于Git进行任务组织,支持分支、版本和标签管理。研发流程灵活,支持统一和定制化的任务发布策略,包括设备类型、APP版本、用户属性等。调试运维基于MNN工作台进行开发和真机调试,提供高效的研发和运维支持。
四、计算框架
平台提供复杂用户行为的端侧计算能力,通过数据标准计算框架管控平台实现数据定义、数据操作、计算模式、辅助功能等。框架基于用户行为流/树和任务触发机制,支持数据标准、特征计算和特征监控,解决了复杂用户行为计算、数据种类增多和场景语义缺失等问题。
五、业务实践
平台在淘宝端上信息流推荐系统中得到应用。通过端计算框架/MNN引擎和用户行为特征采集,实现实时推荐系统生成推荐结果。业务效果显著,大促GMV提升10%以上。
六、总结展望
平台未来将朝着更高效、更精细、更稳定的方向发展,提升任务研发效率、计算环境效率、任务管控粒度、数据管控粒度,并加强计算与数据监控、系统与资源监控。