登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
seedance2.0
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
从 AI 平台演进获得的十点架构启示 - 谷歌_王顺
信息技术
2022-11-02
ArchSummit杭州2022|全球架构师峰会
徐***
AI智能总结
查看更多
变与不变
: 训练和推理是AI的两大核心任务,平台演进需兼顾两者。
合二为一
: AutoML和定制化训练SDK统一,简化开发流程。
敏捷开发
: 可持续的集成/训练/部署/监控(CI/CT/CD/CM)是关键,工作流示意包括数据与模型管理、代码与配置、训练流水线、注册模型、服务包、服务日志等。
用户驱动
: 托管ScaNN满足企业客户需求,提升用户体验。
海纳百川
: PyTorch和TensorFlow框架相同优先级,2018年官方支持PyTorch,2020年Cloud TPU支持PyTorch/XLA,2021年Vertex AI提供预安装PyTorch的容器选项。
出类拔萃
: NAS搜索SOTA网络结构,以Image recognition为例,pyglove开源项目助力模型优化。
脱颖而出
: Reduction Server提高分布式训练效率,通过高带宽低成本的CPU-only VMs,在BERT-large MNLI finetune任务中,增加20个reduction server节点将训练吞吐量提升75%,成本每步降低42%。
八面玲珑
: 客户横跨多行业,包括Twitter、Spotify等。
独孤九剑
: 覆盖AI/ML全生命周期,提供端到端解决方案。
继往开来
: JAX和Pathways定义下一代框架和平台,JAX支持可组合函数变换,Pathways通过GPipe、GShard/GSPMD等技术实现高效训练。
你可能感兴趣
谷歌TPU架构演进趋势
-
2025-12-31
01-从NewSQL到全新的HTAP分布式架构演进-张潇
信息技术
ArchSummit北京2023|全球架构师峰会
2023-06-06
AI 无界,Kimi 万亿参数大模型的全球云网架构演进之路 Kimi 全球训推网络用云实践分享
信息技术
月之暗面
2025-09-26
服务性能可见性:从不同的网络架构中获得全面的见解
信息技术
GSMA
2020-06-05
03酷家乐多云架构演进和落地--王栋年
文化传媒
ArchSummit北京2023|全球架构师峰会
2023-06-06