登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
稳定币
低空经济
DeepSeek
AIGC
智能驾驶
大模型
当前位置:首页
/
行业研究
/
报告详情
黄泓 - Akulaku 智能计算系统及应用
信息技术
2022-05-18
DataFunSummit2022:大数据计算架构峰会
墨
AI智能总结
查看更多
Akulaku智能计算系统及应用
背景
Akulaku
是一家专注于海外市场的互联网金融服务提供商,服务内容包括网上购物和分期付款、现金贷、保险等。
主要应用场景包括金融风控、电商智能客服和电商推荐。
难点
高吞吐量与低延时
:需要快速响应数据变更,保证实时性。
逻辑一致性
:确保线下分析和线上部署逻辑一致。
特征和模型类型
:涉及时间窗口类、群组关联类、关联关系类、机器学习模型和深度NLP模型等。
架构与案例
特征计算方式
:分为场景驱动和数据驱动两种。
场景驱动
:在调用时计算,适用于现用现算。
数据驱动
:数据变更时计算,调用和计算解耦。
案例一:时间窗口
需求
:近XX天的订单个数。
方法
:
Flink滑动窗口
:存在步长与窗口大小不匹配的问题。
基于FlinkCDC的方案
:使用中间存储保存窗口表,FlinkCDC捕捉变更计算结果。
FlinkSQL的方案
:使用优先队列和MapState管理数据过期数据的出窗。
性能对比
数据量:10亿/天。
openmldb集群配置:3x256G三节点。
延时:4毫秒左右。
性能基本相当。
场景驱动 vs 数据驱动
场景驱动
:实现简单,线上线下容易保持一致,但硬件依赖性强。
数据驱动
:业务调用时间与计算时间无关,但复杂性和一致性问题较多。
Ray应用
自动特征工程
:利用AutoML、迁移学习等技术快速上线/更新模型。
模型推理决策系统
:基于Ray的动态图actor调度实现大规模在线学习式推理任务或AB测试类推理任务。
总结
场景驱动和数据驱动各有优势,选择取决于具体应用场景。
Ray作为轻量级的Python分布式框架,可作为机器学习平台的底座,支撑特征生成模型。
查看更多
你可能感兴趣
合作式智能运输系统 车用通信系统应用层及应用数据交互标准 (第二阶段)
智能交通产业联盟
2020-09-24
电子行业跟踪报告:英伟达推出新一代计算架构,关注AI算力及应用部署
电子设备
万联证券
2024-03-22
传媒互联网及海外周观点:苹果WWDC开启MR空间计算时代,应用端关注游戏/观影/线下体验/营销
信息技术
信达证券
2023-06-12
可转债定价模型系列研究:转债蒙特卡洛定价的改进及应用:测度变换与张量计算
中国银河证券
2024-05-31
【风口研报·洞察】OpenAI承认正开发GPT-5且需要用更多的数据进行训练,国产全栈AI计算基础设施、行业应用及服务有望日臻完善;当前如何投资北交所高成长公司
未知机构
2023-11-16