登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
海南封关
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
卢冕- OpenMLDB:开源实时特征计算全栈解决方案
信息技术
2022-05-19
DataFunSummit2022:大数据计算架构峰会
H***
AI智能总结
查看更多
AI 工程化挑战
95%的AI项目因数据和特征供给问题受阻,需解决DataOps、FeatureOps、ModelOps及ProductionOps全生命周期挑战。
决策类场景(如时序特征工程)和实时推荐系统(延迟<20ms)对特征计算平台提出高要求,但传统方案存在线上线下不一致问题,导致高昂的工程化成本(如双套系统开发、多技能栈投入)。
OpenMLDB解决方案
OpenMLDB作为开源机器学习数据库,提供线上线下一致的特征计算平台,支持离线开发与实时服务无缝衔接。
核心特性
:
线上线下一致性执行引擎
:确保计算逻辑一致。
高性能在线特征计算引擎
:采用双层跳表和预聚合技术,优化延迟。
离线计算优化
:比Spark快10倍以上。
SQL扩展
:支持LAST JOIN、WINDOW等特征工程SQL语法。
企业级支持
:高可用、可伸缩、云原生、多租户。
SQL核心开发体验
:CLI/SQL统一管理。
硬件创新
:基于持久内存(PMem)优化,降低恢复时间99.7%、尾延迟20%、TCO 58.4%。
应用场景与案例
覆盖金融(反欺诈、精准营销)、零售(流量预测、客户流失预警)、风控等100+场景,支持超300节点分布式部署。
典型案例:某银行反欺诈系统通过OpenMLDB实现<20ms响应,准召率优于传统方案。
发展历程与生态
2017年开源前已服务金融客户,2021年6月正式开源(Apache 2.0许可),贡献者55人,代码30万行。
上下游生态包括DataOps工具(如DolphinScheduler)、FeatureOps平台及云原生部署方案。
未来规划
v0.5.0将支持RocksDB、UDF及CSV/LIBSVM导入。
后续将推出云原生版本,并持续扩展SQL功能与分布式能力。
社区参与
欢迎开发者加入GitHub社区(https://github.com/4paradigm/OpenMLDB)。
你可能感兴趣
2023年年报点评:Q4业绩明显改善,构筑AI计算全栈能力
信息技术
财信证券
2024-04-25
【风口研报·洞察】OpenAI承认正开发GPT-5且需要用更多的数据进行训练,国产全栈AI计算基础设施、行业应用及服务有望日臻完善;当前如何投资北交所高成长公司
未知机构
2023-11-16
Q3毛利率大幅提升,向全栈式解决方案厂商转型加速发展
长城证券
2023-10-31
全栈应用与API安全解决方案白皮书
信息技术
Akamai
2025-03-31
以用户为中心,核心软件自研及全栈式解决方案打造新上汽
交通运输
东方证券
2021-06-14