AI智能总结
Nipun AgarwalMySQL HeatWave 高级副总裁 MySQL HeatWave LAKEHOUSE , 实时分析 , 机器学习 , 单一数据库服务中的事务处理 HeatWave 生成 AI 和矢量存储 4.2. 向量处理3. 生成 AI1. 矢量存储HeatWave 聊天 对象存储 Database出口 Usecase 1 : 预测性维护 Usecase 1 : 预测性维护 内容生成 / 汇总 报告生成 : 异常日志摘要 提出问题(“以下日志集合中的主要问题是什么。提供两句话摘要。 ”) 在这组日志中主要的问题是某个特定进程(ID为8145)的内存使用量持续超过定义的内存阈值。这个问题在日志中反复出现,当该进程超过内存阈值时,会向主线程发送SIGTERM信号以终止进程。您是否还需要关于这组日志的其他帮助? Usecase 2 : 财务欺诈检测 内容生成 / 汇总 SET@ context = (选择txt _ descriptionFROM SET@ query=提供的是一条银行交易信息,字段名称和字段值之间用`\n\n`分隔。请提供这条银行交易的简要总结。关于这笔交易,有哪些可疑之处?面向对象是银行职员。;选择sys. ML _ GENERATE (@ query, JSON _ OBJECT ("context", @ context)); Usecase 3 : 在线交付的个性化 Usecase 3 : 在线交付的个性化 检索增强生成 版权所有 © 2024 , Oracle 和 / 或其版权所有 © 2024 , Oracle 和 / 或其关联公司 版权所有 © 2024 , Oracle 和 / 或其关联公司 10 分差器HeatWave AutoML 与生成 AI 的协同作用 • 更快的 LLM 推理由于较小的搜索空间• 通过过滤不相关数据更准确的 LLM 结果 Usecase 4 : 自然语言交互 员工助理 员工助理 : 提高员工生产力 HeatWave 为运行 LLM 提供了选择 In - HeatWave LLM o § 在HeatWave数据库中实现本地执行§ 运行如Llama2-7B和Mistral-7B这样的较小规模的语言模型(LLMs)§ 确保安全、降低成本并保证可用性 OCI 生成 AI 服务 LLM o § 支持更大的模型 , 如 Cohere - command 和 Llama2 - 70B , 并在 GPU 上运行 §更高的质量 , 更好的性能 适用于公有云、专用区域、混合环境 矢量存储和在热波内运行 LLMS 的能力提供了部署的灵活性 矢量支持 • 引入新的矢量数据类型 • 矢量列的内存混合列式存储格式 • 跨 HeatWave 节点并行化矢量处理 • 接近内存带宽的进程 矢量处理 • 数据库内解析 , 并行嵌入生成 • 存储在对象存储中的向量 矢量存储 使用 HeatWave 创建向量存储是并行的 跨节点的语法分析源文件和并发嵌入生成 HeatWave 中的矢量存储创建 使用 HeatWave 矢量存储的示例 创建矢量存储 # 从对象存储中摄取文档 , 就像任何 Lakehouse 表一样CALLsys. heatwave _ load ("vector _ store", @ load _ params); # 示例 : 查找语义上最类似于输入的书籍 , 并且是打印的选择id, 标题FROMbooks b, books _ in _ print ipWHEREb. title = ip. titleORDER BY距离(b. segment _ embeding, @ query _ embeding ",DOT“) 作为距离DESCLIMIT 10; 查询向量存储本机 SQL 语法 查询向量存储ML _ RAG # 示例 : 使用摄取到 Vector Store 中的文档中的数据回答问题CALLsys. ML _ RAG(“哪个状态具有最大碳 ? ” , @ output) ; 矢量数据类型支持 •• 标准 SQL 接口 , 用于创建具有向量列的表矢量数据存储 HeatWave : 内存中的列式格式o InnoDB : BLOBo •距离函数示例 mysql > CREATE TABLE wikipedia (id INT, title VARCHAR (1024) page _ data TEXT page _ list TEXT, page _ url TEXT, page _ embeding矢量(1024) ENGINE _ ATTRIBUTE = '{"model": "cohere"}') ENGINE =湖屋, SECONDARY _ ENGINE = 快速; • L1 / 曼哈顿 • L2 / EUCLIDIAN• L1 ^ 2 / 曼哈顿 _ SQUARED •L2 ^ 2 / EUCLIDIAN _ SQUARED • COSINE • DOT • HAMMING HeatWave 聊天 自然语言互动 • 用于在 Lakehouse 中查询非结构化文本文档 • 允许优化聊天范围(使用不同的 ML 模型查询特定文件夹中的文档) HeatWave AutoML 在数据库机器学习中 , 完全自动培训 , 解释 , 比 redshift ML 快 25 倍 HeatWave AutoML 中的数据漂移监测 • 使用检测器监控生产中的数据漂移 • 检测器:• computes a重建错误对于新的传入样本 • 更新累积漂移度量 • 如果指标超过阈值 , 则自动建议对模型进行重新训练 HeatWave AutoML 中预测的置信区间 • 表示未来值的可能性区间,基于一定的置信水平(例如,95%) • 帮助用户评估风险、做出知情决策并理解模型预测中的不确定性 异常检测的新模型 : GLOF 、 PCA 增强现有的 GKNN 算法 它是一种内部开发的模型,能够检测全球和聚类异常(如GkNN),同时也能检测局部异常。 该模型将复杂数据简化为其主要组成部分 , 以更轻松地识别异常值 日志异常检测 现在对 MYSQL 日志进行了培训 Heatwave 处理并概括传入的机器日志 , 然后构建量身定制的异常检测模型 •集团[2024-03-05 13:28:59 - 2024-03-05 13:29:20] 与复制相关的失败[GCS] 从 fd = <: NUM: > <: IP: >: <: NUM: > 读取失败 此模型有助于在日志中识别异常,从而实现有效的预防性维护和根本原因分析。 • [2024-03-05 13:29:25 - 2024-03-05 13:29:27]这个服务器无法联系到群组中的大多数成员。服务器将现在阻止所有更新。直到与大多数成员重新建立联系,服务器将保持封锁状态。可以通过使用组复制强制成员来强制形成一个新的群组成员资格。 •潜在[2024-03-05 13:40:59 - 2024-03-05 13:41:21] 组复制中的连接泄漏[GCS] 尝试添加节点时发现的旧化身• [2024-03-05 17:26:31]数据库未正常关闭! 正在启动崩溃恢复。正在 lsn = <: NUM: > 开始分析重做日志 Summary ••••在线数据库向量存储以查询非结构化文本内容HeatWave中的内置生成式AI带来了大语言模型(LLMs)的企业内容处理能力HeatWave中的向量处理可以与其他SQL运算符结合使用持续创新的HeatWave AutoML在查询数据方面最佳性能、性价比和可扩展性一站式服务涵盖机器学习、生成式AI、分析、湖仓一体和OLTP