新生态能力中心·大模型服务平台百炼与通义听悟产品实操演示
预备知识
产品百炼平台常见场景
- 结构化文本数据场景:ChatBI、Data+AI
- 非结构化文本数据场景:RAG文档助手
- 图片:VL识别图片中的内容
阿里云的大模型服务平台百炼是一站式的大模型开发及应用构建平台,支持开发者与业务人员深入参与大模型应用的设计和构建。用户可通过简单界面操作,在5分钟内开发出大模型应用,或在几小时内训练出专属模型,专注于应用创新。
通义听悟作为通义家族的一员,依托通义千问语言模型、音视频AI模型能力,为用户提供音频和视频内容记录和阅读的全新体验,成为工作和学习中的AI助手。主要面向以下五类场景:
- 企业办公
- 在线教育
- 网盘及媒资库
- 金融与媒体
- 销售客服
通义听悟能力
- 语音能力:实时语音识别、音视频文件识别、说话人分离
- LLM能力:全文摘要、发言总结、关键词提取、待办事项提取、思维导图生成
- 多模态能力:支持提取视频PPT并总结每页PPT讲解内容,完成摘要翻译(多语言翻译、实时语音翻译、音视频文件翻译)
通义听悟已广泛应用于多个行业,如阿里云盘“智能速览”、钉钉“会议智能纪要”、新东方“AI课堂笔记”、夸克“AI字幕”、蚂蚁面试“智云课堂”。
百炼平台
实验步骤
实验一:搭建RAG文档助手
实验二:脚本调用听悟API
- 使用脚本调用通义听悟API,配置参数开关,组合各项能力。
- 一个接口,参数配置开关,各项能力自由组合。
议程
1.预备知识2.实验步骤
预备知识-产品
百炼平台
通义听悟
阿里云的大模型服务平台百炼是一站式的大模型开发及应用构建平台。不论是开发者还是业务人员,都能深入参与大模型应用的设计和构建。您可以通过简单的界面操作,在5分钟内开发出一款大模型应用,或在几小时内训练出一个专属模型,从而将更多精力专注于应用创新。
作为通义家族的一员,通义听悟依托通义千问语言模型、音视频AI模型能力,为用户带来音频和视频内容记录和阅读的全新体验,成为在工作和学习中的AI助手。主要面向以下五类场景:企业办公/在线教育/网盘及媒资库/金融与媒体/销售客服。
常见场景:n页面体验听悟能力n脚本调用听悟API
常见场景:
n图片:VL识别图片中的内容
预备知识-通义听悟
语音能力
LLM能力
全文摘要、发言总结、关键词提取、待办事项提取、思维导图生成等多项摘要能力
多模态能力
翻译能力
实验一搭建RAG文档助手
实验二脚本调用听悟API
THANKS