行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

AI生成checklist：Qunar使用AIGC在测试域的提效实践

2024-09-18 崔宸 - 木子学长v3.5

项目背景

问题：写checklist耗时（平均耗时5pd以下需求1-2h，5pd以上需求3-5h），需求文档质量参差不齐，影响QA效率和质量。
目标：提升QA写checklist的效率，检查需求文档质量，提升自测自发起需求质量。

设计思路和方案

业界参考：基于自有大模型及微调的一键生成方式、基于通用大模型多轮问答的方式。
Qunar解决方案：
- 主要（便捷）：基于通用大模型+聚焦于需求点+集成项目研发流程中的一键生成方式。
- 辅助（灵活）：智能体多轮问答。
系统架构：
- 执行流程：1. 获取需求文档，对文本进行拆分；2. 结构化文档+prompt向大模型提问；3. 将AI返回的测试点进行转换，渲染为脑图；4. 归档AI生成与手动修改完的case，分析数据。
产品文档预处理：
- 原因分析：需求文档无固定模板，规范性较低；需求文档中的无关内容影响生成效果。
- 解决方案：提取需求正文，拆分需求正文，获得结构化需求点。
文本解析模块：
- 符合标准格式：工程化解析需求正文及需求点列表，生成准确率高。
- 完全无格式：大模型解析需求正文及需求点列表，生成准确率取决于文档内容密度。
需求分析模块：
- Prompt设计：角色为测试专家&语言分析专家，提取需求点文本的关键信息，给出测试点列表和示例，以JSON格式输出。
- LLM选择：通过history模拟Few shot的方式来提升回答的准确率。
测试用例转化模块：
- 触发方式：项目管理流程入口触发、checklist平台内手动触发、定时扫描第二天进入开发中的需求，触发自动生成checklist。
样例展示：提供具体的样例展示AI生成结果。

效果评估方案

统计口径：
- 采纳率：(T + 0.5 * P) / A0，完全可采纳节点数T，部分可采纳节点数P，终版checklist节点数A1，自动生成总节点数A0。
- 覆盖率：使用项目数/全部项目数。
- 召回率：(T + 0.5 * P) / A1。
目前效果：
- 采纳率：50.0%。
- 召回率：41.7%。
提效成果：
- 5pd及以下需求，每个需求节省0.1pd。
- 5pd以上需求，每个需求节省0.2pd。
- 年化可节省约200pd。
- 填补自测自发不写checklist的缺口。

未来计划

内部大模型微调：涉及核心私密数据的需求，可以走内部大模型生成。
接入内部知识库：业务知识库（公司内部概念、黑话、历史资料）和技术知识库（系统调用关系、业务代码资料）。
结合多模态：支持解析PRD中存在的流程图、UI图信息。

崔宸高级Java开发工程师崔宸公司职位高级Java开发工程师 2022年加入去哪儿旅行基础架构-基础平台团队，主要负责测试域工具的研发。参与过自动化测试、联调平台、写压测等项目，对录制回放场景有深入了解。熟悉AI大模型通识，23年开始主攻AI大模型应用方向，完成AI在测试域、需求域提效的应用落地。在去哪儿AIGC HACKATHON大赛获得冠军。项目背景目录设计思路和方案效果评估方案成果及未来计划项目背景写checklist耗时平均耗时：5pd以下需求1-2h5pd以上需求3-5h 需求文档质量参差不齐逻辑清晰，沟通效率高逻辑混乱，沟通效率低无评估标准，只能凭感觉项目背景提升Q A写c h e c k l i s t的效率可以检查需求文档的质量提升自测自发需求质量质量好：质量差： f ro mto f ro mto 设计思路和方案业界参考样例基于自有大模型及微调的一键生成方式基于通用大模型多轮问答的方式 Qunar探索的解决方案主要（便捷）：基于通用大模型+聚焦于需求点+集成项目研发流程中的一键生成方式辅助（灵活）：智能体多轮问答系统架构执行流程 1.获取需求文档，对文本进行拆分2.结构化文档+prompt向大模型提问3.将AI返回的测试点进行转换，渲染为脑图4.归档AI生成与手动修改完的case，分析数据产品文档预处理为什么要进行文档预处理？解决方案：原因分析： •需求文档无固定模板，规范性较低•需求文档中的无关内容影响生成效果 •需求文档预处理，提取需求正文•拆分需求正文，获得结构化需求点文本解析模块符合标准格式： •工程化解析需求正文及需求点列表•生成准确率高问题： •对产品角色要求变高•QA角色获益•推进受阻文本解析模块圈定需求正文： •大模型解析需求点列表•预处理成本低•生成准确率高文本解析模块完全无格式： •大模型解析需求正文•大模型解析需求点列表•生成准确率取决于文档内容密度需求分析模块需求分析模块——Prompt设计角色能力测试专家&语言分析专家 1，提取需求点文本的关键信息2，给出测试点列表和示例规则样例 1.关键信息只保留一句精炼的概括信息2.每个测试点对应一个示例3.以JSON格式输出通过history模拟Few shot的方式来提升回答的准确率需求分析模块——LLM选择 AI基建情况测试用例转化模块 •项目管理流程入口触发 • checklist平台内手动触发 •定时扫描第二天进入开发中的需求，触发自动生成checklist 样例展示效果评估模块采纳率覆盖率原始生成结果中用户选取自动生成节点的概率采纳率：( T + 0 . 5 * P ) / A 0 按照项目维度统计用户使用情况项目覆盖率：使用的项目数/全部项目数统计口径自动生成总节点数A 0终版c h e c k l i s t节点数A 1 完全可采纳节点数 T 部分可采纳节点数召回率用户进行修改之后采用的自动生成节点与总结点数的比率召回率：( T + 0 . 5 * P ) / A 1 效果评估模块效果评估模块中文文本e m b e d d i n g模型是一种将文本转换为向量表示的技术，它能够捕捉文本的语义和语法信息，并将其转换为连续的向量空间中的点。这种表示方式在自然语言处理领域被广泛应用于各种任务，如文本分类、情感分析、命名实体识别等。效果评估模块效果评估模块采纳率：(2*100%+1*50%)/5 = 50.0% 召回率：(2*100%+1*50%)/6 = 41.7% 目前效果提效成果 •5pd及以下需求，每个需求节省0.1pd•5pd以上需求，每个需求节省0.2pd•年化可节省约200pd•填补自测自发不写checklist的缺口未来计划内部大模型微调01 涉及核心私密数据的需求，可以走内部大模型生成接入内部知识库02 业务知识库：公司内部概念，黑话，历史资料等技术知识库：系统调用关系，业务代码资料等结合多模态03 支持解析PRD中存在的流程图、UI图信息感谢大家观看

点击免费查看完整报告

AI生成checklist：Qunar使用AIGC在测试域的提效实践

项目背景

设计思路和方案

效果评估方案

未来计划

你可能感兴趣

崔宸-AI生成checklistQUNAR测试域结合AIGC提效实践

刘鑫-AI辅助测试开发领域端到端流程提效实践

【点金互动易】 AI PCAIGC 基于AI芯片的Al PC项目已在研发当中，微软、AMD等企业是其重要合作伙伴，这家公司提供AIGC生成式AI本地化解决方案，可以在PC端通过大模型生成文字、图像等

加速制药商业成功：生成 AI 在制药中的战略使用案例

「AI研习社」解码热门AI应用，智能质检、3D生成与AIGC实践分享

【盘中宝】或为AIGC优先释放大产能的细分赛道，行业营销、制作和运营环节均将被重塑，龙头公司已在部分核心产品中测试Al 这家公司已尝试利用AI技术，降本提质效果显著-20240222

百度AI营销认证 | AIGC在图片素材制作中的实践探索

【点金互动易】 AlKimi 这家公司核心产品可对算力调度、调优进行观测分析，在一体化数据模型等积累了大量实践;这家公司一站式AI应用平台支持多种大模型的接入与纳管，AIGC相关技术应用已产生收入

25Q1点评：AI驱动广告超预期，期待中视频生成工具进一步提效

【机构龙虎榜解读】多模态+AI视频+短剧+抖音电商，与巨量引擎签署数据推广合作协议，基于自研营销领域专用的AIGC多模态模型，已实现图片、视频等多种形式的智能化内容生成，这家公司获净买入

AI生成checklist：Qunar使用AIGC在测试域的提效实践

你可能感兴趣

崔宸-AI生成checklistQUNAR测试域结合AIGC提效实践

刘鑫-AI辅助测试开发领域端到端流程提效实践

【点金互动易】 AI PCAIGC 基于AI芯片的Al PC项目已在研发当中，微软、AMD等企业是其重要合作伙伴，这家公司提供AIGC生成式AI本地化解决方案，可以在PC端通过大模型生成文字、图像等

加速制药商业成功 ： 生成 AI 在制药中的战略使用案例

「AI研习社」解码热门AI应用，智能质检、3D生成与AIGC实践分享

【盘中宝】或为AIGC优先释放大产能的细分赛道，行业营销、制作和运营环节均将被重塑，龙头公司已在部分核心产品中测试Al 这家公司已尝试利用AI技术，降本提质效果显著-20240222

百度AI营销认证 | AIGC在图片素材制作中的实践探索

【点金互动易】 AlKimi 这家公司核心产品可对算力调度、调优进行观测分析，在一体化数据模型等积累了大量实践;这家公司一站式AI应用平台支持多种大模型的接入与纳管，AIGC相关技术应用已产生收入

25Q1点评：AI驱动广告超预期，期待中视频生成工具进一步提效

【机构龙虎榜解读】多模态+AI视频+短剧+抖音电商，与巨量引擎签署数据推广合作协议，基于自研营销领域专用的AIGC多模态模型，已实现图片、视频等多种形式的智能化内容生成，这家公司获净买入

加速制药商业成功：生成 AI 在制药中的战略使用案例