您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[腾讯]:传媒专属精调模型建设 - 发现报告

传媒专属精调模型建设

2024-03-25腾讯J***
AI智能总结
查看更多
传媒专属精调模型建设

传媒专属精调模型建设 胡哲腾讯优图实验室高级AI专家 ⼤模型在落地应⽤时,容易出现幻觉,指令遵循效果差,⽽且很可能⾏业知识不⾜。 pPrompt Engineering: 通 过 例 如few-shotprompt的⼿段增强输出;pR A G(Retrieval-AugmentedGeneration)检索增强⽣成;pFT(Fine-tuning):精调,对模型进⾏微调p综合⼿段:综合利⽤精调、提⽰⼯程和RAG 精调⾯临的挑战 需要⼤量⾼质量数据进⾏训练和优化,经常会因为数据各类问题,导致⼤模型训练的效果和效率⽆法得到保障 开发和落地对技术⼈才储备及技术能⼒要求⾼,相关资源的缺失影响⼤模型在产业的快速落地和持续优化 对计算资源和存储资源有⾼需求,对很多客户来说门槛⾼,难以⽀持⼤模型的训练和推理 交付模式(公有云训练、私有化推理) ü腾讯提供⾏业⼤模型,模型训练⼯具(TI-ONE)和模型训练专家咨询服务;ü客户准备脱敏后的训练数据,在腾讯的模型训练⼯具上进⾏fine-tuning,⽣成客户专属⼤模型;ü新模型部署在客户本地做推理使⽤;编辑⽼师基于输出结果做调整修改,不断积累反馈数据;ü使⽤⼀段时间,积累⼀定量反馈后,可在公有云上进⾏迭代训练; 1-定义场景 【输⼊】给到⼤模型的输⼊内容:新闻采访稿; 传媒⾏业⼤模型精调 【输出】期望⼤模型的输出结果(⼈⼯数据为⽰例):编辑⽼师改写之后的送审稿; 2-设定标准:技术指标 ü上下⽂最长token数; 3-数据准备:提供符合标准 【数据内容要求】 1.⽆监督数据(原始数据): 的训练数据 a.数据格式:⽹页数据、word、TXT、语⾳类b.数据量要求:越多越好,包括原始新闻采访数据,数万条c.数据质量:拿到的30-50条样本数据,casebycase评估d.数据保密性要求:腾讯侧会提供数据脱敏⼯具 ü数据的组织形式;ü数量;ü质量; 2.有监督数据(标注数据): a.数据格式:TXT、wordb.获取⽅式:从⽆监督数据中挑选⼀定⽐例来标注c.数据量要求:1000条(内容摘要)d.数据质量:拿到客户的30-50条样本数据,casebycase评估 4-训练资源 ü基底模型: 5-模型训练 SupervisedFine-tuning(SFT)是一种在自然语言处理(NLP)中使用的技术,用于将预训练的语言模型适应于特定任务或领域。Fine-tuning的基本思想是采用已经在大量文本上进行训练的预训练语言模型,然后在小规模的任务特定文本上继续训练它。 优点:预训练模型的权重被更新,以更好地适应任务 缺点:预训练模型的全部权重都会被更新,所需资源和时间都会更多。 【竞争优势】 【技术亮点】 ü全链路的训练⼯具平台;ü训练最佳实践⽅法论ü成本低:低成本训练+推理服务ü合作模式灵活:训练和推理均⽀持公有云和私有化ü算法⼈员陪跑;ü提供丰富有效的prompt模板、⽅便直观;ü提供丰富的基底模型选择; ü针对长⽂本理解和⽣成优化;ü多年媒体⾏业新闻数据的积累;ü依托腾讯云⼤模型底座,不断迭代升级;ü训练平台框架加速能⼒,训练和推理性能提升30%+ THANKS!感谢聆听 胡哲腾讯优图实验室高级AI专家