背景
预训练模型的发展显著提升了文本生成能力,基于AI的工业化应用逐渐普及,如写作助手、剧情生成等。现有歌词、诗词智能创作应用(如九歌诗歌写作系统、小森唱app)存在作词门槛高、传统AI生成文本需人接受等问题。网易云音乐平台作词人众多,但辅助工具需求强烈。
有灵歌词辅助创作框架
目标:降低作词门槛,提高创作效率及灵感启发。
实现功能:为音乐小白提供整体生成、修改服务;为成熟音乐人提供押韵助手、灵感检索、修改等功能。
框架层次:
- 数据检索与并行训练:构建歌词词语图谱,节点包含词语、词频、词性、意象词;边权重计算基于条件概率和共现次数。
- 文本生成:基于预训练GPT-2 encoder-decoder模型,支持整体生成、实时生成、叙事生成。
- 整体生成:基于内容和格式控制(风格、关键词、情绪、段落属性、韵脚、行数、词格)生成歌词。
- 实时生成:根据已写歌词续写,启发灵感。
- 叙事生成:将短文转为伪平行语料,输出歌词。
- 修改功能:支持段落、句子、词语修改,基于T5实现方式。
- 辅助工具:押韵助手(支持十三辙、单押/双押/三押、声调筛选)、灵感检索(支持多种语料类型及语义检索)。
歌词创作的常见问题探讨
- 预训练模型对比:
- 2亿参数模型:valid ppl 6.90,流畅性、逻辑性、关键词相关性、感染力、文学性、总体打分分别为3.65、3.28、3.34、2.83、2.86、3.23。
- 50亿参数模型:valid ppl 6.55,各项评分略提升。
- 110亿参数模型:valid ppl 6.55,流畅性、逻辑性、关键词相关性、感染力、文学性、总体打分分别为3.72、3.47、3.06、2.73、2.82、3.25。
- 人类高质量歌词评分高于模型,但模型在逻辑性上表现较好,关键词相关性降低,感染力、文学性区分不明显。
- 内容与格式控制:
- 关键词引导能有效提升生成质量。
- 多维度内容控制(风格、关键词)和格式控制(韵脚、词格)需权衡,示例中关键词“夏天”“蝉鸣”“飞机”、风格“古风”、词格“发花辙”可指导生成。
未来展望
研究方向:
- 词曲协同:解决先曲后词的词格对应、旋律声调匹配、风格一致性问题。
- 辅助模式优化:贴近作词人习惯,融入专家知识设计辅助模式,而非端到端生成。
- 歌词生成质量提升:减少口水歌,融合诗词等文本来源,提升优质歌词比例。