您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[北京航空航天大学&清华大学]:爆款AI漫剧教学手册 - 发现报告

爆款AI漫剧教学手册

爆款AI漫剧教学手册

北京航空航天大学29系人文与社会科学高等研究院清华大学新闻与传播学院、人工智能学院双聘教授@新媒沈阳团队 何静(副教授) (一篇科普报告每多一个公式读者数量就减半。该报告仅用于科普,面向对象为小白。) 以全网百万播放量AI漫剧为例 https://www.douyin.com/user/self?modal_id=7579227221014120689https://www.douyin.com/user/self?modal_id=7585427644197768506 AI综合视觉工具 国内常用 国内MiniMax公司开发,目前是全球增速最快的AI视频工具之一。支持复杂物理运动(爆炸、流体),内置运镜模组https://hailuoai.com/ 由生数科技联合清华大学研发,是中国首个长时长、高一致性的视频大模型。多主体一致性技术领先,成本低至1秒4分钱https://vidu-china.com/ 支持视频元素修改、风格转换、添加音效与口型同步等深度编辑;提供镜头控制和关键帧过渡等创意工具https://www.pika.fr/ 剪映旗下产品,支持通过自然语言及图片输入,生成高质量的图像及视频,可应用于短视频内容制作、电影制作等多种场景提供故事创作模式,支持一站式生成故事https://jimeng.jianying.com/ 多模态一体化创意生产力工具集成视频内容编辑、风格重绘、镜头延展等多种任务,可一次性生成带语音、音效的视频https://app.klingai.com/cn/ 基于扩散模型,采用“文生图——图生视频”两步法,通过分解步骤提升生成质量;在对文本的忠实度方面表现突出,技术路线清晰。https://emu-video.metademolab.com/ 能够从简单的文字描述中生成高清视频和动画,可生成高清、16:9电影质量的视频,能选择超现实主义、动漫等不同风格https://moonvalley.me/ 侧重社交娱乐应用,侧重趣味性和个性化表达;利用AI将文字或表情符号转化为场景,对照片进行风格化重塑;提供海量头像和风格模板https://plaiday.io/ 堆友 支持多种风格(如怀旧日漫、厚涂、赛博朋克、写实、卡通等)和“图生图”“局部重绘”“人脸修复”等二次创作功能平台不仅支持AI绘画,还支持将绘画或文字提示扩展为视频内容,适合制作动态视觉资产https://d.design/ 元镜由ZeeLin推出,支持图、文、音、视频等多模态输入,结合AI智能体协作,生成高质量成片主要特征:一句话生成可编辑视频,支持剧本驱动、画面风格自选、旁白自动生成,几分钟生成高质量内容https://yuanjing.zeelin.cn/ 能够精准调控视频元素,具备电影镜头质感;保真度、一致性、运动性显著提升https://runwayml.com/ 具备更真实的物理运动、连贯的镜头语言、同步的语音与音效,效果更快、更真实、更具导演感https://openai.com/es-419/sora/ 是Google DeepMind推出的“文本/图像提示→高保真视频+原生音频(对话、音效、环境声)生成模型”https://aistudio.google.com 工具使用概况 在本次《谣言短片》及《幕后故事》的制作过程中,主要使用创作工具包括即梦AI、Sora 2和可灵AI AI短剧创作过程可结合创作需求、平台优势、功能效果、成本预算、个人使用习惯等因素,选择合适的工具进行 实操路径 使用AI工具进行真人转绘或直接构建风格化角色形象,并拓展其多场景、多身份的造型库。建立统一、稳定、可复用的角色视觉资产,为整个短片制作奠定形象基础。 通过标准化流程、提示词锚定与多维度检查,确保AI生成的所有素材(角色、场景、风格)在视觉上保持高度统一,避免出现"换脸"、风格跳跃、环境断层等问题,提升作品的专业度与沉浸感。 将故事构思转化为具体的、可执行的视频生成指令,并设计具有视觉冲击力的创意片段。建故事张力与视觉亮点,提升短片的趣味性与表现力。 依据剧本的台词、角色情感、动作要求,生成角色的口型、表情与动作精准同步的动态视频片段,让静态角色“活”起来,形成剧情的核心素材。 制作场景变换、视角切换及创意特效等无缝衔接的过渡镜头。增强叙事流畅性,实现时间、空间与情绪的巧妙转换,提升视觉吸引力。 01/角色体系搭建 角色基础设定 任务目标 请为我构思一个原创角色。请严格按以下结构回复: 核心提示词公式 1.角色简介:50字内概括核心身份与故事。2.性格与气质:列出3-5个关键词并简要说明。3.外貌与服饰:详细描述面部特征、发型、体型、标志性着装。4.风格参考:建议1-2种适合该角色的视觉风格。 在进入图像生成前,明确角色的核心设定(背景、性格、外貌特征等),形成结构化、可执行的文字描述,为AI绘画提供精准的提示词蓝图。 角色初始要求:【请在此输入您的初步想法,例如:“一位来自未来废土的机械维修少女,外表冷漠但内心善良”】 任务步骤 背景与身份设定:确定角色的时代、职业、身份与核心故事 性格与气质描述:用关键词定义角色的内在性格与外在气质。 外貌与服饰勾勒:详细描述发型、五官、体型、着装风格等视觉元素。 风格与基调定位:明确整体艺术风格(如二次元、3D写实、皮克斯动画等)。 角色初步生成--真人转绘 适用场景 示例: 工具 采访类、纪实类、个人IP类漫剧希望角色与真人高度相似 即梦AI 上传真人照片作为智能参考,输入提示词,选择图片生成模型,确定图片生成比例及分辨率,点击生成。 提示词公式 以所上传图片中人物为参考,【对人物当前状态的描述】,【风格类型转译描述】,【面部与体态特征强化】,【色彩与光影风格】。 �实操要点 •必须上传清晰的真人参考图•风格词只选一种长期固定•首次生成多轮筛选最稳定版本作为角色母本 角色初步生成--风格化构建 适用场景 【角色身份与人设定位】+ 【外貌与造型细节】+【风格与渲染体系】+【构图比例与视图形式】+【画面质感与光影表现】 剧情漫剧动画短片虚拟IP创作无真人原型角色 提示词公式 即梦AI 角色形象拓展 即梦AI 示例1:更换场景与服装 任务目标 以所上传图片中人物为主角,正面半身镜头居中,衣服替换成一件简单的毛衣,表情温和谦虚,背景是高校教学楼走廊,光线温和自然,将首饰改为一个简单的手表,项链去掉 基于已生成的角色形象,快速生成同一角色在不同场景、不同身份下的多种设定图像内容。 提示公式 以所上传图中人物为主角,【镜头与视角】+【新形象描述】+【新场景描述】+【特定细节/文字】 示例2:更换身份与视角 通用步骤 以所上传图片中人物作为主角,人物背影居中,中景仰视镜头,人物改为更加年轻的大学生装扮(简单浅色毛衣,长裤,背着书包,保持长发),面对着一所宁静的、葱郁绿化的现代大学校园的大门前,依稀可见校园的名称“四川农业大学” 步骤一:上传角色基础图像,智能抠图后作为参考 步骤二:按照公式输入提示词,确认图片参数后生成 示例3:多人物分身场景 以所上传图片中人物作为主角,才艺展示场景,一个乐队在舞台上表演(有打鼓的,有打碟的,有弹贝斯,有弹电子琴的、有主唱、有吹大号的),每个乐队人物都是主角的分身,同样的外貌特征,穿着不同的表演服装 02/一致性控制 角色一致性控制 核心逻辑 提示词补充模板 在角色拓展生成过程中,可选择追加提示词: 角色一致性=【外貌特征】+【气质特征】+【风格体系】+【构图习惯】四者一致 基础一致性补充提示 保 持 人 物 五 官 比 例 、 脸 型 轮 廓 、 气 质 风 格 与 基 础 角色 设 定 完 全 一 致 , 整 体 视 觉 风 格 统 一 强一致性修正提示 请 严 格 参 考 基 础 角 色 形 象 , 禁 止 改 变 人 物 脸 型 、 五官 比 例 与 整 体 气 质 , 仅 允 许 调 整 服 装 、 场 景 或 表 情 风格锁定提示 整 体 风 格 必 须 保 持 为 【X X X风 格 】 , 禁 止 混 合其 他 风 格 体 系 多次生成控制策略 构图锁定提示 ①顺序生成法 ②回退修正法 构 图 比 例 保 持 与 基 础 角 色 一 致 , 仅 调 整 镜 头 视 角 ,不 改 变 角 色 比 例 结 构 •先生成“静态形象稳定版本”•再生成“轻微动作版本”•最后进入动态演绎 •一旦出现走样•立即回退到最近稳定版本•从该版本重新生成 场景一致性控制 核心逻辑 控制技巧 建立场景"母版"图 场景一致性=【环境特征】+【光影系统】+【色彩体系】+【细节元素】四者连贯 •为每个主要场景生成一张“标准场景图”。•后续生成以该图为环境参考,确保基础一致。 使用环境参考图 •在生成新镜头时,上传“母版”场景图作为视觉参考。•提示词示例:以【场景参考图】的环境与光影为基础,【描述镜头的新变化】,保持色彩基调与空间感一致。 固定光影提示词 •将选定描述词作为该场景的固定指令,示例:室内"柔和全局光照,自然窗光从左侧进入"、室外"晴朗天气,阳光从右上角45度照射"、夜晚"月光下的冷色调,点缀暖色灯光" 多场景连贯性控制策略 色彩体系锚定 当角色在不同场景间移动时: •为每个场景定义色彩公式,在所有相关生成的提示词末尾追加此公式。例如:主色调为暖木色,辅助色为墨绿与赭石,整体中高饱和度,温暖静谧色调。 •光影连续性:确保光源方向有逻辑地变化(如从室内窗光过渡到室外阳光)。•色彩过渡:使用相似的色彩饱和度与明度,避免视觉跳跃。•细节呼应:保留角色的标志性物品或服装细节,增强叙事连贯性。 风格一致性控制 核心逻辑 风格锁定方法 建立风格关键词库 风格一致性=【美术风格】+【渲染方式】+【画面质感】+【细节处理】四者稳定 例如: // 3D皮克斯风格关键词库三维动画皮克斯风格、柔和全局光照、高饱和鲜艳色彩、卡通化真实感、细腻材质//二次元风格关键词库动漫风格、赛璐璐上色、清晰线条、扁平阴影、日系插画 使用风格参考图 •收集3-5张符合目标风格的参考图片•在生成时上传作为风格参考 风格污染避免技巧 跨工具一致性控制原则 •在提示词开头明确风格:【3D皮克斯动画风格】+ ...•在提示词末尾强化:整体必须保持XX风格,禁止出现YY风格元素•及时检查生成结果,剔除风格偏离的图片 当使用多个AI工具时: •建立风格转换表:记录不同工具对同一风格的描述方式•中间检查环节:每完成一个工具环节,检查风格是否一致•风格微调:在后期剪辑中,使用调色工具进行统一微调 综合控制案例 视频生成:固定角色+场景延展+风格保持 图像融合:固定角色+特定场景 步骤一:首先准备一张角色场景图,作为视频生成首帧画面 步骤一:打开即梦AI,分别上传两张包含固定角色和特定场景的图像 步骤二:打开Sora2,上传首帧图,输入提示词,设置生成参数 提示词公式 步骤二:输入提示词,设置参数,生成角色、场景一致的融合新图像 生成效果展示 提示词公式 图片指令(融合/替换/修改)+新场景描述(内容/构图)+整体风格描述(系列统一) 生成效果展示 03/动态演绎生成 �方法选择 在当前AI漫剧创作实践中,图像演绎与数字人演绎是最适合大多数创作者优先选择的两种方式。这两种方法操作门槛低、生成效率高、工具成熟度好,能够在保证基本表现力的同时,大幅降低制作成本与学习难度,特别适合用于对话、采访、讲解及基础剧情类漫剧创作。 通用生成步骤 动态演绎生成一般包括以下几个核心步骤,适用于大多数AI动态生成工具(如Sora2、即梦AI、可灵AI等) 上 传 角 色