AI智能总结
AI 应用 微信 AI 播客惊艳登场,推出双人对话新闻播报........................................5小红书发布 DynamicFace,突破 AI 人脸融合瓶颈.....................................5 AI 工具 AI tools 上海人工智能实验室联合破解超长视频生成难题.....................................6可灵 AI2.1 模型首尾帧功能让视频生成精准可控.......................................6即梦 AI 推智能多帧功能:支持多图生成超长镜头....................................7腾讯发布 AudioStory,推动 AI 音效向叙事级跨越.....................................8 AI 治理 爱奇艺通过 ISO/IEC42001 人工智能管理体系认证....................................8 终端与应用Terminal and Application 首个运用 AI 技术提升大屏适老化的团体标准发布................................9乐播推出“青龙计划”助力短视频投屏体验升级...................................10 摘 要 A I 应用AI applications 微信 AI 播客惊艳登场,推出双人对话新闻播报微信 AI 播客惊艳登场,推出双人对话新闻播报 P5 该博客功能无需真人主播即可通过 AI 虚拟生成双人对话播报新闻。其基于自研模型,涵盖文本处理、语音合成与对话生成三环节,能够精准解析新闻文本,生成自然流畅的对话音频,为用户带来更新颖的视听体验。 小红书发布 DynamicFace,突破 AI 人脸融合瓶颈小红书发布 DynamicFace,突破 AI 人脸融合瓶颈 P5 该技术通过精准拆分人脸关键信息、身份 - 细节双流注入及时序一致性模块三大创新,解决了传统人脸置换的失真、僵硬等问题,实现高质量、高一致性人脸置换。该技术为广电行业图像与视频人脸融合提供了全新解决方案。 AI 工具AI tools 上海人工智能实验室联合破解超长视频生成难题上海人工智能实验室联合破解超长视频生成难题 该实验室联合多机构推出 LongVie 框架,通过“控制信号全局归一化”提升视频跨片段连贯性,“统一噪声初始化”策略减少视觉漂移等创新技术,解决了超一分钟视频生成所面临的挑战。评测显示 LongVie 达当前最先进水平,将开启超长视频生成新篇章。 可灵 AI2.1 模型首尾帧功能让视频生成精准可控可灵 AI2.1 模型首尾帧功能让视频生成精准可控 P6 通过指定视频起始与结束画面,新升级的该功能可生成符合物理规律、兼具创意与连贯性的视频中间帧。其在广告营销、影视制作、短剧创作及动画制作等领域有显著应用,推动 AI 视频生成从随机生成迈入精准可控的创作新阶段。 即梦 AI 推智能多帧功能:支持多图生成超长镜头即梦 AI 推智能多帧功能:支持多图生成超长镜头 P7 用户上传最多 10 张关键帧图像,设置提示词与时长,该工具通过分析图像逻辑与理解运镜指令,可自动生成最长 54 秒的连贯长镜头视频。其操作便捷且生成内容具电影级质感,已应用于商业广告,将推动视频创作向智能化、大众化方向发展。 腾讯发布 AudioStory,推动 AI 音效向叙事级跨越腾讯发布 AudioStory,推动 AI 音效向叙事级跨越 P8 该技术基于文字描述生成电影级叙事音频,上传无声视频并描述音效风格,即可自动生成同步且风格统一的背景音轨。该技术可应用于视频自动配音、音频续写、AI 有声书、游戏音效等领域,推动 AI 从简单声音模仿向复杂叙事音频生成跨越。 摘 要 AI 治理AI governance 爱奇艺通过 ISO/IEC42001 人工智能管理体系认证爱奇艺通过 ISO/IEC42001 人工智能管理体系认证 P8 ISO/IEC42001 是全球首个 AI 管理体系国际标准,被视作 AI 治理“国际通行证”。爱奇艺成为国内首批在用户侧、模型及内容全链条获此认证的企业,标志其 AI 技术开发、部署与管理达国际领先水平,实现了 AI 领域规范化治理突破。 终端与应用Terminal and Application 首个运用 AI 技术提升大屏适老化的团体标准发布首个运用 AI 技术提升大屏适老化的团体标准发布 P9 近日,中国视像行业协会发布《适老化电视人工智能技术要求》团体标准,该标准由海尔电视联合京东牵头制定。这是首个全面借助人工智能技术提升大屏电视适老化水平的团体标准,旨在满足老年群体对高品质生活和健康保障的需求。 乐播推出“青龙计划”助力短视频投屏体验升级乐播推出“青龙计划”助力短视频投屏体验升级 P10 短视频登陆大屏成行业趋势,乐播的“青龙计划”率先深度集成抖音,解决画面拉伸、操作延迟等问题,上线满屏适配、倍速播放、4K 高帧率等投屏功能,并规划拓展至更多应用及蓝牙投屏、云端连接等。“青龙计划”推动投屏技术从连接工具升级为影响内容消费体验的关键基础设施,将加速短视频大屏化进程,激活大屏用户增量价值,为内容生态开辟更多跨屏交互新范式。 A I 应用 1微信 AI 播客惊艳登场,推出双人对话新闻播报 近日,微信 AI 推出全新的“双人对话新闻联播”播客功能,使用 AI 技术直接生成虚拟双人对话来完成新闻播报。这一创新打破了传统的新闻播报模式,不再需要真人主播。该功能的虚拟双人对话自然流畅,模拟了真实主持人的互动场景,使每日新闻变得生动有趣,为用户带来了更新颖的视听体验。 该功能依托微信 AI 自研的语音生成模型,主要涵盖文本处理、语音合成与对话生成三个核心环节。首先,利用大规模预训练语言模型对新闻文本进行语义理解和段落划分,生成适合对话的脚本结构。随后,通过多风格语音合成模型生成两位具有不同音色和播报风格的主播音频,模型在韵律控制和情感表达方面进行了优化,使对话更自然。最后,借助端到端的神经网络模型进行音频合成与时序对齐,确保对话节奏流畅、切换自然。其技术优势体现在高质量的音色还原度和对话连贯性上,模型能够有效处理新闻文本中的复杂句式与专业词汇,同时保持语音的自然度和可懂度。 微信 AI 播客的推出体现了多模态 AI 技术在内容 2 生产领域的应用进展,其双人对话形式为新闻播报提供了新思路。 (信息来源 :AI 基地网 www.aibase.com) 2小红书发布 DynamicFace,突破 AI 人脸融合瓶颈 近日小红书 AIGC 团队发布了 DynamicFace 可控人脸生成技术。该技术聚焦于图像和视频领域的人脸融合任务,解决了传统人脸置换的失真、僵硬等问题,实现了高质量、高一致性的人脸置换效果。 传统人脸置换技术长期面临多重挑战:在空间与时间建模中存在内在矛盾,身份和运动难以兼顾,复杂或大幅度动作下易出现面部形变、失真,影响个体识别度。换脸后的视频常需外部后处理修复细节,但仍存在视觉统一性和自然度问题。针对这些痛点,DynamicFace 通过三项核心创新实现突破:一是精准拆分控制人脸关键信息,将人脸条件分解为身份、姿态、表情、光照及背景五个独立表征,减少目标身份泄露并保留源身份。二是设计身份 - 细节双流注入机制,使得生成的人脸在核心身份特征的保留上更加精准,细节更加丰富。三是引入时序一致性模块,保障视频时序连贯性与背景保真度,消除割裂感。 DynamicFace 在众多领域具有显著实用价值。在影视制作中借助该技术,通过演员定妆照即可让“数字替身”在绿幕中实时完成高难度表情捕 捉与重打光,减少重拍、降低成本,开启“先拍脸、后拍景”的降本增效模式。在自媒体与创作领域,能让虚拟主持人的表情更自然,避免恐怖谷效应。这项技术为广电行业图像与视频人脸融合任务提供了全新解决方案,助力内容创作创新发展。 (信息来源:爱转型公众号 mp.weixin.qq.com) AI 工具 3上海人工智能实验室联合破解超长视频生成难题 过去两年,视频生成技术在短视频创作领域进展显著,但制作时长超一分钟、兼具高质量与风格统一的超长视频仍是业界重大挑战。为此,上海人工智能实验室联合南京大学、复旦大学、南洋理工大学 S-Lab 及英伟达等机构,推出 LongVie 框架,系统解决了该领域的核心难题。 传统视频生成模型处理长视频时,常面临时序不一致和视觉退化问题。LongVie 从“控制信号”与“初始噪声”两方面破解:提出“控制信号全局归一化”策略,统一处理整个视频段的控制信号,提升跨片段连贯性;引入“统一噪声初始化”策略,确保各片段共享同一初始噪声,从源头减少片段间的视觉漂移。此外采用多模态精细控制方法,结合密集控制信号(如深度图)、稀疏控制信号(如关键点)及退化感知训练策略,维持长视频的高画质与细节。 LongVie 团 队 还 推 出 首 个 专 为 可 控 超 长 视 频 生 成 设 计 的 基 准 数 据 集LongVGenBench,包含 100 个时长超 1 分钟的高分辨率视频,为领域研究与评测提供支撑。定量指标与用户评测显示,LongVie 多项评估超越现有技术,达到当前最先进水平,获得用户高度认可。LongVie 的诞生为超长视频生成开启新篇章,有望赋予创作者更大创作自由度,助力实现创意构想。 (信息来源 :AI 基地 www.aibase.com) 4可灵 AI2.1 模型首尾帧功能让视频生成精准可控 近日,快手可灵 AI 发布基于全新 2.1 模型的首尾帧功能,效果较前代实现 235% 提升。此次升级源于可灵 AI 对算法架构的根本性重构,以及训练数据质量与规模的突破,使 AI 视频生成工具从粗糙的概念验证工具真正蜕变为专业级创作平台。 传统 AI 视频生成中,用户输入文字描述后只能被动等待结果,无法精准把控视频走向。可灵 AI2.1 模型的首尾帧功能打破了这一局限,创作者可明确指定视频起始与结束画面,模型则基于深度学习算法对视频时空连续性的深刻理解,通过分析海量视频数据,在首尾约束下生成符合物理规律、兼具创意与连贯性的中间帧序列,确保整体视频视觉流畅。从评测结果看,可灵 2.1 模型在与 Seedance 1.0 mini、Midjourney 及自身 1.6 模型的对比中,整体满意度均领先。该模型 235% 的效果提升为 AI 视频生成行业树立了技术标杆,标志着该领域从完全随机生成进入精准可控创作的新阶段。 该技术对多行业产生显著价值。广告营销领域,品牌方可精准控制广告首尾画面以呈现品牌元素,生成创意中间内容,提升制作效率与创意多样性。影视制作行业,导演与制片人能用其快速制作概念预览片段,降低前期沟通成本,帮助创作团队规划拍摄方案和后期制作流程。短剧创作领域,创作者可快速生成场景转换和情节推进片段,降低创作门槛。动画制作领域,动画师可专注关键帧设计与创意构思,将中间帧生成交由 AI,提升效率并聚焦核心创意。 (信息来源 :AI 基地 www.aibase.com) 5即梦 AI 推智能多帧功能:支持多图生成超长镜头 即梦 AI 推出“智能多帧”功能,打破传统视频制 6 作技术壁垒。该功能支持用户上传最多 10 张关键帧图像,由 AI 自动生成最长 54 秒连贯长镜头视频,让缺乏专业剪辑技能但有创意的用户也能完成专业级视频创作。 操作流程上,用户仅需在即梦官网选择该功能,上传关键帧图像,设置每两个关键帧之间的时长参数(建议帧间时长 1-6 秒)与提示词,AI 即可完成后续复杂技术工作。在技术层面,该 AI 系统能够智能分析关键帧图像内容,精准响应推拉、跟踪、环绕等运镜指令,理解镜头逻辑关