AI智能总结
DeepSeek 开源全新视觉多模态模型 Janus-Pro-7B..............................06腾讯推出 AI 生成内容检测工具,以 AI 制衡 AI.............................................06调查:观众呼吁明确标注 AI 生成内容......................................................07 制 作 DPA 公司推出 CORE+ 技术打造无失真麦克风音质...............................07Singular 与 Akta 合作推出云播控动态图形功能.........................................08 传输 沃达丰完成全球首次普通智能手机卫星视频通话.........................................08美国 Comcast 合作推出基于 L4S 的超低延迟网络....................................09 终端与应用 谷歌发布基于 Gemini 的 AI 电视交互功能................................................09Quickplay 推出竖屏短视频内容创建与整合工具..........................................10 摘 要 A IArtificial Intelligence DeepSeek 开源全新视觉多模态模型 Janus-Pro-7BDeepSeek 开源全新视觉多模态模型 Janus-Pro-7B P06 1 月 28 日,DeepSeek 宣 布 开 源 视 觉 多 模 态 模 型 Janus-Pro-7B,该模型在多模态理解和文生图指令遵循能力方面实现了显著进步,并增强了文生图的稳定性,性能超过 StableDiffusion 和DALL-E3,有望加速多模态 AI 在图像生成、内容创作等领域的应用落地。 腾讯推出 AI 生成内容检测工具,以 AI 制衡 AI腾讯推出 AI 生成内容检测工具,以 AI 制衡 AI P06 腾讯朱雀实验室推出 AI 生成文本与图像双模态检测工具,利用AI 技术捕捉真实内容与 AI 生成内容的细微差异,精确识别生成痕迹。该工具检出率超 95%,将为数字内容可信认证提供技术支撑。 调查:观众呼吁明确标注 AI 生成内容调查:观众呼吁明确标注 AI 生成内容 P07 美国 Hub 公司的调查报告显示,超 66% 的观众担忧“深度伪造”和隐私泄露风险,认为 AI 生成的内容需显著标注。受访者普遍认为创意领域应以人类为主导,技术性任务则可利用 AI 进行增强。 制作Production DPA 公司推出 CORE+ 技术打造无失真麦克风音质DPA 公司推出 CORE+ 技术打造无失真麦克风音质 P07 丹麦 DPA 公司推出突破性麦克风技术 CORE+,通过消除麦克风振膜和电子元件产生的非线性失真,实现前所未有的声音保真度和声音细节再现水平,在处理录音和现场制作中,都能提升听觉体验。 Singular 与 Akta 合作推出云播控动态图形功能Singular 与 Akta 合作推出云播控动态图形功能 P08 美国 Singular.live 与罗马尼亚 Akta 合作为 FLEX 云播控频道引入广播级动态图形功能。双方通过 AI 在云端自动生成动态元数据,利用图形引擎实时驱动动态图形并嵌入节目流,可降低 80%的生产成本,并为观众带来更好的直播体验。 摘 要 传输Transmission 沃达丰完成全球首次普通智能手机卫星视频通话沃达丰完成全球首次普通智能手机卫星视频通话 近日,沃达丰利用普通 4G/5G 智能手机和 BlueBird 卫星,完成了全球首个普通手机卫星视频通话。此技术有望将 4G/5G 服务扩展至全球偏远地区,缩小数字鸿沟,为未来普遍连接奠定基础。 美国 Comcast 合作推出基于 L4S 的超低延迟网络美国 Comcast 合作推出基于 L4S 的超低延迟网络 P09 美国 Comcast 公司联合 Meta、英伟达、Valve 推出美国首个基于 L4S 技术的超低延迟网络 Xfinity。L4S 技术通过优化数据包传输流程,显著降低网络延迟,提升用户游戏、视频聊天和 XR 体验。 终端与应用Terminals and Applications 谷歌发布基于 Gemini 的 AI 电视交互功能谷歌发布基于 Gemini 的 AI 电视交互功能 P09 谷歌展示了基于 Gemini 人工智能模型的全新电视交互功能,包括生成当日新闻摘要、通过自然对话简化媒体内容搜索等。该功能将于今年晚些时候上线,可能会直接与传统电视新闻节目竞争。 Quickplay 推出竖屏短视频内容创建与整合工具Quickplay 推出竖屏短视频内容创建与整合工具 加 拿 大 Quickplay 公 司 近 日 推 出 一 款 短 视 频 创 建 与 整 合 工 具QuickplayShorts。该工具基于 AI 技术,将直播和点播视频内容自动生成竖屏短视频,帮助流媒体平台吸引年轻观众并提升用户粘性。 P10 A I 1DeepSeek 开源全新视觉多模态模型 Janus-Pro-7B 1 月 28 日,DeepSeek 宣布开源全新视觉多模态模型 Janus-Pro-7B,该模型在基准测试中表现优异,性能超越 Stable Diffusion 和 DALL-E 3 等知名模型。相较前代版本,Janus-Pro-7B 在多模态理解和文生图指令遵循能力方面实现了显著进步,同时增强了文生图的稳定性。 Janus-Pro-7B 采用了一种创新的自回归框架,通过将视觉编码过程拆分为多个独立路径,实现了理解与生成任务的协同。在理解任务中,模型采用 SigLIP-L 视觉编码器处理 384×384 像素图像;在生成任务中,则通过专用分词器实现 16 倍降采样。这种解耦设计缓解了传统模型中常见的任务冲突问题。同时模型采用单一 Transformer 架构提升了框架的灵活性和效率。此外,Janus-Pro-7B 在 DeepSeek-LLM-7B 基座模型的基础上扩展了参数规模,并引入优化的混合训练策略和海量的多模态训练数据,进一步推动了性能的跃迁。 Janus-Pro-7B 的 发 布 有 望 加 速 多 模 态 AI 在 图 像 生 成、 内 容 创 作 等领域的应用落地,推动 AI 技术向更智能、更高效的方向发展。同时,DeepSeek 推出了一种极简的多模态框架 JanusFlow,通过集成自回归语言模型与校正流生成技术,降低了多模态模型的开发门槛。基于该框架,开发者无需复杂的架构调整即可取得与各领域专用模型相当甚至更好的性能。 (信息来源 :IT 之家 www.ithome.com) 2腾讯推出 AI 生成内容检测工具,以 AI 制衡 AI 1 月 17 日,腾讯旗下朱雀实验室发布全新 AI 生成文本与图像双模态检测工具,旨在应对当前 AI 生成内容渗透率超过 37% 的行业挑战。该工具的核心在于“以 AI 制衡 AI”,通过捕捉真实内容与 AI 生成内容之间的细微差异,精准识别 AI 生成痕迹,为网络信息安全与内容真实性提供有力保障。 在技术实现上,该工具在图像检测方面基于 140 万份正负样本训练,通过分析真实图片与 AI 生成图片在纹理、语义及隐形特征上的差异实现鉴别,测试检出率超过 95%。而在文本检测方面,该工具依托大数据学习与对比算法,通过对比待检测文本与大模型预测文本的重叠度实现鉴别。研发团队表示,将继续优化该工具的性能和准确性。 该工具已支持新闻、公文、小说等主流文体,未来计划兼容诗歌等更多文学形式。该工具将率先应用于微信生态内容审核与腾讯文档原创性校验场景。这将为数字内容的可信认证提供坚实的底层技术支持,维护网络空间秩序。 (信息来源:IT 之家 www.ithome.com) 3调查:观众呼吁明确标注 AI 生成内容 近日,美国 Hub 娱乐市场研究公司发布的一项调查报告显示,观众对AI 在内容创作领域的应用表现出高度关注,其中内容标注“透明化”已成为广泛共识。超 66% 的受访者认为 AI 生成的内容应进行“显著标注”,他们对难以察觉的“深度伪造”内容和潜在的隐私泄露风险表示非常担心;26% 的受访者支持建立相关核查系统;而仅 6% 的人认为无需注明 AI 生成内容。调查还显示 57% 的人对 AI 可能引发的失业风险感到焦虑。 此外,受访者普遍认为创意领域应保留人类的文化和创新空间,而技术性任务则可以利用 AI 进行增强。例如,72% 的受访者认为编剧工作应由人类主导,68% 支持对白创作由人类完成,以及 65% 的受访者认为音乐制作应以人为核心。而在技术性任务中,61% 的受访者支持用 AI 生成特效,58% 认为字幕制作可由 AI 辅助,56% 的人赞同使用 AI 生成节目摘要。 该报告提出,行业应根据不同领域的特点采取差异化策略。在用户接受度较高的领域,如内容发现和特效等,可以加速 AI 技术的应用;而在核心创意环节,则应保持审慎态度。最为关键的是,行业需建立透明的 AI 使用规范,通过明确的标注和说明机制,逐步培养用户对 AI 的信任。 (信息来源:TVTechnology 官网 www.tvtechnology.com) 制 作 4DPA 公司推出 CORE+ 技术打造无失真麦克风音质 近日,丹麦 DPA 公司宣布推出突破性麦克风技术 CORE+,为无失真麦克风音质树立了新标准。该技术通过消除麦克风振膜和电子元件通常产生的非线性失真,实现了前所未有的声音保真度以及声音细节再现水平。无论是处理录音还是现场制作,该技术都能提供纯净无瑕的音频,提升听觉体验。 CORE+ 技术的核心在于能够中和麦克风整个动态范围内的失真,使残 留噪音难以察觉且几乎无法测量。同时,它可以减少现场声音环境中不可预测的风险,例如表演者突然提高音量,以及同时使用多支麦克风造成的干扰。CORE+ 技术还能消除伪影,同时提升整个声音的透明度,为专业人员创造他们想要的音频提供更大的自由度。 DPA 将在今年的 NAMM 展会和欧洲 ISE 展会上展示该 CORE+ 技术。该技术容许 DPA 的麦克风保留原有技术规格,包括动态范围和噪声水平,因此 DPA 的现有用户将能够用 CORE+ 技术解决方案升级其麦克风设备。 (信息来源:电视新闻查询网 tvnewscheck.com) 5Singular 与 Akta 合作推出云播控动态图形功能 近日,美国实时图形平台 Singular.live 与罗马尼亚电信公司 Akta 宣布达成合作,为 Akta 的 FLEX 云播控频道引入广播级动态图形功能。FLEX 频道是基于云端调度的实时线性电视频道,支持无缝分发,可同时作为免费广告支持电视(FAST)频道和传统广播频道运营。 根据合作协议,双方利用 AI 技术在云端自动生成动态元数据,利用Singular 的图形引擎实时生成高质量动态图形,并将图形嵌入节目视频流中。相比传统本地广播流程,该方案可降低 80% 的生产成本,同时支持传统线性广播和数字化制作中的任何实时工作流,具备高度灵活性。该方案还具备低延迟特性,能为观众带来更好的直播体验。 Akta 公司 CEO 指出,此次合作满足了客户对自适应、数据驱动和互动式图形的需求,公司的视频平台简化了从内容采集到播放变现的全流程管理,通过集成 Singular 的动态图形技术,FLEX 频道能即时应用互动式视觉元素,提升实时线性频道与 FAST 频道的观赏体验,在大规模体育赛事等应用场景中具有