⽬目录CONTENT ⼤大模型市场进⼀一步加速01 ⼤大模型应⽤用挑战赛正式拉开序幕02 ⼤大模型⽂文⽣生图能⼒力力洞洞察03 ⼤大模型市场进⼀一步加速 从⼯工信到其他部⻔门,从中央到地⽅方,政策全⾯面关注⿎鼓励⼤大模型发展 第四季度融资规模暴暴增,电商、社交场景应⽤用集中吸⾦金金 •2023年年第四季度,虽然融资事件数量量从第三季度的28件回落⾄至17件,但融资⾦金金额到达46.2亿元⼈人⺠民币,是第三季度的6.4亿元⼈人⺠民币融资规模的6.21倍。 ⾏行行业⼤大模型不不断涌现,通⽤用⼤大模型进⼊入升级和开源阶段 通⽤用⼤大模型专注迭代,⼤大模型赛道⼊入场券所剩⽆无⼏几 •截⾄至2023年年12⽉月,伴随着零⼀一万物Yi-6B和34B的开源,⼤大模型⼚厂商已全部交卷完成,并完成了了平均3轮更更新。并且宣传重点从模型参数,转向模型更更新下的能⼒力力提升。 头部企业⼤大模型发展路路径仍然诸多争议 •此外,本轮⼤大模型带来的能⼒力力提升,也进⼀一步激化了了关于商业模式和AI安全的讨论。第四季度中,国外OpenAI的内⽃斗⻛风波,国内知名投资⼈人与⾏行行业从业者各⾃自多轮发声。 国内部分讨论 OpenAI官宣解雇SamAltman 朱啸⻁虎 ⼤大模型本身创业不不太适合创业者,创业者更更应该去寻找在垂直应⽤用场景落地的机会。但现在真要找垂直应⽤用场景还不不是那么容易易。为什什么?因为今天的⼤大模型还没有那么智能。它在很多垂直场景上,只能让⼈人觉得好玩,还达不不到商业化质量量。这时候真的让⼈人去喝喝⽔水,可能喝喝⼀一两⼝口觉得试试看,但是要⼈人持续地喝喝下去,还需要等⼤大模型再持续的进化。 内外压⼒力力不不断 周鸿祎 在⼤大模型发展这件事上,我是坚定的发展派。原因有两点。第⼀一,⼤大模型的发展⽔水平还远没有到可以威胁⼈人类的程度,现在担忧为时尚早。⼤大模型是有史以来最强有⼒力力的⽣生产⼯工具,未来⼀一定会重塑⽣生产⽣生活,不不发展才是最⼤大的不不安全。第⼆二,任何新技术都有⽆无法预知的安全隐患。谈安全不不是为了了制约发 展。我们要把不不安全的因素⼀一⼀一列列出来,针对每个问题寻找解决⽅方案,让⼈人们更更安全更更放⼼心地拥抱新技术。做安全的⽬目的是为发展保驾护航,安全是⼤大模型发展的底线,也是未来⼤大模型的核⼼心竞争⼒力力。 ⼤大模型应⽤用挑战赛正式拉开序幕 单模态内部应⽤用探索,多模态转换仍找寻商业场景 ⼤大模型应⽤用产品开始规模化涌现,超200款产品⾯面世 ⽂文本⽣生成:模型探索⻓长⽂文本的记忆能⼒力力,产品开始整合⼯工作流 •在底层模型层⾯面,⽂文本⽣生成类产品逐渐开始探索⻓长上下⽂文能⼒力力,逐渐从2-4K拓拓展到100K以上。•⽂文本⽣生成类产品,从ChatGPT为代表的技术突破开始,经历了了去年年⼀一年年的摸索,现阶段的产品已经开始整合⼯工作流。 •以⽂文章写作为例例,从原有的写作流程向前延展⾄至⽂文章选题,向后延展⾄至配图排版发布等完整⼯工作流•以营销⽂文案为例例,从单纯的⽂文案写作流程向前延展⾄至产品/海海报/⽂文章输⼊入,向后延展⾄至多平台⻛风格适配与发布 ⽉月之暗⾯面Kimi智能助⼿手:⽴立⾜足⻓长⽂文本,探索多模态与多任务处理理 •⽉月之暗⾯面作为AI大模型初创企业的佼佼者,推出了了全球⾸首个⽀支持20万(现200万)汉字的⻓长⽂文本输⼊入智能助⼿手产品——kimi智能助⼿手。通过多模态、复杂任务处理理的能⼒力力,为⽤用户提供⾼高效、便便捷的信息服务。 ⽣生产⼒力力⼯工具:⼤大模型能⼒力力内化⽀支撑,融⼊入原有产品形态 •相较于⽂文本⽣生成类产品,⽣生产⼒力力⼯工具并不不局限在⽂文本上,⽽而是在打⼯工⼈人⽇日常办公场景下更更多涉猎到的思维导图、PPT、会议、编程等单⽂文本⽣生成或者图⽚片⽣生成的产品类型。•对于⽣生产⼒力力⼯工具⽽而⾔言,其更更多是在原有产品的基础上,搭载进阶的AI能⼒力力。⽣生产⼒力力⼯工具产品图谱 以新⼀一代编程助⼿手为例例,此类产品,现阶段⼤大多在原有IDE产品形态上,以插件形式调动⼤大模型进阶能⼒力力。 GitHubCopilot:深度融⼊入开发流程的编码⽣生产⼒力力⼯工具 •GitHub Copilot是2022年年6⽉月由代码托管平台GitHub和⼈人⼯工智能研究机构OpenAI联合推出的智能编码助⼿手。 对话式助理理:图⽚片模态能⼒力力逐渐成为标配 伴随着图⽂文模型的研究进展,图⽚片模态能⼒力力逐渐加⼊入了了对话式聊天产品的能⼒力力矩阵当中。图⽚片理理解能⼒力力和图⽚片⽣生成能⼒力力之间循环反馈,在对话当中提升交互感的同时,也为相关产品未来能更更⼴广泛的应⽤用,例例如医学影像分析,提供了了更更多的可能性。 图⽚片⽣生成能⼒力力 图⽚片理理解能⼒力力 ⽂文本到图像⽣生成,可以根据输⼊入的⽂文本进⾏行行绘制⽣生成⽬目前有两种⽅方式,⼀一种是产品底层模型原⽣生⽀支持,⼀一种是通过插件调⽤用获得 •图像到⽂文本理理解,可以对输⼊入的图像进⾏行行描述、理理解和对话•⽀支持多种格式图⽚片输⼊入(JPEG、PNG、GIF、BMP) 图⽚片⽣生成:C端挑战写真馆,B端冲击设计师 •图⽚片⽣生成类产品,正在形成交互式⼯工作流,在图⽚片产出效率、交互式后期中,探索C端和B端应⽤用。 图⽚片⽣生成交互式⼯工作流示意图 图⽚片⽣生成产品主要功能、收费模式和现阶段核⼼心痛点示意图 ⽤用户输⼊入提示 现阶段核⼼心痛点 收费模式 可能是⽂文字提示词(正向、负向),也可能是图⽚片(草图、参考图)+⽂文字提示词的形式 •付费会员制:通常在免费基础版本上,提供部分功能升级或新功能,例例如⾼高清晰度、⽆无⽔水印输出、定制化⻛风格等 •有限的需求频率:并⾮非每个⼈人⽇日常⾼高频需求,⽤用户的持续付费意愿不不⾜足 ⽤用户思考提示词的过程就是原先的前期思考环节,准确⾼高效的提示词是交互式⼯工作流的基础。 隐私和安全顾虑:⽣生成可能涉及⽤用户的个⼈人信息或敏敏感数据,如⾯面部识别等。⽤用户可能对其隐私和安全存在顾虑,因此不不愿意持续使⽤用或付费 •订阅制:提供按⽉月或按年年订阅的服务,⽤用户可以享受更更多特权和更更新的功能 图⽚片快速⽣生成 从草图到成品,加速对应图⽚片制作周期,提⾼高产出效率 •API调⽤用模式:企业按照使⽤用量量付费,例例如每⽣生成⼀一张图⽚片⽀支付⼀一定费⽤用,或者根据API调⽤用次数⽀支付费⽤用 经济账:定制化场景下的设计需求与图⽚片⽣生成产品成本之间的平衡 •版权和安全顾虑:⽣生成可能涉及商⽤用版权或商业数据安全。产品提供商需要确保数据的安全性和隐私保护措施,以获得企业⽤用户的信任和采⽤用 B端 交互式后期 •定制化:提供按⽉月或按年年订阅的服务,⽤用户可以享受更更多特权和更更新的功能 更更直观的后期修改流程,覆盖⼈人脸编辑、⻛风格转换、图像修复、局部重绘、背景切换、后期调⾊色等 数据来源:InfoQ研究中⼼心根据资讯、报道、公司官⽹网等公开渠道整理理 美图设计室:⼀一站式电商物料料设计提效⼯工具 •美图设计室是美图公司⾯面向⼯工作场景推出的智能设计⼯工具,聚焦在商品营销个环节物料料设计,从商品图模特图的⽣生成,到修图改图,到海海报设计,帮助⽤用户⼀一站式智能⽣生成商品物料料。“AI商拍”为美图设计室的核⼼心亮点功能,聚合了了2023年年4⽉月以来相继上线的多个AI功能,如“AI商品图”、“AI模特试⾐衣”、"服装换⾊色"等,解决⽤用户商品拍摄的问题。另与美图设计室的“智能抠图”、“海海报设计”等功能配合,为电商物料料设计提供⼀一站式解决⽅方案。 •截⽌止2023年年12⽉月,“AI商拍”累计⽣生成超过1.3亿张商品图,累计服务超过218万电商⽤用户。 ⽆无需拍摄团队/专业模特/真实置景 视频⽣生成:海海外挑战好莱坞,国内技术突破下准备迎接爆款产品 •海海外视频⽣生成已诞⽣生明星产品,例例如Pika、Runway、NeverEnd。Meta、Google发布模型相关论⽂文,但尚未公开其产品。•国内视频⽣生成技术成果频繁发布,多框架仅需⼀一图即可⽣生成娱乐动态(跳舞、瑜伽等)视频。阿⾥里里Animate Anybody已⽀支撑通义舞王功能上线通义千问⼿手机端APP,爆款⼩小品正在路路上。 ⽂文/图⽚片⽣生视频单路路径 国内四⼚厂商提出视频⽣生成框架 •⽂文⽣生视频:VidRD-复旦⼤大学联合华为诺亚⽅方⾈舟实验室提出,在⽣生成视频质量量和⻓长度•图⽣生视频:Animate Anybody-阿⾥里里(已加载进通义千问App)、MagicAnimate-字节和新加坡国⽴立、PixelDance(⽀支持⽣生成⻓长达3min的视频)-字节、LivePhoto-阿⾥里里和港⼤大 •Moonvalley.ai:⽀支持5种视频⻛风格和5秒以内的3种时⻓长选择•Emu Video-Meta:⽀支持⽣生成4秒以内的⾼高清视频(论⽂文)•NeverEnd2.0:更更新图⽣生视频功能 视频⽣生成全家桶 国内爆款⼩小品正在路路上 •Runway升级Gen-2模型:⽀支持⽂文本、图像、⽂文本+图像⽣生成视频的⽅方式。增加导演模式,以⽣生成类似真实相机拍摄电影效果的视频。•Pika1.0发布:⽀支持⽂文本、图像、视频⽣生成视频的⽅方式,编辑及局部修补(换装、增减物品)•VedioPoet-Google:⽀支持⽂文本/图像⽣生成视频⽅方式,⽀支持⽣生成⻓长达10秒的视频(论⽂文)•Stable Video Diffusion:⽀支持⽣生成2-4秒的视频 发展挑战:商业化盈利利⽅方式有待进⼀一步验证 ⼤大模型技术正在度过最⼩小MVP阶段,即将进⼊入盈利利场景挖掘和竞争阶段 新盈利利场景急需挖掘 以盈利利为⽬目标,在众多可⾏行行的应⽤用场景中挖掘可以持续经营的场景。⽬目前的盈利利场景尝试还多集中在原有商业模式的提效和升级环节。 多样化盈利利场景构建 ⽬目前市场的盈利利场景整体较为类似,同质化程度较⾼高,市场有可能会⾯面临⼩小范围场景的⾼高强度过度竞争情况。 技术度过可⽤用奇点 技术从研究和开发阶段转向具备实际应⽤用潜⼒力力的关键时刻,技术已经达到⼀一定的成熟度。但是对于多模态等技术⽬目前仍然未形成产品原型或解决⽅方案。 发展挑战:AI安全仍然是市场中⽆无法避免的挑战 ⼤大模型⾃自身的安全挑战 ⼤大模型⽣生成内容的安全 业内⽬目前是通过⻓长⽂文本、向量量数据库+RAG的技术⽅方案解决⼤大模型幻觉安全挑战 数据隐私安全、训练数据泄露露⻛风险⼤大模型训练数据安全挑战 ⽉月之暗⾯面、百川⼤大模型等产品通过⻓长⽂文本来解决此问题;通义千问、天⼯工、星⽕火、零⼀一万物等是通过向量量数据库+RAG的技术路路线来尝试解决。 ⼤大模型运⾏行行安全挑战 ⼤大模型⾯面临着来⾃自恶意攻击者的对抗攻击、后⻔门攻击、成员推断攻击、模型窃取、Prompt投毒等威胁。 主要从技术层⾯面出发,尚未形成产业级解决⽅方案⼤大模型可控安全挑战 ⼤大模型的安全整体解决⽅方案 奇安信-⼤大模型卫⼠士、深信服-安全⼤大模型、360-360安全⼤大模型、安恒信息-恒脑安全垂域⼤大模型、天融信-天问⼤大模型 ⼤大模型⽂文⽣生图⽚片能⼒力力洞洞察 ⽂文⽣生图⽚片产品尚属绘画和设计的初级阶段 •根据能⼒力力成⻓长阶段,绘画和设计实际分为三个阶段:画/设计得合理理、画/设计得美观、画/设计得创意。根据测评结果,现阶段⽂文⽣生图⽚片产品仍处在第⼀一阶段,离完全的商业可⽤用级仍有⼀一定差距。 现阶段⽂文⽣生图⽚片产品所处阶段 ③画/设计得创意 ②画/设计得美观 •创意创作能⼒力力:内容、构图、造型、⾊色彩、质感等创意⽣生成•⼈人⽂文理理解能⼒力力:对艺术、⽂文化、历史和理理论的深⼊入理理解和运⽤用•产品理理解能⼒力力:产品定位和市场需求的深⼊入理理解和运⽤用 ①画/设计得合理理 •