您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[光大证券]:AI行业跟踪报告:软件&硬件双管齐下,字节加速构建豆包生态 - 发现报告
当前位置:首页/行业研究/报告详情/

AI行业跟踪报告:软件&硬件双管齐下,字节加速构建豆包生态

信息技术2024-12-17光大证券福***
AI智能总结
查看更多
AI行业跟踪报告:软件&硬件双管齐下,字节加速构建豆包生态

2024年12月17日 行业研究 软件+硬件双管齐下,字节加速构建豆包生态 ——AI行业跟踪报告第47期 电子行业 买入(维持) 作者 分析师:刘凯 执业证书编号:S0930517100002 021-52523849 kailiu@ebscn.com 分析师:白玥 执业证书编号:S0930524070017021-52523683 baiyue@ebscn.com 分析师:王之含 执业证书编号:S0930524070008 021-52523691 wangzhihan@ebscn.com 行业与沪深300指数对比图 28% 15% 2% -12% -25% 12/2303/2406/2409/24 电子行业沪深300 资料来源:Wind 要点 一、字节跳动:中国互联网巨头企业 1.1字节跳动:打造多平台APP矩阵 北京字节跳动科技有限公司成立于2012年3月,是最早将人工智能应用于移动互联网场景的科技企业之一。公司以建设“全球创作与交流平台”为愿景,以“InspireCreativity,EnrichLife(激发创造,丰富生活)”为使命,以“追求极致务实敢为、开放谦逊、坦诚清晰、始终创业、多元兼容”为“字节范儿”,并且对于“行为准则”高度重视,制定了企业行为准则以及合作伙伴行为准则。 字节跳动在全球推出了多款有影响力的产品,包括今日头条、抖音、西瓜视频、飞书、Lark、PICO、剪映、TikTok等。 图1:字节跳动产品矩阵 资料来源:新浪财经 2021年11月2日起,新任CEO梁汝波发布全员邮件,宣布字节跳动将进行组织调整,实现业务线BU化(BusinessUnit),成立六大业务板块,包括抖音、大力教育、游戏、飞书、火山引擎、TikTok。 1.2抖音:国内第一短视频平台 抖音(Douyin)是字节跳动2016年9月上线的音乐创意类短视频社交平台。其定 位为一个帮助用户表达自我、记录美好生活的平台。上线初期可录制并发布15 秒短视频,2022年9月起放开30分钟长视频权限。同时也能为视频添加特效、背景音乐、发起话题,并对其中的内容进行评论、点赞、转发等操作,具备丰富的内容展现功能和社区互动功能。 抖音流行的转折点出现在2018年春节。字节跳动在移动端电影票选座信息和春运时段的京九铁路线上投放抖音广告,并邀请众多明星进行红包推广。春节假期期间,抖音DAU从3000万涨到了7000万。2018年3月19日,抖音品牌升级,发布全新slogan“记录美好生活”,这意味着抖音正试图摆脱最初开始音乐创意短视频社交的定位,向快手迫近。在发布会上,抖音同步宣布了“美好生活”计划,围绕“记录美好生活”这一主题,包括“DOU”计划、“美好挑战”计划、社会责任计划三部分。抖音在2018年6月12日首次对外公布了自己的 用户数据:中国的日活用户突破1.5亿,月活用户超过3亿。 1.3TikTok:MAU位列全球TOP5社交应用 字节跳动的海外业务发展历程可以分为三个阶段:国际化探索阶段、国际化提速阶段和国际化深耕阶段。 一、国际化探索阶段(2015-2016年) 在这一阶段,字节跳动通过“Build&Buy”策略实现海外扩张,专注于新闻资讯领域。 2015年1月:今日头条APP在国内累计用户超过2.2亿,月活跃用户(MAU)达2000万。 2015年8月:发布今日头条的海外版TopBuzz,标志着海外布局的开始。 2016年10月:领投印度新闻聚合平台DailyHuntD轮融资,投资额达2500万美元,并在2017年2月通过二级市场购买1920万美元DailyHunt股份。同年12月,字节跳动控股印度尼西亚的新闻推荐阅读平台BABE。 二、国际化提速阶段(2017-2018年) 2016年9月:西瓜视频海外版BuzzVideo上线。 2017年:收购美国移动短视频公司Flipagram,并投资Vshow。5月,抖音国际版TikTok上线;7月,推出海外版火山小视频VigoVideo;11月,收购Musical.ly(于2018年8月与TikTok合并)。 三、国际化深耕阶段(2019年至今) 2019年4月:企业办公套件产品Lark上线。 2020年3月:音乐流媒体Resso和主打分享种草的Sharee(后更名为Lemon8)上线;4月,剪映的海外版本CapCut发布。 2021年2月:手机阅读应用程序Fizzo在Googleplay上线;11月,独立电商App商城Fanno、TikTokSeller和小说应用Mytopia上线。 2022年2月:漫画App“FizzoToon”上线。 2023年:TikTok通过推出PulsePremiere,重组电商业务,与美国仓库合作,提高物流效率,并推出了文本帖子功能丰富内容形式。同年,TikTok在爱尔兰都柏林启动了数据中心,上线了TikTokShop,并与Billboard 合作推出排行榜。TikTok宣布在欧洲的投资计划,并与印尼GoTo集团达成了电商战略合作。 2024年:TikTok调整美国的销售佣金政策,与Peloton、谷歌等公司达成合作,测试新的购物功能,并完成对GoTo电商子公司Tokopedia的收购。TikTok面临美国政府的剥离要求,但通过法律途径进行抗争。此外,TikTok开始测试长视频功能,与亚马逊合作,推出群聊功能,并在尼泊尔解除了禁令。TikTok宣布将关闭音乐流媒体服务TikTokMusic,并在加拿大面临业务限制。 根据Shoplus超店发布的《2024年上半年TikTok电商数据报告》,TikTok2024年上半年,在全球多个市场高歌猛进。从下载量和月活数看,全球下载量稳步增长,美区MAU达1.7亿以上。2024年上半年,TikTok全球月均下载量达到8173万次,同比去年上升6.6%。其中,5月份下载量达到新高,突破8670亿次。从月活跃用户量来看,上半年美国月活稳定在1.7亿以上,在TikTokShop国家中位居第一,并未受到“禁令”影响。从新增下载量来看,东南亚地区(如印度尼西亚、越南、菲律宾)、南亚(巴基斯坦、孟加拉国)以及拉美(巴西和墨西哥)是2024年上半年TikTok的主要增量市场。 二、字节豆包:中国第一AIAPP 2.1豆包大模型:字节跳动的AI大模型家族 2016年,张一鸣在公司内建立了AILab,力邀微软亚洲研究院前常务副院长马维英、华为诺亚方舟实验室原主任李航、自然语言处理技术专家李磊等多位科学家加入,设立了包括计算机视觉(CV)、自然语言处理(NLP)、语音和音频处理、音乐、机器学习等多个子团队,几乎覆盖当时人工智能涉及的所有前沿领域。同时,这个实验室在北京、上海、深圳、新加坡、美国、欧洲等地都设有办公室。马维英被委任为AILab负责人,直接向张一鸣汇报。 图2:字节的AI研发三阶段图3:字节的AI研发三阶段 资料来源:新皮层、第一财经,光大证券研究所资料来源:新皮层、第一财经,光大证券研究所 2023年字节正式发布其大语言模型,2024年相继补全了图像、语音、音乐、视频、3D等不同模态的生成式AI模型。在这一轮生成式AI浪潮中起步最晚的字节,已经成为目前拥有最全生成式AI模型、最多AI应用的技术公司。 豆包大模型是字节跳动推出的AI大模型家族,包括豆包PixelDance、豆包Seaweed视频生成、文生图、图生图、同声传译、角色扮演、语音合成、声音复刻、语音识别、FunctionCall和向量化等多个模型。豆包大模型具备强大的 语言理解、生成和逻辑能力,能进行个性化创作、情绪丰富的语音合成、高精度语音识别、多风格图像生成和顶级的视频生成。豆包大模型通过火山引擎提供服务,支持企业和开发者构建智能化应用,推动AI技术在多种业务场景中的落地。 豆包大模型的性能在多个评测中表现优异,例如在包括MMLU、BBH、GSM8K和HumanEval在内的11个业界公认的基准测试集中,Doubao-pro-4k模型的总体得分达到了76.8分,在代码能力、专业知识和指令遵循等方面的显著进步。 研发团队类型产品 表1:字节跳动在生成式AI竞争中采取饱和式进攻策略 Seed 模型 语言模型Doubao-pro、Doubao-lite 语音模型Seed-ASR(语音识别)、Seed-TTS(语音生成) 图片模型SDXL-Lightning(文生图)、SeedEdit (图像编辑) 音乐模型Seed-Music Boximato(r视频编辑)、MagicVideo-V2 (文生视频)、AnimateDif-Lightning 视频模型 (文生视频)、PixelDance(文生视频、图生视频)、Seaweed(文生视频、图生视频) 多模态模型BuboGPT 3D模型MVDream ByteDanceResearch具身智能模型GR-2、GR-1 智能助手豆包、cici(海外) 工具集小悟空 Flow 剪映 应用 社交猫箱、AnyDoor(海外) 图像星绘、PicPk(海外) 智能体开发平台扣子、Coze(海外) 图片/视频生成即梦AI、Dreamina(海外) 视频剪辑剪映、Capcut(海外) 教育豆包爱学、Gauth(海外) 大力教育数字人抖音AI分身(KOL内测)、TikTokAI网红 抖音TikTok抖音电商内容生成即创 编程助手豆包MarsCode、MarsCode(海外) 字节跳动开发者服务团队 其他 模型分享社区炉米(Lumi) 教育识典古籍 音乐生成海绵音乐 硬件 资料来源:新皮层、第一财经,光大证券研究所 Oladance+Flow智能体耳机OlaFriend 大力教育智能台灯大力智能学习灯FoloToy+火山引擎智能玩偶显眼包 2024年5月15日,字节跳动产品和战略副总裁朱骏在2024春季火山引擎Force原动力大会上表示,豆包APP总下载量达1亿次,豆包大模型将开启商业化模式,价格相比同行便宜99.3%,定价0.0008元/千Tokens。大模型的“token”是指在自然语言处理任务中,模型所使用的输入数据的最小单元。这些token可以是单词、子词或字符等;8月8日,豆包上线音乐生成功能,用户可以在豆 包“音乐生成”中输入主题或歌词,设定音乐风格、情绪及音色,便能快速生成一首约1分钟的词曲,并支持一键分享至抖音等社交平台。 2024年9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,火山引擎总裁谭待宣布推出豆包视频生成模型。两款新发布的大模型分别是豆包视频生成 -PixelDance和豆包视频生成-Seaweed,这两款大模型的发布意味着字节跳动首次正式宣告进军AI视频生成;10月10日,豆包发布首款AI智能体耳机OlaFriend,该耳机与豆包APP深度结合,是豆包在AI场景下的探索和尝试。 2024年11月7日,豆包正式推出视频生成内测,这意味着继快手、商汤、Minimax等公司后,字节跳动正式进入AI视频生成领域。豆包视频生成模型基于DiT架构,通过融合计算单元,使得视频在大动态与运镜中自由切换,并且支持多风格、多比例的一致性多镜头生成,可应用在电商营销、动画教育、城市文旅、微剧本等领域;12月3日,豆包上线图片理解功能。 2.2豆包:中国第一和全球第二 字节2024年年中发起国内大模型价格战。2024年5月,火山引擎FORCE原动力大会上,字节跳动正式发布豆包大模型。豆包通用模型pro-32k版的推理输入价格为0.0008元/千tokens,比行业均价低99.3%。这意味着客户花一元钱就能让豆包模型处理200万个汉字,相当于3本《三国演义》——当时花同样的钱只能向GPT-4输入不到4000字,甚至不够一篇短篇小说。面对字节发起的价格战,竞争对手不得不快速跟进。阿里云将其通义千问主力模型的价格下调 97%