您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:国内互联网大厂及AI厂商大模型进展和落地现状–20230328 - 发现报告
当前位置:首页/会议纪要/报告详情/

国内互联网大厂及AI厂商大模型进展和落地现状–20230328

2023-03-28未知机构天***
国内互联网大厂及AI厂商大模型进展和落地现状–20230328

国内互联网大厂及AI厂商大模型进展和落地现状:目前我们可以看到在这一轮ChatGPT所带来的语言大模型热潮,不但在全球领域,包括像OpenAI的ChatGPT、GPT1-4、Google 的LaMDA、PaLM以及 Meta AI 等。目前在海外的发展已经是非常火热。国内发展情况:1)迎头赶上的趋势,大厂都在做积极投入,强势的应用也在积极酝酿中。包括昨天百度文心一言的发布。目前BAT、字节、华为等的国内大模型有很多令人期待的地方,比如21年年初发布的阿里通义M6大模型,是过千亿的中文参数语义大模型;去年10月发布的腾讯混元,也是破千亿的语言大模型,近日腾讯宣布要发布腾讯版的chatgpt,叫做腾讯混元助手。后续可能会在微信社交对话,广告广点通或者腾讯新闻内部的二方业务中有令人期待的落地。2)百度文心一言是国内首个语义大模型的终端应用,NLP技术上在国内处于第一梯队。昨天文心一言发布了关于数据层的信息、下游生态的展望与商业前景。相对处于先发优势地位。3)除了大型科技公司,包括二线厂商和start-up,比如玄机、360、京东(ChatJD)、AI四小龙(商汤、旷视)、国内高校或科研院所(复旦的MOSS、智源研究院悟道)都有比较好或者前沿的技术层投入。4)国内没有能直接对标chatgpt的应用,文心一言随着对公有云PaaS的调用,做付费的商用接口,下半年应用层的竞争格局会逐渐明朗。包括像创新搜索的业务场景,以及目前在海外很火热的应用产品,比如Jasper、微软基于GPT-4的office系列、Google的workspace。后续再国内应用层,比如办公、创作者工具、智能硬件、客服等领域会迎来强有力的竞争。Q1:百度模型的状况是什么,性能上能对标GPT大概多少?百度的ERNIE模型,最新是ERNIE 3.0,是在中文语义方面的大模型,参数量2600亿,性能表现上:1)文心一言主要是中文语义方面的应用,比如长语句、复杂语句、模糊指令等上游任务的理解能力还是非常不错2)数学、逻辑推理方面有非常不错的表现3)多模态能力,包括text-to-text/text-to-image,这是相对GPT来说比较突出的一个点。GPT-4主要还是以text为主。整体的输入、中文理解领域,文心主要对标GPT-3.5。Q2:哪些方面能达到3.5,哪些弱一些,哪些优秀一些?从不同benchmark上对标:1)语言语种。ERNIE是local产品,文心所支持的语言语种理解以中文为主加小部分英文。面向的还是中文用户全体,chatgpt是global的大产品,主要支持英文,除了英文也支持中文,还支持德语、法语、西语、葡语、阿拉伯语,不仅支持语言学的知识,以及这些语言学下的各种区域性知识和事实性知识。就像昨天文心一言在秀遣词造句和古文的生成能力,是拥有中文语言的能力,chatgpt在多地区多语言下也有类似这种区域性知识。最大的benchmark差距点还是在支持的用户群体上,两者有很大的差别。2)中文语言下的功能,下游的知识生成和理解方面,从各渠道内部测评上,中文语义生成知识的内容准确性和丰富性,两者是在不同的 feature 上各有优劣,整体处在一个水平线上,ERNIE在遣词造句、引经据典、文本的丰富性和多样性上比chatgpt好。多轮对话、连续对话的稳定、准确性,文心一言不如chatgpt,数理、逻辑推理、代码生成、补全查漏补缺,文心和chatgpt有差距。差距是因为chatgpt模型上线,用户数据持续不断回流,模型多轮迭代,模型表现变好。虽然文心发布较晚,但随着中文互联网环境上被用户不断使用是会持续迭代和变好的。Q3:未来商业化变现途径?1)基于B端公有云服务,向下游商业生态进行技术赋能。主要的商业逻辑或者思路包括两大类,1)像 Openai 将GPT模型家族的base模型部署到Microsoft Azure云上做公有云的PaaS级产品,以未调用的 API 的方式在下游按生成量、按 token 进行付费输出。后续文心一言在百度智能云或者是百度大脑上也有类似这种商业接口付费调用模式的计划。2)行业或产业解决方案。国内央国企、大B、大K客户,对数据安全有布局要求,以项目制自由化交付,线下的客户case by case收费。2)C端业务场景。办公场景,比如Microsoft office、Google workspace,后续国内商业办公、商业文档等类似企业服务产品,或者对于new bing、news browser创新的搜索引擎,还有比如GPT Pro会员付费模式、知识内容平台、内容营销服务平台、百度音箱、或者小米小爱这种结合了内嵌gpt版本产生的增强对话理解智能硬件产品,这种智能硬件产品也会有新的产品型号,或者是以硬件的采购或者消费类电子购买为主的商业形式。应用层的应用会非常多样。Q4:定价大概在什么范围?比如GPT是0.02、0.03美金一千个token,转换到国内的定价范围大概是什么?包括b端c端整体的定价节奏?Openai的GPT模型大概分成两种计价逻辑在Azure云上售卖:1)GPT的base模型,包括ada、babbage、curie、davinci这些的收费是按token,从 0. 002 美金到 0. 02 美金,根据能力的不同进行标准的 base 模型收费。2)很多企业或行业,拥有自有专业数据或者知识库,有二次微调、二次精调的诉求,OpenAI也支持企业基于自己的数据或者知识进行二次三tuning之后,部署到Azure云上进行后续付费调用,这个会贵6-10倍左右。2)国内类chatgpt或者大模型产品,我个人认为,成本上应该比openai再高一些,整体定价不会偏离openai在大模型行业的基准,不会比Openai GPT调用模型的使用成本有量级上的差别,可能会对标同期同类型的产品定价。尤其是今年上半年全球大模型产业化浪潮中,背后的商业逻辑会是前期以抢占份额为主,打价格战。比如国内大模型会根据0.02美金一千个token去抢占国内开发企业或者开发者用户的市场。Q5:百度最核心的几块业务落地可能会在哪里?1)C端。首先昨天文心语言已经开放邀请式注册,得到邀请码的小伙伴可以通过一言点百度 .com的官网上,以页面程序的方式去和文心互动之外,后续在C端,1)第一个是百度的搜索,包括搜百科APP,作为DAU有接近 2. 5 亿的国民级APP,和大模型的结合场景还是非常丰富,还有像百度文库、学术都可以和大模型或者文心一言有很好的互动。可能会有增强版百度百科。以及在专业封闭的领域去做专业知识辅助写作与生成。在营销生成的场景,文心一言的文生图能力也能提高电商或广告营销的生产效率。2)智能硬件,百度有一个SLG-小度事业部,像小度智能音箱、小度运动健身镜或互动屏等一系列智能硬件,内嵌gpt的这种产品其实大幅度提高了终端用户对于现代 AI 2.0 时代大模型本身的对话理解能力,后续比如音箱或机器人会迎来更 多智能消费终端的升级。引领大家购买一些这种能力或者理解能力更强的对话类的新智能硬件类产品。2)B端。像昨天Robin和王海峰王老师,更多强调百度的文心一言 在产业级应用中非常有优势,甚至相比 GPT也有很多优势。文心更多主打产业级的趋势增强大模型,因为文心之前有很多基于百度智能云服务的各种B端客户,像昨天发布会讲解的能源电力、金融银行、融媒体等各种产业级的数据和大模型应用能力。后期首先会结合文心已宣布的四五百家生态伙伴去赋能千行百业的对于知识、搜索后对话有诉求的专业场景,另外也会对现有B端产品做能力提升,比如智能客服、理财助手、知识图谱、新闻智能采编、媒体审核、商用文档、商用PDF,后续有很多新的产业级赛道出现。Q6:国内厂商投入的意愿和力度?1)无论是海外的Openai的GPT、Google以Bert为基础的PaLM、LaMDA,虽然openai没有把GPT-4在整体训练过程中涉及的专利、参数体量、数据情况披露出来,但以GPT-3为例,一个base模型为成本投入举例来看,目前GPT-3投入的10000张Nvidia V100高端算力芯片卡,V100 2020年市价8-10万人民币左右,像目前的高端算力芯片卡A800 应该也是差不多价格,折合十亿人民币左右。它代表行业内想training出来好的、比较通用的,效果比较完整且丰富的通用技术模型的算力投入。对国内而言中位数水平可能需要10-20亿的算力投入。2)另外大模型在生产层的三个要素:算力、算法、数据,算法科学家,背后比拼的是LP 的脑力密集程度,就是 LP 的算法工程师和算法科学家像openai作为初创公司,nlp算法人员有100多人,国内start-up作出这种产品至少需要100名左右senior工程师。3-5、5-8年的工程师年薪在100万人民币左右,人员开支1-2亿。4)数据上的cost包括百度的文心一言背后的raw data 源数据可能更多的还是 from 像搜索、百度的 feed 这些自有的业务数据,这些是十几年累积下来的,本身一次性投入的数据cost 不会那么多。但是对于初创团队,如果自己没有base数据,采购成本是比较高的。如果仅仅依赖包括像OPEN AI 或者 Google 已经开源源码或者数据集,模型效果肯定不会特别令人惊艳,或者是在市场级的业务有缺失。所以在数据侧投入上,数据成本可能很低也有可能很高,比如做一些生命科学的大模型成本可能非常高。以此类比,去做相对来说比较好的 beta 版本大模型,可能一次性投入至少 20- 30 亿左右。国内目前而言,主要还是若干个大厂的游戏,包括刚才已经举例的若干个大厂的模型,都是逐年投入的结果。Q7:各家大厂有犹豫的吗?目前第一梯队的大厂还都是战略级定位,在持续投入。Q8:追上微软嵌入所有应用的能力需要多久?包括昨天发布的Office 365,还有pilot这些产品,一方面是有潜力的大模型,基于 GPT3、4。其次它有非常丰富的业务场景, office 用户几十亿,用户本身就是偏量级的。如果境内想要做出来比较完美的商业闭环,首先上游需要有一个潜力还不错的基础模型,像百度的文心,或者是像阿里的通义、腾讯的混元。基础模型不能太差,即使是会有缺失或者都可以是以用代研方式逐步累积迭代出很好的模型。关键是下游业务场景有没有像类似 office 或者像 Google workspace 这种有偏量的用户,能够持续不断为模型迭代去打磨比较好的技术土壤,产品要有足够好的使用地方。这对国内很多产品来说是业务的天堑,尤其对于二线厂商或者start-up 来说更是天堑。后续也只有像若干个大厂,基于自己本身存量的业务,快速迭代出性价比非常高的、普适性的 AI 大模型产品,类似搜索和音箱之于百度,电商和钉钉之于阿里,或者社交和文娱游戏之于腾讯一样。类似像文档、邮件、CRM 或者 SCRM 这种大的服务对于国内的商业场景来说,是分散在一些其他垂直赛道的头部玩家的情况,后续会不会有垂直赛道的头部玩家和AI 技术大厂去结合的这种情况也是非常令人期待的。Q9:在今年或者明年会表现出不错的表现吗?快的话会在今年下半年或者明年上半年。因为chatgpt、new bing上线时都是不完美的,所谓global的大模型,这一轮大模型产品都是以用代研,首先抢先发布,随着用户体量的增多、业务数据回流去逐步迭代大模型表现,因为大模型 AI 类应用产品的特色或者特性就是如此,它和上一代的中模型或者小模型以及更早的 IP 的应用程序不同的是,它的产品体验和表现存在着巨大的不确定性。这些巨大不确定性是需要将产品进行上线以用户的规模或者用户持续不断使用和体验去逐步打磨。现在是大幕拉开的情况,后续文心随着智能云和百度大脑开放商用接口,肯定是有源源不断的商用产品或者应用产品出现,上线之后会抢占市场、业务空间,不断迭代让它有更好的体验,而不是十年磨一个大招再上线完美的产品,这个是不符合现在的大模型产品的商用逻辑。Q10:为什么昨天两位领导不是特别自信?我认为大家对于整体的文心的期望值,无形中有了一个很高的