您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:国产ChatGPT何时问世?–20230207 - 发现报告
当前位置:首页/会议纪要/报告详情/

国产ChatGPT何时问世?–20230207

2023-02-08未知机构北***
国产ChatGPT何时问世?–20230207

国产ChatGPT何时问世?事件:根据公开新闻报道,百度对标ChatGPT的AI产品中文名字叫做文心一言,英文名ERNIE Bot,3月完成测试,对公众开放,目前还在做上线前的冲刺,时间有可能提前。百度集团-SW涨幅超15%,此外其他百度系公司表现亮眼,应用公司表现亮眼,行情正往两头演绎,优秀的大模型+基于大模型的创新应用场景。【国内互联网大厂进度】百度:1)百度布局较早,有自主研发的深度学习平台,有文心大模型,在预训练大模型方面有不错的积累,在AI发展方面把握先机。百度的文心大模型具备多功能,可以进行文本生成,内容提取,摘要生成,观点归纳、图片绘画等。和GPT很像。2)一般情况下,AIGC优先考虑To B,再考虑To C。因为To B的商业群体比较稳定,付费意愿也比较稳定。百度计划同时推出To B和To C的产品,并先发布To C的demo。字节:已经开始布局,主要是AI+内容。比如自动生成投稿和辅助写作,在今日头条上利用AIGC生产内容。目前AIGC整体的生成质量的内容还是较好的,要好于普通的UGC,但和PGC相比还有所欠缺。抖音方面也有应用,通过AI 的模式来生成短视频,比如一些图文类的短视频的。阿里、京东等电商类平台:在智能客服领域有布局,其次是AI+营销,例如阿里巴巴,可以结合商品,自动生成高质量文案描述商品,提高营销效率。腾讯:以广告为主,支持广告智能制作,以AIGC技术生成广告文案和视频,降低了制作成本,目前市场规模快速增长,未来5年内AIGC产生的图片的占比预计会达到10-30%。前期可作为UGC和 PGC的辅助,帮助广告主设计文案。到后期就是 AI 技术整体的发展,后期可能是有望代替人工的工作。【Q&A】Q:百度To C产品的进度如何,使用体验如何?A:1)百度有文心大模型的基础,去年ChatGPT刚发布后,他们基于对话的语料,做了一个类似的新模型,是多轮对话的模型和百度搜索引擎相结合——用户问一个问题,AI会给一个答案,同时搜索引擎会基于这个问题做一些相关的补充,比如答案的来源和链接。2)如果和搜索引擎结合起来后,整体使用效果还是可以的,因为结合后,不涉及到特别多轮对话,一般我问一句,它回一句,就结束了。至于多轮对话容易遗忘的问题,可能需要在后续的优化过程中,重点考虑怎么捕捉更远的信息,怎么捕捉用户长期讲话的意图。Q:ChatGPT会替代传统搜索引擎嘛?A:1)短期内不太可能取代传统的搜索引擎,ChatGPT会给出一些看似有道理但实际是错误的回答,可信度不是很高。2)ChatGPT对于新数据不太友好,未能建立和实时信息的连接,目前预训练模型如何保持实时更新,是一个大问题。3)ChatGPT的训练成本很高,付费过多,可能用户放弃使用;但不付费,成本压力过大,长期可能在训练成本或者推理成本上都做了比较多的优化以后,再看对搜索引擎的替代。4)可能短期内还不能替代,但长期不好说。至少可以跟百度的模式一样,搞双引擎的模式。Q:除了百度外,国内还有其他公司可以推出类似的产品吗?国内其他大厂,比如腾讯、字节等,会想着在短时间内做出来类似ChatGPT的产品吗,抢占先机,形成类似微软对谷歌的卡位?A:1)小公司机会比较小,这是一个技术积累的工作,需要有数据训练的基础和经验,需要资源和人力的投入。小厂很难做出来,因为成本太高了。小厂更适合去接入这些大厂的模型,成为大厂的客户,然后做这些模型的应用,比如AI绘画等,对接C端消费者。2)国内的大厂比如字节、腾讯、阿里有机会。字节已经开始在做语言处理模型,目前在数据和算法方面的积累都不差,字节其实也要发大力发展搜索,包括培养用户的搜索心智。字节也希望推出新的产品,从而抢占先机,实现它在搜索领域的一个超车。 目前字节还处于大模型的训练和调试状态,没有产品的具体规划。但如果能做出来,还是对字节搜索领域的地位有积极影响,我认为字节跟百度在搜索领域,会有很多的交叉的冲突,也一直在大力发展搜索领域,所以是有可能做出类似的产品。Q:国内会引入ChatGPT嘛(考虑到有一些内容指向性的问题)?如果Bing引入了chatGPT对于中国搜素市场的影响?A:1)ChatGPT目前会有一些伦理层面的问题,目前国内的监管政策还不是很全面,相关的法律法规还没有健全,还有很多这种一些细节的东西,短期内我们的规章制度其实也没有覆盖到。2)总的来说,我认为ChatGPT的To B端可能会引入,国内的小公司可以应用,目前ChatGPT的To B端因为成本、优化等问题还没有开放,如果ChatGPT的To B端开放,国内的一些小型创业公司可能会接入,并去做下游应用端的产品。3)未来接入微软的Bing后,其实对搜索是会有一定的冲击的,首先我们考虑一下用户的猎奇心理,肯定会有大量的用户愿意去用,能够产生大量DAU,如果效果是比较好,这些用户是愿意留下来继续使用它的,久而久之其实是会改变到用户的搜索习惯。Q:字节内部目前在类chatGPT产品方面的规划?A:从我们看字节对搜索的重视程度,搜索现在也是一级部门,对搜索的重视程度很高,因为搜索在现在在抖音、今日头条的重要性上很高,本次也是集合了几个核心的部门,组成小团队来做模型。目前来说可能还没有产品的计划,虽然是比百度晚一些,但后续要看产品的效果和用户的体验,先发后发的影响不是很大,需要看后续的发展。Q:谷歌最近在财报上说,他们的LaMDA模型可能在近期推出类似ChatGPT的功能,如何看待谷歌在语言模型方面的积累?A:1)谷歌的技术积累很不错,团队都非常优秀,模型积累很好。2)数据方面,谷歌天然就有很多搜索引擎的数据,算力方面也不用担心,很多技术都是谷歌推行的。相对来说,谷歌研发类似产品的可行性非常大,而且成功概率非常高。而且它的效果也是值得我们期待的。如果效果比ChatGPT好的话,那也算一种后发优势。Q:如果未来出现很多的模型,这些模型都基于差不多的数据去训练出来的,又有很多应用去基于这些模型去开发不同领域的垂直应用。整个环节的价值量最大的地方会不会在公有云跟硬件厂商。因为最后有可能模型会趋于雷同,甚至很多应用程序会被迅速的抄袭,迅速的雷同化?A:1)他们肯定是受益者,但这种说法有一个前提,算法是有上限的。但是实际来看,各家公司的算法上限不同,不同的公司,它掌握的能力不一样,算法还是有很大的提升空间,我认为不会在短期内趋于雷同。模型的发展的效果。可能是越来越往上的。2)发展的模式也有区别。可能会有一批大的公司搞基础性的模型,比方类似于 GPT 这种模型,其实ChatGPT,它也是GPT-3.5的版本上,做了一些微调而做的产品。还有公司做应用层面/垂直赛道的小模型开发。未来是两种发展模式相结合。Q:字节和百度在该方向的算力、数据和人员投入如何?A:1)国内大厂的算力基础都不差。在模型方面,字节在推荐领域也已经有千亿参数的大模型,只是说在应用的领域不同。百度有文心大模型作为基础。2)数据方面,字节也有一些头条和抖音的搜索数据,量级上没有百度搜索的数据量大。3)从投入来看,其实两个公司的投入都非常大。百度把 AIGC 作为一个发展浪潮来追赶的,而且搜索是它非常核心的业务场景,所以百度的投入是很大的,而字节,其实切入的稍微有点晚,没有百度那么快。字节把几个最重要的核心部门,联合起来成立专项团队。其实整体上来说投入也还可以。4)所以综合比较,在算力和数据上,字节跟百度的区别可能没有那么大。 但在人力投入上,因为搜索是百度的核心业务,百度的整体的投入可能会比字节更大一些。Q:现在ChatGPT没有对国内开放,国内厂商在中文的领域,相比海外厂商,在用户体验上能形成一定的或者明显的优势?A:我认为语言不是大的壁垒,我认为短期内,ChatGPT没有向我们大陆开放,我们国内其实是有机会这样做出来产品的,但是想要超越ChatGPT的可能性会非常低。因为像一些我们的头部大公司,目前来说也还没有推出一款产品,能够跟ChatGPT的模型的效果能够PK,所以可能短期来看不大能够超过它。但是短期来看,我们可以通过这样的一个时间窗口做逼近它的效果,是国内公司比较好的状态。Q:腾讯和阿里在AIGC方面的布局如何?A:1)腾讯和阿里的搜索业务弱一些,不是重点,例如阿里,主要聚焦于电商领域,所以他可能在ChatGPT上不会有很多布局,目前阿里主要的发力方向是利用AIGC去做AI+营销,比如赋能商品的文案撰写等,未来阿里可能会继续往这个方向布局。2)腾讯可能在广告、社交、游戏等领域应用AIGC技术。比方塑造更广义的互动叙事的品类,带来一些新的社交的玩法和商业模式的新的启发等等。3)总的来说,AIGC是一波技术浪潮。国内的大厂的看法是要和现有的业务结合起来,实现自身业务更好地发展。而不是只关注ChatGPT这一个AIGC的细分赛道。Q:可以大概理解成,腾讯和阿里更偏向应用端吗,未来腾讯和阿里的大模型会自研吗?A:我认为腾讯和阿里的大模型是会有自研的趋势的。像这种大公司,它对专利,包括一些专业的技术积累其实还是比较有讲究的。所以我觉得长期来看,大厂大模型会自研。Q:如果大模型投入使用,对于算力等基础设施的需求会不会是指数级的提升?A:我认为是的,ChatGPT刚发布的时候,就因为用户访问量过大,算力不足而出现问题。随着用户量级的大规模的上涨,算力的需求确实会呈现一个指数级的上涨。至少是非常正相关的,因此推理和训练的资源的开销肯定是非常大的。所以这一块也是优化的重点,就是怎么去让资源尽可能地节省,让整体的一个性能更好地提升。Q:除了GPU,芯片方面还有可以替代的产品吗?A:1)自研芯片,但是目前整体来说目前还没有看到特别好的一个产品。2)采用分布式的CPU,性能上差一些,但是成本便宜,很适合做推荐算法模型的公司,比如抖音、快手、Tiktok等,都是采用分布式的CPU做大模型的基础算力设施。Q:如何去辨别海内外厂商大模型的优劣?A:如果我们要评价它的具体的效果,最直接的是人工测评,看下真实的感受和评分。专业角度来讲,我们可以用测试集,分别请求这些模型的API,基于一些评价指标,去看这些模型的表现如何。模型的参数、训练数据可以作为参考的指标。它的模型的参数量级更大,理论上模型的效果应该会更好,但相对片面一些,还是要实际测试和感受后才知道。Q:应用场景的数据,在中国来讲是不是一种比较紧缺的资源。如果是要把模型训练好,可能非常依赖这些产业厂商的合作?A:1)特定领域的数据是比较稀缺的,比如医疗、司法等领域,所以可能会生成类似的商业模式。2)可能最后就会形成这种商业模式:大公司负责训练大的基础模型,其他的一些创业型的公司或者一些小公司,在大模型的基础上,加上他们自己特定领域的一些数据集,得到这种新的领域式的模型,来服务于他们自己的一些商业化的计划。3)这种模式下,大厂有钱赚,对于小厂来说,它既能保护到自己的数据的隐私,同时也能够形成这样自己的领域类的商业化的路径。