突破创新者窘境,要杀掉“现金牛” Q:见面之前,我在万知上提了一个问题:李开复博士再创业,成立零一万 物,他最兴奋和最焦虑的是什么?它的答案是,最兴奋的是能够在 AI 领域继续 探索和创新,最焦虑的是公司能否保持创新的能力,你怎么评价这个答案?李开复:前半句是完全正确的,我们现在面临人类有史以来最大的技术革命和 平台革命。后半句从一定层面来看,零一万物的创新能力,除了要看 CEO,更 要看核心技术产品团队是否足够优秀,以及是否形成了内部创新机制。作为 CEO,我延揽到了谷歌、微软、阿里、华为、字节跳动等一线大厂的顶尖技术 产品人才。 同时,作为 CEO,我也负责制定创新战略,比如我们会根据每个阶段重要的技 术产品进行创新攻坚,成立“war room”(作战室)——跨部门调取骨干,又快 又好地把当前战略级的技术产品项目从 0 到 1 再到 100 地做出来。我们已经在 多个技术产品应用了此机制,成效良好。5 月 21 日在世界权威盲测 LMSYS 上取 得领先成绩的 Yi-Large 模型就出自“war room”之手。 war room 也会不定期内部分享最新进展和前沿技术,某种程度也成为创新脑暴 和交流的场合。比如零一万物的“模基共建”“模应一体”等战略也都在 war room 得到有力实践。 Q:所以大模型的答案可能未必跟你的想法是完全一致的,但这也是它的特 色? 李开复:我觉得这是大模型最有魅力的地方。它就像一个人,做它的人也不能 预测它会怎么回答,很多人可能会以为 AI 大模型是你输入进去想要的回答,事 实上我们没有输入任何一个答案。我们输入的是它思维的方式和学习的语料,还有它表达的方式,其他都是它做主,不是我们做主。 Q: 北京时间 6 月 11 日,苹果发布了人工智能的应用,你怎么评价? 李开复:我觉得苹果是一个非常让人尊敬的公司,它专注用户体验,找了一些 切入点,非常聪明地在Siri 和搜索上,都很好地用上了 AI 功能,一定程度跟微 软的 copilot 有异曲同工之处。两个公司都是很重视技术,并嵌入了已有产品。我个人会更喜欢做一些颠覆的工作,怎么能把微软 office 颠覆掉?怎么能把苹 果手机颠覆掉?当然苹果可能也在做这件事,(现在)它肯定不能在手机还没 进步时,就颠覆自己的手机,但我觉得每一个技术时代的来临,应该基于这个 时代的特点彻底颠覆过去的产品。 今天语音可以控制机器,而且可以随身随时随地立刻说立刻反应,机器能马上 知道该帮我们做什么事情,这样的一个设备难道不应该更是一个项链、手表或 者戒指,你说一句话,新设备能直接执行了吗?用手机来交互的方法难道不应 该再颠覆吗? 如果说苹果的发布,是一个按部就班的大模型在已有产品上的发布,我会更喜 欢 OpenAI 的GPT-4o。 话说回来,我们也要考虑,当一家公司大部分的收入来自一个产品,它还没有 巩固这个收入,就把自己颠覆掉了,我觉得没有几家公司能做得到。 同样的理由,微软没有说要推翻 Microsoft Office,而是要增强它。其实我觉得 微软是绝对有认知和能力去颠覆它的,但是一颠覆财报就不好看了,所以这就 叫创新者的窘境。 你是过去的创新者,你在上一代或者上两代是绝对的技术龙头,新的技术出来 了,你不敢去拥抱新技术,因为你拥抱了,就会把过去的现金牛给杀掉了。但 是我觉得一个公司应该充分了解,你不杀你的现金牛,也有别人来杀,所以应 该更激进地来做。但是要杀的话,你就要考虑到财报和股价。 Q: 这是个两难的(抉择)。 李开复:真的能做到这样也不是完全不可能。腾讯能够用微信来颠覆了自己当 时的现金牛——QQ,还是很了不起的事情。 打价格战:是为“造血”还是白“流血”? Q: 从 5 月以来,各大互联网公司开启了大模型“价格战”,你怎么看这个现象?李开复:我觉得媒体过度宣传炒作了这个概念。什么叫做价格战?第一个现象 就是有些公司发现它可以用更低的成本做出一样好的结果,既可以赚钱,效果 又更好。那为什么不把它分享给更多的用户? 第二就是别人打了价格战,我也要跟风,我来降价,这就有点无聊了。有些公 司宁可赔钱也不能高于别人,那更没意义了。 还有第三种,我有好几个产品,最好的产品不怎么降价,最差的产品降很多,甚至降成 0,也不是很有意义。 Q: 这还是一个 to C 的思路。 李开复:对。比如去一家烤鸭店吃饭,烤鸭价钱没有降,但是果汁一毛钱一 杯,你也不会去这家烤鸭店,又不是去喝果汁的,果汁降价并不产生我消费的 欲望,只是一个吸人眼球的做法。 Q: 我印象中你应该算是第一个说要反对价格战的,这是基于什么考量?李开复:也不能说完全反对价格战,因为推理成本、API 成本的下降是整个行 业急迫需要的。 为什么今天没有井喷式的应用?为什么没有每个移动应用都用大模型?是因为 大模型和其他技术不一样,背后要用 GPU。GPU 很贵,所以它不像移动互联网 时代的边际成本是可控的,它的成本是很高的。 我们用 GPT 举例。GPT-4 如果今天是白菜价,应用一定会井喷,但它价钱很 高,要等GPT-5 出来,GPT-4 或许会降到现在 GPT-3.5 的价钱,这时候 GPT-4的 应用就会井喷了。 我们完全可以期待推理成本、API 成本价钱每年降 10 倍。我觉得不要赔钱地去 推,这会把整个行业秩序破坏了。 任何意义。人家一用发现这么差,浪费了大家的时间,也耗了你的算力,何必 呢?所以我觉得要看动机。 如果是因为推理成本下降,能在赚钱的前提下把模型开放给更多人使用,这种 情况是行业所乐见的。我们的 Yi-Large 性能对标 GPT-4,但是价格是 GPT-4 的四 分之一;如果想要实时搜索,我们有 Yi-Large-RAG,如果想追求极致性价比,我 们也有 Yi-Large-Turbo;如果想大规模接入大模型,我们有 Yi-Medium。 我们的模型性能和定价本身就具备市场竞争力。但这背后的逻辑不是我们要比 价,而是我们的推理成本足够低。Q: 通过用更优质的数据来训练,包括采用 MoE(Mixture-of-Experts,混合专家)模型,是不是也能够降低推理成本?李开复:是的,我觉得数据本身是带来更高的推理能力,过的数据越多,用的 数据越好,模型本身会提升价值,但是推理未必会变得更便宜或更贵。 推理成本的下降可能会来自几个方向:MoE 是一个非常好的方向,我觉得它有 望让推理成本阶梯式下降。 第二个是比如说搜索引擎以前那么贵,后来变便宜了,其实就是看你搜什么,搜很简单的东西,我就没必要去动用那么多索引,快速给你个答案就可以了。比如说今天天气怎么样,北京离上海有多远,这些问题没必要用大模型,也没 必要用很复杂的搜索索引,就先把最便宜的问题用最低的成本回答了,再逐次 用越来越复杂的,这样平均成本也会降低。 第三种方法就是我们可能要把模型做各种压缩,在参数、比特数等方面进行压 缩。 第四种方法是硬件的成本,现在大部分硬件还是用英伟达的芯片,那就很贵,更便宜的芯片会带来成本降低。 最后第五种方法就是当你设计整个流的时候,API 的设计、推理引擎的设计、模 型的设计、AIInfrastructure(基础设施)的设计,还有要采用什么芯片的设 计,这 5 件事情应该是大家一起讨论,达到 5 件事情的整体最优。 零一万物很独特的地方是我们除了有世界领先性能的 Yi 系列大模型,我们还有 一个世界领先的AI Infrastructure 团队,我们会跟多个 GPU 巨头沟通讨论,我们 还有 自 己 的 应 用 。 所 以 我 们 可 以 贯 穿 起 来 , 用 自 己 的 应用 、 模 型 、Infrastructure,挑选出最优的芯片,做一个最佳组合,再拿出去提炼出模型和 API,从而使成本下降,让别的 APP 也能享受到。 要知道球会跑到哪里,不是球现在在哪里 Q:谈到 AI Infra,大家也都特别关注,因为它既代表了大模型公司的一个底 板,同 时又代表它的天花板,它连接算力和应用,在这方面你已经有很多布 局? 李开复:我们从成立的第一天就是 AI 模型、Infra、应用,三个同时启动。当三 个团队都成熟了以后,要对接在一起,再去优化它。 们分别去做自己的部分。就像造车,需要一帮人去做引擎,一帮人去做车身,一帮人做底盘,分别设计,再把它拼在一起。战略思考和吸引优质人才,我觉得也是我个人比较独特的加分项。 Q: OpenAI 最开始为什么没有做 Infra?在当时它没有看清楚这件事情,还是它 觉得就交给微软来做? 李开复:不是的。我觉得 OpenAI 没有犯任何战略错误。它在做这个事情的时 候,大家都不太认为 AGI 会发生,也不太认为这么简单的一个 Transformer DecoderOnly 的方法,能够成为目前世界上最强的推理模式。 它是在做一个有史以来最大风险、最大回报的研究尝试,然后尝试成功了。这时它就要去找合作伙伴来解决 Infra 的问题。按照 OpenAI 创立的时间,我不觉 得任何人能够想到三位一体这样的做法。 Q: 你最近提到 TC-PMF(技术成本×产品市场契合度)的观点,这是一个四维的 思考方法,过去大家关注 PMF 比较多,现在把 TC 结合起来,这是不是和 AI 领 域的创业属性相关? 李开复:是的。在一个技术相对静态或者价格是相对静态的背景下,你只要做到用户和市场想要的产品就好了。但今年跟去年相比,顶级大模型的 IQ 可能增 长了 100个点,它所能做的应用就完全不一样了。你去年做产品可能要一年或 者半年才做出来,如果只是用你启动产品时的 IQ 来做,做出来就很笨了。所以 你要知道球会跑到哪里,不是球现在在哪里,这是技术方面。 价格也是。如果你在一年前就预测到 GPT-4 在 2024 年 4 月能达到可用的程度,甚至知道 GPT-4o 会出来,你就准备针对这个模型做产品,等到 GPT-4o 出来,你就完美对接了 GPT-4o。 但还有一个问题,它的 API 收多少钱?这时就要看你的产品属性,如果是一个 收费产品,它贵一点没关系,对用户收费来补贴我的 API 就好。但如果是一个 DAU 产品,要买量,钱不会 马上进来,你补贴就能导致破产。你还要算 GPT-4o 什么时候才能降价到能够买得起流量,这就成为四维的一个思考方式。 这也是很多创业者可能面临的挑战。创业者如果是一个很好的产品经理,他对PMF 充分了解,但对于技术发展的方向,他不掌握在自己手中,可能就需要跟 大模型公司成为朋友,看看谁的模型、方向、时间表符合需求。还需要算出推理成本,即你相中的模型半年后做得够好了,成本会不会太高,所以有一定挑战。零一万物 Yi API 坚决不做赔钱的 to B,而是做能赚钱的 to B。所以零一万物在to B 方面精挑细选,找那种公司上下都愿意拥抱新概念的公司,也为它们设计 了 RAG知识检索、专有云、微调等方案,在国内国外都有尝试。无论 to C 还是 to B,API 都很重要,零一万物也推出了接入国际 SOTA 成绩Yi-Large 大模型的 API。这个 API 背后的模型能力大概接近 GPT-4o,但是价格是 GPT-4 的四分之一,我相信这可以帮助更多公司或者创业者达到所谓的 TC-PMF。Q: 你谈到零一万物的未来发展方向有四点:全球化布局、模基共建、模应一 体、Al first,这与找到 TC-PMF 之间的关系在哪里?李开复:TC-PMF 跟三位一体的整个概念是一致的,因为“三位”就是模型、应用 和基础架构,所以模基共建、模应一体是完全一致的。不过 AI first 不太一样。把 AI first 这个概念具象描述一下,它其实是两件事情,第一个我是有大模型,因大模型而生的 AI 应用,一旦把大模型拿掉了,应用就 不 work了。第二是人用最自然简单的语言方式来指导大模型,让大模型做 95% 以上的工作,我们只是一个引路者。Microsof