行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

李开复交流纪要20240620

2024-06-20 未知机构 yuAner

突破创新者窘境，要杀掉“现金牛” Q：见面之前，我在万知上提了一个问题：李开复博士再创业，成立零一万物，他最兴奋和最焦虑的是什么？它的答案是，最兴奋的是能够在 AI 领域继续探索和创新，最焦虑的是公司能否保持创新的能力，你怎么评价这个答案？李开复：前半句是完全正确的，我们现在面临人类有史以来最大的技术革命和平台革命。后半句从一定层面来看，零一万物的创新能力，除了要看 CEO，更要看核心技术产品团队是否足够优秀，以及是否形成了内部创新机制。作为 CEO，我延揽到了谷歌、微软、阿里、华为、字节跳动等一线大厂的顶尖技术产品人才。同时，作为 CEO，我也负责制定创新战略，比如我们会根据每个阶段重要的技术产品进行创新攻坚，成立“war room”（作战室）——跨部门调取骨干，又快又好地把当前战略级的技术产品项目从 0 到 1 再到 100 地做出来。我们已经在多个技术产品应用了此机制，成效良好。5 月 21 日在世界权威盲测 LMSYS 上取得领先成绩的 Yi-Large 模型就出自“war room”之手。 war room 也会不定期内部分享最新进展和前沿技术，某种程度也成为创新脑暴和交流的场合。比如零一万物的“模基共建”“模应一体”等战略也都在 war room 得到有力实践。 Q：所以大模型的答案可能未必跟你的想法是完全一致的，但这也是它的特色？李开复：我觉得这是大模型最有魅力的地方。它就像一个人，做它的人也不能预测它会怎么回答，很多人可能会以为 AI 大模型是你输入进去想要的回答，事实上我们没有输入任何一个答案。我们输入的是它思维的方式和学习的语料，还有它表达的方式，其他都是它做主，不是我们做主。 Q：北京时间 6 月 11 日，苹果发布了人工智能的应用，你怎么评价？李开复：我觉得苹果是一个非常让人尊敬的公司，它专注用户体验，找了一些切入点，非常聪明地在Siri 和搜索上，都很好地用上了 AI 功能，一定程度跟微软的 copilot 有异曲同工之处。两个公司都是很重视技术，并嵌入了已有产品。我个人会更喜欢做一些颠覆的工作，怎么能把微软 office 颠覆掉？怎么能把苹果手机颠覆掉？当然苹果可能也在做这件事，（现在）它肯定不能在手机还没进步时，就颠覆自己的手机，但我觉得每一个技术时代的来临，应该基于这个时代的特点彻底颠覆过去的产品。今天语音可以控制机器，而且可以随身随时随地立刻说立刻反应，机器能马上知道该帮我们做什么事情，这样的一个设备难道不应该更是一个项链、手表或者戒指，你说一句话，新设备能直接执行了吗？用手机来交互的方法难道不应该再颠覆吗？如果说苹果的发布，是一个按部就班的大模型在已有产品上的发布，我会更喜欢 OpenAI 的GPT-4o。话说回来，我们也要考虑，当一家公司大部分的收入来自一个产品，它还没有巩固这个收入，就把自己颠覆掉了，我觉得没有几家公司能做得到。同样的理由，微软没有说要推翻 Microsoft Office，而是要增强它。其实我觉得微软是绝对有认知和能力去颠覆它的，但是一颠覆财报就不好看了，所以这就叫创新者的窘境。你是过去的创新者，你在上一代或者上两代是绝对的技术龙头，新的技术出来了，你不敢去拥抱新技术，因为你拥抱了，就会把过去的现金牛给杀掉了。但是我觉得一个公司应该充分了解，你不杀你的现金牛，也有别人来杀，所以应该更激进地来做。但是要杀的话，你就要考虑到财报和股价。 Q：这是个两难的（抉择）。李开复：真的能做到这样也不是完全不可能。腾讯能够用微信来颠覆了自己当时的现金牛——QQ，还是很了不起的事情。打价格战：是为“造血”还是白“流血”？ Q：从 5 月以来，各大互联网公司开启了大模型“价格战”，你怎么看这个现象？李开复：我觉得媒体过度宣传炒作了这个概念。什么叫做价格战？第一个现象就是有些公司发现它可以用更低的成本做出一样好的结果，既可以赚钱，效果又更好。那为什么不把它分享给更多的用户？第二就是别人打了价格战，我也要跟风，我来降价，这就有点无聊了。有些公司宁可赔钱也不能高于别人，那更没意义了。还有第三种，我有好几个产品，最好的产品不怎么降价，最差的产品降很多，甚至降成 0，也不是很有意义。 Q：这还是一个 to C 的思路。李开复：对。比如去一家烤鸭店吃饭，烤鸭价钱没有降，但是果汁一毛钱一杯，你也不会去这家烤鸭店，又不是去喝果汁的，果汁降价并不产生我消费的欲望，只是一个吸人眼球的做法。 Q：我印象中你应该算是第一个说要反对价格战的，这是基于什么考量？李开复：也不能说完全反对价格战，因为推理成本、API 成本的下降是整个行业急迫需要的。为什么今天没有井喷式的应用？为什么没有每个移动应用都用大模型？是因为大模型和其他技术不一样，背后要用 GPU。GPU 很贵，所以它不像移动互联网时代的边际成本是可控的，它的成本是很高的。我们用 GPT 举例。GPT-4 如果今天是白菜价，应用一定会井喷，但它价钱很高，要等GPT-5 出来，GPT-4 或许会降到现在 GPT-3.5 的价钱，这时候 GPT-4的应用就会井喷了。我们完全可以期待推理成本、API 成本价钱每年降 10 倍。我觉得不要赔钱地去推，这会把整个行业秩序破坏了。任何意义。人家一用发现这么差，浪费了大家的时间，也耗了你的算力，何必呢？所以我觉得要看动机。如果是因为推理成本下降，能在赚钱的前提下把模型开放给更多人使用，这种情况是行业所乐见的。我们的 Yi-Large 性能对标 GPT-4，但是价格是 GPT-4 的四分之一；如果想要实时搜索，我们有 Yi-Large-RAG，如果想追求极致性价比，我们也有 Yi-Large-Turbo；如果想大规模接入大模型，我们有 Yi-Medium。我们的模型性能和定价本身就具备市场竞争力。但这背后的逻辑不是我们要比价，而是我们的推理成本足够低。Q：通过用更优质的数据来训练，包括采用 MoE（Mixture-of-Experts，混合专家）模型，是不是也能够降低推理成本？李开复：是的，我觉得数据本身是带来更高的推理能力，过的数据越多，用的数据越好，模型本身会提升价值，但是推理未必会变得更便宜或更贵。推理成本的下降可能会来自几个方向：MoE 是一个非常好的方向，我觉得它有望让推理成本阶梯式下降。第二个是比如说搜索引擎以前那么贵，后来变便宜了，其实就是看你搜什么，搜很简单的东西，我就没必要去动用那么多索引，快速给你个答案就可以了。比如说今天天气怎么样，北京离上海有多远，这些问题没必要用大模型，也没必要用很复杂的搜索索引，就先把最便宜的问题用最低的成本回答了，再逐次用越来越复杂的，这样平均成本也会降低。第三种方法就是我们可能要把模型做各种压缩，在参数、比特数等方面进行压缩。第四种方法是硬件的成本，现在大部分硬件还是用英伟达的芯片，那就很贵，更便宜的芯片会带来成本降低。最后第五种方法就是当你设计整个流的时候，API 的设计、推理引擎的设计、模型的设计、AIInfrastructure（基础设施）的设计，还有要采用什么芯片的设计，这 5 件事情应该是大家一起讨论，达到 5 件事情的整体最优。零一万物很独特的地方是我们除了有世界领先性能的 Yi 系列大模型，我们还有一个世界领先的AI Infrastructure 团队，我们会跟多个 GPU 巨头沟通讨论，我们还有自己的应用。所以我们可以贯穿起来，用自己的应用、模型、Infrastructure，挑选出最优的芯片，做一个最佳组合，再拿出去提炼出模型和 API，从而使成本下降，让别的 APP 也能享受到。要知道球会跑到哪里，不是球现在在哪里 Q：谈到 AI Infra，大家也都特别关注，因为它既代表了大模型公司的一个底板，同时又代表它的天花板，它连接算力和应用，在这方面你已经有很多布局？李开复：我们从成立的第一天就是 AI 模型、Infra、应用，三个同时启动。当三个团队都成熟了以后，要对接在一起，再去优化它。们分别去做自己的部分。就像造车，需要一帮人去做引擎，一帮人去做车身，一帮人做底盘，分别设计，再把它拼在一起。战略思考和吸引优质人才，我觉得也是我个人比较独特的加分项。 Q： OpenAI 最开始为什么没有做 Infra？在当时它没有看清楚这件事情，还是它觉得就交给微软来做？李开复：不是的。我觉得 OpenAI 没有犯任何战略错误。它在做这个事情的时候，大家都不太认为 AGI 会发生，也不太认为这么简单的一个 Transformer DecoderOnly 的方法，能够成为目前世界上最强的推理模式。它是在做一个有史以来最大风险、最大回报的研究尝试，然后尝试成功了。这时它就要去找合作伙伴来解决 Infra 的问题。按照 OpenAI 创立的时间，我不觉得任何人能够想到三位一体这样的做法。 Q：你最近提到 TC-PMF（技术成本×产品市场契合度）的观点，这是一个四维的思考方法，过去大家关注 PMF 比较多，现在把 TC 结合起来，这是不是和 AI 领域的创业属性相关？李开复：是的。在一个技术相对静态或者价格是相对静态的背景下，你只要做到用户和市场想要的产品就好了。但今年跟去年相比，顶级大模型的 IQ 可能增长了 100个点，它所能做的应用就完全不一样了。你去年做产品可能要一年或者半年才做出来，如果只是用你启动产品时的 IQ 来做，做出来就很笨了。所以你要知道球会跑到哪里，不是球现在在哪里，这是技术方面。价格也是。如果你在一年前就预测到 GPT-4 在 2024 年 4 月能达到可用的程度，甚至知道 GPT-4o 会出来，你就准备针对这个模型做产品，等到 GPT-4o 出来，你就完美对接了 GPT-4o。但还有一个问题，它的 API 收多少钱？这时就要看你的产品属性，如果是一个收费产品，它贵一点没关系，对用户收费来补贴我的 API 就好。但如果是一个 DAU 产品，要买量，钱不会马上进来，你补贴就能导致破产。你还要算 GPT-4o 什么时候才能降价到能够买得起流量，这就成为四维的一个思考方式。这也是很多创业者可能面临的挑战。创业者如果是一个很好的产品经理，他对PMF 充分了解，但对于技术发展的方向，他不掌握在自己手中，可能就需要跟大模型公司成为朋友，看看谁的模型、方向、时间表符合需求。还需要算出推理成本，即你相中的模型半年后做得够好了，成本会不会太高，所以有一定挑战。零一万物 Yi API 坚决不做赔钱的 to B，而是做能赚钱的 to B。所以零一万物在to B 方面精挑细选，找那种公司上下都愿意拥抱新概念的公司，也为它们设计了 RAG知识检索、专有云、微调等方案，在国内国外都有尝试。无论 to C 还是 to B，API 都很重要，零一万物也推出了接入国际 SOTA 成绩Yi-Large 大模型的 API。这个 API 背后的模型能力大概接近 GPT-4o，但是价格是 GPT-4 的四分之一，我相信这可以帮助更多公司或者创业者达到所谓的 TC-PMF。Q：你谈到零一万物的未来发展方向有四点：全球化布局、模基共建、模应一体、Al first，这与找到 TC-PMF 之间的关系在哪里？李开复：TC-PMF 跟三位一体的整个概念是一致的，因为“三位”就是模型、应用和基础架构，所以模基共建、模应一体是完全一致的。不过 AI first 不太一样。把 AI first 这个概念具象描述一下，它其实是两件事情，第一个我是有大模型，因大模型而生的 AI 应用，一旦把大模型拿掉了，应用就不 work了。第二是人用最自然简单的语言方式来指导大模型，让大模型做 95% 以上的工作，我们只是一个引路者。Microsof

点击免费查看完整报告

李开复交流纪要20240620

你可能感兴趣

李开复交流纪要

李开复讲AI 交流纪要—20230404

功率半导体MCU市场追踪专家交流纪要20240620

光伏新技术专家交流纪要20240620

冷酸灵专家交流要点20240620线下动销今年目标双位数增长

胖东来商超调改专家交流20240620

冷酸灵专家交流要点20240620线下动销今年目标双位数增长

国君：2024中期策略会-观点集锦 · 总量专场纪要-20240620

民生：2024年度中期投资策略会金属分论坛纪要-任尔东西南北风，咬定青山不放松-20240620

国君：2024中期策略会-观点集锦 · 周期专场纪要-20240620