行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

对话杨植麟20240624

2024-06-24 未知机构匡露

01 复盘 Kimi：更聚焦，对抗组织的惯性 Q：从你创业以来，咱俩去年做过一次直播，到今天又过了大半年的时间，你自己怎么评价 Kimi 的发展，给自己的团队、公司、产品打多少分？杨植麟：对，确实时间过得很快。我估计有个 60 分。从我们的视角来看，这个行业整体肯定还是一个马拉松。技术发展可能会相对快一些，但是如果看整体技术的普及，包括整个产品和商业化，我觉得肯定是需要从 10 年到 20 年的维度来看这个事情。但我觉得同时可能也还有很多挑战，这里面最关键的还是，比如 Scaling Law 今天还是非常早期，可能还要去看怎么能够 Scale 到下一代模型、下下代模型，通过这个东西在产品上能够形成更强的 PMF，真正能够在每个人的工作和生活中有更高的渗透。我觉得这个其实还是有非常多的挑战，可能是一个更长期的东西。 Q：相对来讲，你是入场比较晚的，但是我们从外界感知到的是你提速很快、现在声势很好。你觉得有什么做得比较成功的东西？能到今天这个客观的效果，你认为哪件事的选择是比较对的？杨植麟：特别好的问题。我觉得严格意义上来讲，肯定不能说是非常成功或者怎么样，可能有一些小的起步。这里面我们持续关注的东西，同时现在也在持续优化的东西，还是希望真正从底层出发去解决问题，真正关注第一性原理。就像比如说 Personal Computer 行业的基础假设是摩尔定律，我觉得 AI 行业的基础假设还是规模化定律——Scaling Law。如果我们从 10 年的视角去看这个问题，我觉得更多还是：怎么能够从技术和模型的效果上持续优化，然后在这个过程中形成更强的 PMF。所以很多动作会从这个出发点开始，去规划到底要做什么东西。我们希望最大的投入，还有时间、精力应该是放在，怎么能够迭代出更好的模型，从而解锁更多的场景，这可能是我们最关注的东西。当然它可能也意味着聚焦，在技术和产品上可能我们都希望更加聚焦，比如我们现在更多会聚焦面向知识工作者，比如学术科研人群、互联网从业者、内容创作者、金融分析师、法律等人群的生产力场景上，已经成为几千万知识工作者搜索资料、分析文件和创作内容的助手，生产力之外的场景现在暂时不会做特别多，因为你如果什么东西都做了，可能最后也很难做好。 Q：这件事也是有 trade-off 的，要做一些取舍。杨植麟：对，我觉得创业公司还是要有比较明确的重点。比如我们可能就是针对生产力场景去做非常极致的优化，很多时候产品上看起来都是一个框，好像没有发生什么变化，但背后的很多体验其实已经优化了很多，当然现在肯定还有很多很多的空间。在这个取舍的过程中，很多时候就意味着需要砍掉一些东西，不是所有东西都要做，因为我觉得组织的惯性还是想做越来越多的东西，我们可能就是要去对抗这个地心引力，希望做更少的东西，但是把它做到极致。包括在技术上也是，AI 空间很大，因为智能本身是一个非常 heterogeneous（异质性），就是非常异构的东西。一个会计师的智能，跟一个画家的智能、跟一个数学家的智能，完全不一样。在这里面，我们也会根据核心用户群体去看，到底什么样的智能可能是现在的重点，它对应的基础能力可能是什么？然后可能更聚焦地去做这个事。最终闲聊的场景和生产力场景，我觉得大概率会结合在同一个产品里面，只是在路径选择上会不一样。我们先做生产力的原因是，生产力对于智商的提升更快，今天如果去做一个类似 Character.ai 这样的产品，绝大部分精力并不是在优化智商，因为优化智商对提升产品留存可能帮助不大。但如果做生产力的话，优化智商之后，你的留存能看到显著的提升。公司的 mission 跟产品的 roadmap（路线图）之间，应该能够更紧密地结合起来，这是很重要的一个原因。当然可能也有其他原因，比如说我们也观察了美国市场的不同选择、发展情况，美国市场整体来说比中国市场领先一两年，所以我们可以去看不同公司的发展情况。把生产力做特别好的公司，今天不管是从业务体量，还是从融资和人才吸引力来说，它其实都是更好。还有一个很重要的原因，我觉得娱乐场景今天的（产品）基线非常高。过去十年移动互联网的发展，诞生了一堆非常好的娱乐体验的产品，但是在生产力这个维度的基础体验或者说价值，还有非常大可以挖掘的空间。即使说今天最好的生产力产品，我觉得它其实还没有非常深入地渗透到真正的工作流程里，而且这是 AI 能带来的巨大新变量，所以这可能是为什么我们会做这样选择的重要原因。 02 Kimi 的目标是你的终极伙伴Q：怎么定义 Kimi 这个产品？它在解决什么问题？长期来看，是一个 AI 工作台还是什么？杨植麟：这个我觉得可能是分短期和长期来看，短期希望在生产力场景能够提供越来越多的智能。大家今天一些最主要的任务，比如更好的信息获取、信息分析、创作等，我们希望它能发挥更大的价值。最长期最理想的情况，本质上是在讨论 AGI 产品的终极形态或者终极定义是什么样的。其实大家有讨论，我觉得现在可能有两种不同的观点。一种是，它是世界上另一个我，它拥有你所有的输入，想法基本跟你一样，等于是复刻了一个自己，「另外一个自己」可以在数字世界，甚至物理世界做很多事情。另外一种定义是，它可能是你的一个伙伴，一个长期、甚至接近终生的伙伴，这个伙伴也能帮你做很多事情，但是它可能会跟你不一样，会给你提出来新的视角，并不是完全复刻你，而是可能有点像。杨植麟：非常理解你。我现在觉得可能第二种的概率更大，所以这可能是我们想做的东西。我觉得它会有几个比较重要的特征。第一个我觉得它还是先得有用，就是你能做越来越复杂的事情。我觉得今天能做的事情还不够多，这也是为什么我们现在最聚焦的还是去进一步提升模型的能力。因为只有通过提升模型的能力，才能让它去做更多的事情。把它类比为一个人的话，其实还缺少非常多的维度。它可能没有记忆，没有办法做长期的规划。在我的想象中，如果这个产品做得好的话，它不是只能完成这种 10 秒、20 秒就能完成的任务，而是说你能够让它定一个季度的 OKR，它可以自己去完成。 ion（幻觉）、给你很多错误的结论，信任也很难建立。我觉得只有在越来越复杂、长窗口的任务里提供真实性和准确性，才能够建立信任。所以我们会从这些方面去考虑产品。 Q：从这个角度来说，我们今天看到的可能只是一个产品的初级形态。这也解释了我们为什么可以看到产品里有不同新的功能，本质上你在努力赢得在用户身边更有用的位置。这种位置未来会是从一部分能干的事逐渐扩展到越来越多，这可能是个路径。杨植麟：我觉得这里面有一个重要的标志，就是如果有一天你发现在你的工作里 AI 做的事情比你多了，也就是说 AI 占比超过 50% 了，可能会是一个非常重要的 milestone 可能下一个 milestone 就是机器人的数量超过人类，但那是在物理世界，我觉得数字世界会更早实现。张鹏：所以我很好奇一个问题，从月之暗面 Kimi 的角度去看，今天有一个很成功的产品大家都在用，未来可能也会有新的功能解决用户更具象的问题。你会更倾向于都在 Kimi 这个平台解决，还是会有机会长出其他更专有的 APP？杨植麟：我们肯定还是会很聚焦地，只做 Kimi 这一个 app。因为有一个很重要的点是，未来的智能产品，它应该满足普世的需求。就像我刚刚说的，娱乐的需求，或者生产力的需求，甚至这两个东西可能也没有特别明确的边界。我觉得他们应该是在同一个产品里的，只是路径选择上会有区别。这也是我认为通用智能最有意思的地方，它不是只能做一件事。但只是说在路径选择上肯定没有办法在一开始就做所有的事情，一开始还是会有重点的场景、核心的用户群体，然后逐渐去泛化开来。所以我们还是希望聚焦做一个产品，然后把这个产品做到极致。 Q：听起来 Kimi 要能达到你刚才说的终极目标——一个理解用户的伙伴，首先的起点是从先帮用户做好一两件事情，然后逐渐能做越来越多的事情，然后这个伙伴的关系和信任就建立了。这是一个前进的世界观和路线图。杨植麟：是的。我觉得这中间很重要的一个标志，就是 AI 可以从单个的、具体的任务，发展成能完成一个人要花几周才能做好的任务，也就是全方位的 Super Intelligence。现在的 AI 其实可以实现一部分的 Super Intelligence，比如阅读长文本。人没有办法一下读完几百万字的文章、直接找到问题的答案，因为很多问题没法通过「查找」得到答案。这是我们一开始踩过的坑，就是找了一堆人标注长文本的数据，认为标注完了人就学会了。但你发现其实人根本标注不了，或者效率非常非常低。所以今天 AI 有一部分的能力比人更好，我们需要的就是让这个范围逐渐变大。 03 长文本本质是「长推理」 Q：正好谈到了长文本，这也是 Kimi 一开始让大家印象深刻的一个点，甚至在那个时候月之暗面可能比较非共识的提出来这件事很重要。我们也看到很多的模型支持的文本长度在变长，这件事未来是不是已经逐渐形成共识？另外长文本对于解决你说的那个终极的问题，是不是最重要的路径？杨植麟：特别好的问题。今天确实有很多人在做长文本，但如果说是完全的共识，其实我也不是非常确定。也有不同的观点，比如说认为短文本的场景下也有很多可以挖掘的东西，可能不一定要非常着急去做长文本。但我觉得这个也是正常的，因为每一个公司本身都有自己的判断。对我们来说，我们其实比较早认为长文本可能是一个非常关键的东西，这里面有几个方面：第一方面就是说，如果我们想让 AI从完成一两分钟的任务变成完成长周期的任务，那必然要在一个很长的 context 里，才有可能真正把 AI 进一步往下推进。但这是一个必要不充分条件，具备了很长的 context能力后，可能还需要很强的推理能力，之后你可以有更长的 context……我觉得它有点像螺旋迭代的过程。可能更准确的说法叫长推理，就是你能够在一个很长的窗口下面去做很好的推理，我觉得这个是最终能产生很大价值的。 Q：就是它最终其实是跟用户在做数据的输入、指令的输入和最终交付服务的转换比的计算，转换比越高，带来的价值就越高。杨植麟：对，这个确实很有意思。比如，即使只看长文本这个技术，它的落地过程也是一个比例逐渐提升的过程。因为在最早期的时候，就是用长上下文去做一些阅读类任务。阅读类任务肯定是最早落地的，因为它是一个从很多的信息变成很少的信息的过程，相对会容比如让 AI 读 10 篇文章，然后形成总结。这个难度肯定小于我只给 AI 一个很简单的指令，但是要一口气做一个月，并且最好还要满足用户的需求。这确实是个比例的问题，就是输入和输出的比例，它可能是更本质的东西。Q：理解了，你觉得未来长文本的成本会快速下降吗？因为现在真的把 200 万 token 扔进去跑一圈，成本还是蛮高的，而且这又跟长文本应用在哪些场景、能否高价值地解决问题有关，这两个问题其实是绑定在一起的，你怎么看？杨植麟：我觉得成本的持续下降肯定是个必然趋势。最近我们有一些新技术，一方面是一些工程上的极致优化，比如 context caching（上下文缓存）技术。另一方面，所以如果是 200 万字的窗口、并且能够让大部分人普惠地用起来，我觉得这是一个大概率能在今年实现的目标。 Q：今年就可以做到吗？杨植麟：对，我觉得这是我们的目标。在接下来很长一段时间内，成本会持续降低、而且速度会比short context（短文本）更快。今天还有很多东西是没有被挖掘的。比如说，如果考虑一个人处理一个很长的记忆、或长周期的任务，他其实并不需要记住所有东西，对吧？它是一个动态计算的过程，你可以选择哪些东西要记下来、哪些要扔掉，这里面有非常大的优化空间。而今

点击免费查看完整报告

对话杨植麟20240624

你可能感兴趣

对话王小川20240624

基金周报：汇添富刘江卸任在管公募产品，本周新发产品可适当关注杨富麟首只可投H股权益品种

国盛：对话5G专家之六—图聚信息张杨：5G与室内位置服务20190212

格林大华期货集运欧线早报20240624

方正中期钢材周度策略20240624

格林大华期货鸡蛋白糖早报20240624

格林大华期货纸浆早报20240624

格林大华期货股指早报20240624

海外经济周观察（20240624~20240630）

鸿蒙操作系统专题交流解读20240624