您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:对话杨植麟20240624 - 发现报告

对话杨植麟20240624

2024-06-24 未知机构 匡露
报告封面

01 复盘 Kimi: 更聚焦,对抗组织的惯性 Q: 从你创业以来,咱俩去年做过一次直播,到今天又过了大半年的时间,你自 己怎么评价 Kimi 的发展,给自己的团队、公司、产品打多少分? 杨植麟:对,确实时间过得很快。我估计有个 60 分。 从我们的视角来看,这个行业整体肯定还是一个马拉松。技术发展可能会相对 快一些,但是如果看整体技术的普及,包括整个产品和商业化,我觉得肯定是 需要从 10 年到 20 年的维度来看这个事情。 但我觉得同时可能也还有很多挑战,这里面最关键的还是,比如 Scaling Law 今 天还是非常早期,可能还要去看怎么能够 Scale 到下一代模型、下下代模型,通 过这个东西在产品上能够形成更强的 PMF,真正能够在每个人的工作和生活中 有更高的渗透。我觉得这个其实还是有非常多的挑战,可能是一个更长期的东 西。 Q: 相对来讲,你是入场比较晚的,但是我们从外界感知到的是你提速很快、现 在声势很好。你觉得有什么做得比较成功的东西?能到今天这个客观的效果,你认为哪件事的选择是比较对的? 杨植麟:特别好的问题。我觉得严格意义上来讲,肯定不能说是非常成功或者 怎么样,可能有一些小的起步。 这里面我们持续关注的东西,同时现在也在持续优化的东西,还是希望真正从 底层出发去解决问题,真正关注第一性原理。就像比如说 Personal Computer 行 业的基础假设是摩尔 定律,我觉得 AI 行业的基础假设还是规模化定律——Scaling Law。 如果我们从 10 年的视角去看这个问题,我觉得更多还是:怎么能够从技术和模 型的效果上持续优化,然后在这个过程中形成更强的 PMF。所以很多动作会从 这个出发点开始,去规划到底要做什么东西。我们希望最大的投入,还有时 间、精力应该是放在,怎么能够迭代出更好的模型,从而解锁更多的场景,这 可能是我们最关注的东西。 当然它可能也意味着聚焦,在技术和产品上可能我们都希望更加聚焦,比如我 们现在更多会聚焦面向知识工作者,比如学术科研人群、互联网从业者、内容 创作者、金融分析师、法律等人群的生产力场景上,已经成为几千万知识工作 者搜索资料、分析文件和创作内容的助手,生产力之外的场景现在暂时不会做 特别多,因为你如果什么东西都做了,可能最后也很难做好。 Q: 这件事也是有 trade-off 的,要做一些取舍。 杨植麟:对,我觉得创业公司还是要有比较明确的重点。比如我们可能就是针 对生产力场景去做非常 极致的优化,很多时候产品上看起来都是一个框,好像 没有发生什么变化,但背后的很多体验其实已经优化了很多,当然现在肯定还 有很多很多的空间。 在这个取舍的过程中,很多时候就意味着需要砍掉一些东西,不是所有东西都 要做,因为我觉得组织的惯性还是想做越来越多的东西,我们可能就是要去对 抗这个地心引力,希望做更少的东西,但是把它做到极致。 包括在技术上也是,AI 空间很大,因为智能本身是一个非常 heterogeneous(异质 性),就是非常异构的东西。一个会计师的智能,跟一个画家的智能、跟一个数学家的智能,完全不一样。在这里面,我们也会根据核心用户群体去 看,到底什么样的智能可能是现在的重点,它对应的基础能力可能是什么?然 后可能更聚焦地去做这个事。 最终闲聊的场景和生产力场景,我觉得大概率会结合在同一个产品里面,只是 在路径选择上会不一样。我们先做生产力的原因是,生产力对于智商的提升更 快,今天如果去做一个类似 Character.ai 这样的产品,绝大部分精力并不是在优 化智商,因为优化智商对提升产品留存可能帮助不大。但如果做生产力的话,优化智商之后,你的留存能看到显著的提升。 公司的 mission 跟产品的 roadmap(路线图)之间,应该能够更紧密地结合起 来,这是很重要的一个原因。 当然可能也有其他原因,比如说我们也观察了美国市场的不同选择、发展情 况,美国市场整体来说比中国市场领先一两年,所以我们可以去看不同公司的 发展情况。把生产力做特别好的公司,今天不管是从业务体量,还是从融资和 人才吸引力来说,它其实都是更好。 还有一个很重要的原因,我觉得娱乐场景今天的(产品)基线非常高。过去十 年移动互联网的发展,诞生了一堆非常好的娱乐体验的产品,但是在生产力这 个维度的基础体验或者说价值,还有非常大可以挖掘的空间。即使说今天最好 的生产力产品,我觉得它其实还没有非常深入地渗透到真正的工作流程里,而 且这是 AI 能带来的巨大新变量,所以这可能是为什么我们会做这样选择的重要 原因。 02 Kimi 的目标是你的终极伙伴Q: 怎么定义 Kimi 这个产品?它在解决什么问题?长期来看,是一个 AI 工作台 还是什么?杨植麟:这个我觉得可能是分短期和长期来看,短期希望在生产力场景能够提 供越来越多的智能。大 家今天一些最主要的任务,比如更好的信息获取、信息 分析、创作等,我们希望它能发挥更大的价值。 最长期最理想的情况,本质上是在讨论 AGI 产品的终极形态或者终极定义是什 么样的。其实大家有讨论,我觉得现在可能有两种不同的观点。 一种是,它是世界上另一个我,它拥有你所有的输入,想法基本跟你一样,等 于是复刻了一个自己,「另外一个自己」可以在数字世界,甚至物理世界做很 多事情。 另外一种定义是,它可能是你的一个伙伴,一个长期、甚至接近终生的伙伴,这个伙伴也能帮你做很多事情,但是它可能会跟你不一样,会给你提出来新的 视角,并不是完全复刻你,而是可能有点像。 杨植麟:非常理解你。我现在觉得可能第二种的概率更大,所以这可能是我们 想做的东西。 我觉得它会有几个比较重要的特征。 第一个我觉得它还是先得有用,就是你能做越来越复杂的事情。我觉得今天能 做的事情还不够多,这也是为什么我们现在最聚焦的还是去进一步提升模型的 能力。因为只有通过提升模型的能力,才能让它去做更多的事情。 把它类比为一个人的话,其实还缺少非常多的维度。它可能没有记忆,没有办 法做长期的规划。在我的想象中,如果这个产品做得好的话,它不是只能完成 这种 10 秒、20 秒就能完成的任务,而是说你能够让它定一个季度的 OKR,它 可以自己去完成。 ion(幻觉)、给你很多错误的结论,信任也很难建立。我觉得只有 在越来越复杂、长窗口的任务里提供真实性和准确性,才能够建立信任。所以我们会从这些方面去考虑产品。 Q: 从这个角度来说,我们今天看到的可能只是一个产品的初级形态。这也解释 了我们为什么可以看到产品里有不同新的功能,本质上你在努力赢得在用户身 边更有用的位置。这种位置未来会是从一部分能干的事逐渐扩展到越来越多,这可能是个路径。 杨植麟:我觉得这里面有一个重要的标志,就是如果有一天你发现在你的工作 里 AI 做的事情比你多了,也就是说 AI 占比超过 50% 了,可能会是一个非常重 要的 milestone 可能下一个 milestone 就是机器人的数量超过人类,但那是在物理世界,我觉得 数字世界会更早实现。 张鹏 :所以我很好奇一个问题,从月之暗面 Kimi 的角度去看,今天有一个很 成功的产品大家都在用,未来可能也会有新的功能解决用户更具象的问题。你 会更倾向于都在 Kimi 这个平台解决,还是会有机会长出其他更专有的 APP?杨植麟:我们肯定还是会很聚焦地,只做 Kimi 这一个 app。因为有一个很重要 的点是,未来的智能产品,它应该满足普世的需求。就像我 刚刚说的,娱乐的 需求,或者生产力的需求,甚至这两个东西可能也没有特别明确的边界。我觉得他们应该是在同一个产品里的,只是路径选择上会有区别。这也是我认 为通用智能最有意思的地方,它不是只能做一件事。但只是说在路径选择上肯 定没有办法在一开始就做所有的事情,一开始还是会有重点的场景、核心的用 户群体,然后逐渐去泛化开来。 所以我们还是希望聚焦做一个产品,然后把这个产品做到极致。 Q: 听起来 Kimi 要能达到你刚才说的终极目标——一个理解用户的伙伴,首先的 起点是从先帮用户做好一两件事情,然后逐渐能做越来越多的事情,然后这个 伙伴的关系和信任就建立了。这是一个前进的世界观和路线图。 杨植麟:是的。我觉得这中间很重要的一个标志,就是 AI 可以从单个的、具体 的任务,发展成能完成一个人要花几周才能做好的任务,也就是全方位的 Super Intelligence。 现在的 AI 其实可以实现一部分的 Super Intelligence,比如阅读长文本。 人没有 办法一下读完几百万字的文章、直接找到问题的答案,因为很多问题没法通过「查找」得到答案。这是我们一开始踩过的坑,就是找了一堆人标注长文本的 数据,认为标注完了人就学会了。但你发现其实人根本标注不了,或者效率非 常非常低。 所以今天 AI 有一部分的能力比人更好,我们需要的就是让这个范围逐渐变大。 03 长文本本质是 「长推理」 Q: 正好谈到了长文本,这也是 Kimi 一开始让大家印象深刻的一个点,甚至在 那个时候月之暗面可能比较非共识的提出来这件事很重要。我们也看到很多的 模型支持的文本长度在变长,这件事未来是不是已经逐渐形成共识?另外长文 本对于解决你说的那个终极的问题,是不是最重要的路径? 杨植麟:特别好的问题。今天确实有很多人在做长文本,但如果说是完全的共 识,其实我也不是非常确定。也有不同的观点,比如说认为短文本的场景下也 有很多可以挖掘的东西,可能不一定要非常着急去做长文本。 但我觉得这个也是正常的,因为每一个公司本身都有自己的判断。对我们来 说,我们其实比较早认为长文本可能是一个非常关键的东西,这里面有几个方 面:第一方面就是说,如果我们想让 AI从完成一两分钟的任务变成完成长周期的任 务,那必然要在一个很长的 context 里,才有可能真正把 AI 进一步往下推进。但这是一个必要不充分条件,具备了很长的 context能力后,可能还需要很强的 推理能力,之后你可以有更长的 context……我觉得它有点像螺旋迭代的过程。可能更准确的说法叫长推理,就是你能够在一个很长的窗口下面去做很好的推 理,我觉得这个是最终能产生很大价值的。 Q: 就是它最终其实是跟用户在做数据的输入、指令的输入和最终交付服务的转 换比的计算,转换比越高,带来的价值就越高。 杨植麟:对,这个确实很有意思。比如,即使只看长文本这个技术,它的落地 过程也是一个比例逐渐提升的过程。 因为在最早期的时候,就是用长上下文去做一些阅读类任务。阅读类任务肯定 是最早落地的,因为它是一个从很多的信息变成很少的信息的过程,相对会容 比如让 AI 读 10 篇文章,然后形成总结。这个难度肯定小于我只给 AI 一个很简 单的指令,但是要一口气做一个月,并且最好还要满足用户的需求。 这确实是个比例的问题,就是输入和输出的比例,它可能是更本质的东西。Q: 理解了,你觉得未来长文本的成本会快速下降吗?因为现在真的把 200 万 token 扔进去跑一圈,成本还是蛮 高的,而且这又跟长文本应用在哪些场景、能否高价值地解决问题有关,这两个问题其实是绑定在一起的,你怎么看?杨植麟:我觉得成本的持续下降肯定是个必然趋势。最近我们有一些新技术,一方面是一些工程上的极致优化,比如 context caching(上下文缓存)技术。另 一方面, 所以如果是 200 万字的窗口、并且能够让大部分人普惠地用起来,我觉得这是 一个大概率能在今年实现的目标。 Q: 今年就可以做到吗? 杨植麟:对,我觉得这是我们的目标。在接下来很长一段时间内,成本会持续 降低、而且速度会比short context(短文本)更快。 今天还有很多东西是没有被挖掘的。比如说,如果考虑一个人处理一个很长的 记忆、或长周期的任务,他其实并不需要记住所有东西,对吧?它是一个动态 计算的过程,你可以选择哪些东西要记下来、哪些要扔掉,这里面有非常大的 优化空间。 而今