Q: 请两位分别讲讲自己的从业经历,对大模型时代的借鉴与帮助? 曹大鹏:我经历过 Web 互联网、移动互联网,也曾自己创业,在大厂做过 B 端的 SaaS。 上一份工作是在飞书做产品负责人,国内的生产力赛道主要是 tob 的 SaaS,很多软件 不好用。但飞书在国内无论是面向 ToB 还是 ToC,用户体验都非常好。这段经历对我 帮助很大,让我了解办公场景的用户需求。 在移动互联网创业时一年融了三轮,当时市场热钱很多,所有投资人或者市场大家更关注用户能不能增长更快,但是不是发展更健康关注较少,经过了四五年,从 2017 年 开始,整个市场完全就变了,抖音或者更大的产品出来,以前高速增长的一些创业公司例如 ofo 打车这些很难持续下去。 后来一个新技术出来,都开始关注商业模式,这种认知延续到我加入零一,当时零一选择市场时,便选择了商业化比较成熟的海外市场,我们第一天就提供收费功能,一直以收入目标为核心去做增长产品。 零一的生产力产品主打 AI 工作平台,核心是找到“找读写”这三个痛点场景在一个产品 里完成,而不是说只做一个 chatbot。 蓝雨川:我早期做战略咨询跟移动互联网时代的投资,后面出来创业,做中国财税的SaaS,也用到了 AI + RPA 技术,到飞书后跟曹大鹏搭档,做一个新业务的探索,曹大鹏 是产品负责人,我是 GTM 负责人。看到 ChatGPT 出来后,判断这是未来明确的大趋 势,又一起做了一段时间海外 AI-Native 应用的探索。后来发现模应一体是更大的机会,所以就加入到零一万物。 到零一万物后,一开始花了很多时间在做海外的生产力产品,去年 11 月开源 Yi-34B 模型后,在海外影响力不错,那时起就筹备 Yi 模型 API Service。 Q: 为什么当时没有选择从 B 端开始切入? 曹大鹏:任何一个新技术浪潮来临的时候,最先增长起来的肯定是 C 端市场,因为 C 端决策非常简单。ToB,从客户认可产品价值,到跟决策层谈好合作,再完成产品部 署,整个周期至少 3个月到半年起。 Q: 面对国内 C 端付费意愿较低的环境,万知未来要如何商业化? 曹大鹏:国内跟海外发达国家相比,不光是 AI C 端应用,所有的工作软件,整个付费 市场都差了不止一个量级。在国内,如果一开始就做一个付费产品,可能没办法获得用户,就没办法获得用户的反馈,很难真正迭代产品。所以万知早期还是免费策略,但也有一些高价值场景可能会收费,例如用户想要一个 PPT,原来需要 1 个小时,现在 用万知创作修改只用 10 分钟,我们相信有大量用户愿意付钱,而且据了解国内 PPT 制 作市场 ,一些初创公司一个月也能达到上百万的收入。 Q: 零一的 API 如何跟友商竞争,有什么优势? 曹大鹏:首先零一最新公布的千亿模型性能多项指标超过 GPT-4,这是性能上的优势,其次,零一的 API 定价远远低于 GPT-4。零一最强的 Yi-Large 模型定价是 人民币 Q: 如何找到技术的 TC-PMF? 曹大鹏:研发大模型产品,除了要深度了解大模型本身的能力,能干什么,不能干什么,哪方面做的好,基于它能找到合适的场景去匹配。如果找了一个大模型根本不擅长的场景,这个产品就不可能有 PMF。 其次,关于 cost 成本这块,即每次模型的调用到底花多少钱,包括接下来三个月、六 个月它会降到多少钱?要计算产品给用户的免费用量应该是多少,付费用量应该是多少,因为最终要算整体的 ROI。所以,如果说模型每次调用成本降低很多的话,我们就 可以给用户更多的免费用量,或者给用户更多的权益。但是成本一直降不下来的话,用户也就不能低成本获取 API,使用模型的成本较高。 这就对 AI-First 产品时代的产品经理要求更高,要有定义产品 PMF(产品市场契合点)的能力,还要对技术、商业有更多的理解,才能把 technology 和 cost 这部分权衡好。不同于互联网时代成熟产品的产品经理,现在的 AI 产品经理基本都要从 0 到 1定义场 景,构建产品 Q: 为何最初选择在海外开疆拓土? 曹大鹏:零一选择在大模型发展领先国内一个身位的海外市场出发,在一个相对成熟的市场去找真正的刚需,这是零一的策略,所以去年 9 月率先在海外推出了一系列产 品,包括PPT 这个功能也是在产品迭代过程中,发现用户对这个需求特别强,也愿意 付费,我们才选择迭代进去。C 端产品在海外已经发展了近几百万用户,已经有了验 证后面才决定跟基础问答的功能放在一起,在国内推。 Q: API 开放平台跟生产力产品两块分别在模应一体战略中扮演什么样的角色?蓝雨川:ToCApps 和 API 都算是模型的应用。 API 并没有想象中简单,除了标准模型的 API 之外,也提供了 Yi-Large-RAG、Yi-Large-Turbo 这样的 API,这些 API 背后不是对应完全不同的模型,而是各个模型的组合。我们把 API 当做一个产品,去想企业真实去使用 API 的时候,会怎么用,例如他们在做 知识检索类场景时,是不是希望有一个 RAG API 能够带来知识查询和联网搜索的能 力? 我们认为是会的,万知以及其他少数几家竞对产品都包含了 RAG 能力,但真正给到企 业开发者的国内首个 RAG API 是零一 API 平台推出的。例如 Turbo API,开发者不是永 远都需要选择最好的那个模型,他们经常要在性能、成本和速度之间去做一个平衡,这个时候 turbo 可能更适合。 曹大鹏:在零一的模应一体战略中,应用不仅包含了零一自研的应用,例如万知,另一部分的应用更广泛来自整个零一的生态,例如通过 Yi API 开放平台,将零一的模型开 放给外部开发者,驱动大量新的应用。 因为不是人人都能去部署、训练大模型,API 就像一个管道一样,让开发者调用,零一 希望通过API 将大模型能力赋能到千行百业。零一选择几个擅长、了解的场景去做 ToC 应用,其他应用则通过 API 平台去孵化。 蓝雨川:产品对于 API 是有非常大的帮助的。比如最开始是通过万知发现用户问到一 些复杂的问题时,他需要有一个 RAG 的能力去提升这个回答的质量,所以我们就在模 型上做了相关的RAG 能力,再定义了 RAG API 。 Q: 大模型幻觉还没有彻底解决,在将模型应用到具体生产力场景中,是否会产生不良 影响? 曹大鹏:零一海外、国内的生产力产品以及未来正在探索的产品,都用了零一的 API,可以理解为零一自己也是一个开发者,跟外部的其他公司开发者一样,直接调用 API 来研发应用,底部都是零一的各个模型。 因此,万知是一个非常丰富的产品,里面不止一个模型,例如解读图表背后就叠加了零一的视觉语言模型。 Q: 万知的核心场景除了 PPT 制作还有哪些? 曹大鹏:核心场景主要是“找读写”,“找”对应的是通用问答,就 chatbot;“读”是 AI 文 档阅读,万知最多支持 5000 页,500 万字的 PDF,这个能力在竞品里还没有几家能达 到,这其实用到了 RAG 技术;“写”对应到 AI 创作 PPT。 Q: PPT 制作怎么算是高价值场景? 曹大鹏:举个简单例子,小红书、抖音上有大量靠卖 PPT 模板 ,一年赚几百万的博 主。所以这证明了 PPT 其实有大量需求的,WPS 现在 C 端一年收入都有几十亿人民 币,这其中透露的就是产品力和商业模式。 而且通用问答产品已经严重同质化了,如果大家都做免费的,真的挺难活下去的,创 业公司烧钱能烧过字节吗? Q: 零一是如何去找应用场景的?如何才能做到事半功倍?曹大鹏:用 TC-PMF 方法论去定义场景,模型的能力是不是足够好,还要看成本是否能 cover 掉,不会盲目去找一些留存少的场景。其次,从海外寻找经验。万知是海外先行的产物,海外比国内在应用落地上快一年到一年半,所以我们先孵化海外,再复制到国内,而不是仅仅在国内闭门造车。现在国内大模型大家普遍还处于寻找场景的阶段,证明其实还没找到合适的场景。Q: 零一会做私有化部署吗?蓝雨川:零一会很谨慎对待这一点,我们优先关注的是,客户是不是真正在自己的场景上把 API 的用量用起来,把自己的 AI 产品做起来,产品能 PMF 能赚到钱,我们不会 去盯着项目交付赚一次性的钱。Q: 大模型公司做 C 端应用成本相比市面上其他初创应用公司成本高很多,零一如何看 待这个问题?曹大鹏:自研模型有机会作出 SOTA 模型,还可以针对产品场景微调强化。如果用开源 模型,验证期可能可以,但做深做大就很难,一是缺乏技术壁垒,二是开源模型本身部署微调的成本和人才要求也很高。Q: 零一做应用的优势在哪?曹大鹏:首先零一自己有在国际标准上排名靠前的模型,而现在的 AI 应用能做起来至 少 60% 是由模型能力决定的。Q: 现在零一 API 平台的用户有多少?蓝雨川:正式发布前已经试运行了一个多月,有不少种子用户,可以期待下今年的成绩。Q: 零一未来会持续开源吗?蓝雨川:会持续升级,开源重要的是开源出来的模型要真的有用。所以零一开源还是以实用性为主,未来开源还是会以轻盈的模型跟多模态为主。Q: 对过去一年整体的感受与看法,未来有怎样的的趋势预测?曹大鹏:过去国内基本都在拼模型能力,真正落地到应用的很少,今年 AI 应用会迎来 爆发,因为模型能力可能达到了一个临界点。同时,商业化会成为非常重要的一个课题。而 API 是很好的一个商业模式。蓝雨川:我们理解接下来一年会迎来 AI 应用爆发,因为国产大模型能力已经与 GPT-4 不相上下,而美国 AI 应用全面爆发正是在 GTP-4 0314 发布之后。我们也希望 Yi-Large 能够带来国内 AI 应用生态繁荣,也通过 API 为零一创造一个比较 好的商业模式。做大模型的投入非常大,需要融资、买卡、训模型,如果一个创业公 司一 年、两年看不到商业回报,不能建立商业闭环,继续做更大的模型就很难,所以 我们很努力在通过ToC 产品和 API 去增长、赚钱。