万字的gpt4omini的api成本大概要人民币大几十块,随后测试了国内的qwen、deepseek等几家,最终选了个最便宜最稳定的deepseek。 从性能上测试早期v1 v2版本,从检索的预处理质量看,和gpt4omini 周末朋友们讨论了很久deepseek,从未如此的兴奋过,作为开发者的视角:1、在24.7第一次开始注意到deepseek:当时微软推出graphrag,这是一种高成本的检索方案,处理100万字的gpt4omini的api成本大概要人民币大几十块,随后测试了国内的qwen、deepseek等几家,最终选了个最便宜最稳定的deepseek。 从性能上测试早期v1 v2版本,从检索的预处理质量看,和gpt4omini无二。 2、24年底,deepseekv3的coding能力让我惊掉下巴:开始研发跟投资有关的AIAGENT后,对模型的代码能力要求提升了。 经过几百个版本的测试,我可以负责任的说:目前代码能力最好的是claude,其次就是deepseek,如果考虑到claude成本比deepseek贵了几十倍,那最强的就是deepseek。 gpt4o我没有感觉到在大量aiagent任务年前有任何优势。 从此我所有的api都转向了deepseek,开发了半个月才花了10块钱,如果是gpt预期成本是10-15美金。 3、deepseek能力在aiagent的生产环节中强在哪里:第一,中文能力显著更强。 第二。 ,aiagent开发中有无数环节需要模型自动生成、执行代码,开发者最重视的是:模型能不能正确理解prompt中的细节,并且给出结构稳定的输出。 而同样一个长度的prompt,很多情况下,gpt4o无法抓到重点给出正确的输出,deepseek却可以做到正确的输出。 这真是应用开发者的aha时刻。 deepseek的api成本在恢复优惠后是claude和gpt十分之一不到。 4、2025以及以后的世界线会怎么变化:这时候在二级甚至不需要研究deepseek是怎么做到这件事的了,以前对着海外ai跪着的开发者们可以站起来了,因为方法的开源后deepseek的能力已经检验通过了,从我看制造业的经验来看,低成本的方案一定会最快时间席卷整个行业。 算力会不会过剩? 这个算这会儿不清楚,但确认的是对openai祛魅后,全球的开发者一定会开始用成本更低的api开始开发更多的aiagent应用,应用端肆无忌惮涨价的应用会犹豫了。 claude、gpt4o还是会有一席之地,更高级的任务里还是有他们的应用场景。 从此2000块的手机、家里的电视机、家具、汽车、玩具都可以用上模型api了,端侧小模型跑起来小模型也没有任何压力,简单任务本地解决、复杂任务就用api解决。 降价后的需求的增长,预期是十倍甚至百倍的增长。 还是那句诗:旧时王谢堂前燕,飞入寻常百姓家。