您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:Deepseekv32测评20251201 - 发现报告

Deepseekv32测评20251201

2025-12-01未知机构梅***
Deepseekv32测评20251201

发 100:00:00 互联传媒席杨晓峰,还有我的同事华普AI互联级研究员郑希如。呃,今天主要是给各位领导测试下,就是呃Deepseek的新出的模型。那么其实我们现在呃因为家也经常听到过谁谁第了,所以我们今天是从相对较客观的度来看模型的能。 Deepseek v3.2测评251201 发 100:00:00 互联传媒席杨晓峰,还有我的同事华普AI互联级研究员郑希如。呃,今天主要是给各位领导测试下,就是呃Deepseek的新出的模型。那么其实我们现在呃因为家也经常听到过谁谁第了,所以我们今天是从相对较客观的度来看模型的能。先呢我们看下模型的个使量,然后再我们看下就是价格,但是因为Deepseek V3.2现在还没有规模的使,所以说现在还没有使量的数据。那么最后的结果定是有使量才能证明你成功,啊,这是有投屏下把那个展开下,就前来看国产模型哪些是使较好,使多的,你在上展开下。 发 100:00:39 就前来看,我们看到的国产模型使较多的模型包括呃就是呃前来看啊,除了Deepseek以外,其实就是Minimax所以我们可以看下,就是这个模型概多少钱?呃,我们之前介绍过,就是模型现在就是在不同的价位上跟别竞争,存能其实没太意义,你说嗯个低端的。模型去跟端模型,那其实没太意义的。那么看看就是家的定位在哪?就是如果说呃MiniMax前处在哪个地位呢?是美元左右的档位。海外分,海外有端的是到五美元,那么我们来看下,就是这次的DeepSeek V3在哪个档位?呃,你你可以在这搜下价格,嗯,多多少钱的单位。 发 100:01:27 对,我们可以看,就是前来看整个,呃,不,你就在open root搜,它其实是有的。DPC对,第个就是了,是3.2的正式版嘛,应该对你可以看下它的价格是多少。嗯,另外个吧,就现在这个还没有价格。呃,它V3.2的另外个版本,呃,spectre,对对对。是没有啊,都没有价格吗? 发 200:01:53 嗯,你可以到他的官档看下。 发 100:01:57 嗯,好,你可以看,因为我这边deepseek是有价格的。所以我们得知道它到底它的价格在什么档位,才能知道它的竞争怎么样。啊,我这边有,已经有跑出来了,概是0. 发 100:02:08 42美元。所以说其实他的对就是美元左右的那些模型,对,所以呃如果说我们觉得说嗯你你打开下。嗯,有吗?是不是0.42美元? 发 200:02:21 对,差不多差不多。 发 100:02:23 啊,对,你说差不多,所以家可以看个现象,就说如果说这个模型真的把GPT5翻了,家可以想象下这个概率是不,呃,说实话是那整个业就变天了,说了就是你0.4美元,你把个10美元的模型给死了,所以家可以,这个我觉得有点夸张了。对,所以这样的话就是嗯,这是不是你也对下,就是这个模型在0.5这个价位能不能掉美元啊,你可以对下那个Mimax,还可以对下呃那个就是GPT5还有就是像其他的模型,对,就是说了这个嗯我们觉得说这个东西还。是要呃相对较客观的去评价,因为你如果说个0. 发 100:03:03 4的美元把家15美元的掉了,那这个就是说明个问题,就是整个业都会有的变化。好的,那当然,后续我们今天是第次使,还没有使。嗯,这有个度是什么,怎么来判断呢?哎,你把那个open root再打开下,就是我们可以看到为什么最近Kimi没声了,就是因为你在这搜的时候,你搜下open root呃,Kimi当 时为什么没有成功,核的原因是当时他卖的价格太贵了。他卖这个差不多是零点呃差不多卖卖两美元,所以其实后就没啥。对,所以这样的话你就会发现呃价格个性能价格过是没的,那你现在价格是0.5美元,那么就看看他能不能把0.5美元把美元的掉,或者说在同等价位的平,好的,这些论你这样对下吧。 发 200:03:52 嗯,好的。嗯,下我们主要看先看下deepseek mini max和K的个效果,然后。这次的Deepseek V3. 发 200:04:02 2他们对,也也有去对标ChatGPT系列的模型,所以我们也会拿它和呃ChatGPT Codex Max这个模型来做下对。主要有以下个例,先第个是呃让他们成个动态,来让我们展这个太阳系中的各星球的位置和关系,最好有交互的个效果。然后先我们看到的是Deepseek3. 发 200:04:29 2的个效果,因为现在新的模型已经呃上线了他们的APP ,还有API端。我这下载下。这是DeepSeek V3.1的呃个效果。对于这个案例,它更多的是采呃把它理解成了个教学,然后有很多的字、字的描述信息。 发 200:04:59 可以选择。地球内太阳系,还有态巨星,呃,但是实际上的效果的话,还是有些些的这个和我们想要的有些偏差,然后看下K2呃,同样的个案例,太阳系可视化。呃,这是K2的个效果,我们可以把它给。 发 100:05:29 那那就相当说,呃,这些了。那相当说这个是两美元的,他不过对吧? 发 200:05:35 嗯,这个案例上来看是这样啊。 发 100:05:37 好,那你看看美元的kimi kill看。 发 200:05:42 嗯,好的。 发 100:05:46 然后你你你等会也给各位领导补充下,就V3.2开始是不是带四位链了?就以后没有R系列了,是这意思吧?你看看有没有呃证据能说明这个问题啊。 发 200:05:56 嗯,好的。那下我们来看到的这个就是美元价格的这个miniMax的M2,然后它也是成了个。呃,这的这个效果的话,呃,看上去也是 deep seek的要更精致些,且它像刚才的K2和M2可能更多的就关注这个动态的展效果没有那么多的字去说明,呃,放看下。这是M2的个效果。相较来说的话,这个呃也是较不错的。然后再看下这个较较强的这个OpenAI他们的Codec模型。 发 100:07:36 对,所以就是呃前来看,有的说法就相对较夸张。说了就是业已经到这个阶段了,都是分价钱分货。对,所以我们其实可以看下,就是前。当然这个刚才我们也看到,就是Kimi K2的少的个核原因就是因为价格是Mini Max的两倍,但效果上可能没有达到两倍的效果,确实好了点点。 发 200:07:59 嗯,那现在。看到的是GPT5 Codex的个效果,呃,其实其实他做的也不是也不是特别好。 发 100:08:12 发 200:08:15 是吧?对,呃。他较的简单做的。 发 100:08:24 嗯,好的,那这个也没问题,因为open3毕竟主要是搞c端的,那确实呃不太,那你再换个新案例吧。 发 200:08:31 再对下。好的,然后下第个案例不那么看重呃现实模拟,是个功能的,这个啊构建。我们让它成个胶唱的乐播放器,这个也是我们原先 Jamia3 Pro去做过的。嗯,我我们先看下DeepSeek V3. 发 200:08:57 1这个它使了两次才实现了这个正常的功能。先第次的时候,呃,他并没有。实现让我们可以去呃上传的乐播放,是给我们随机到不同的电台,然后模拟频,但是没有声的效果。因为这个也可以理解,因为他们没有实际上是没有乐的。只是个模拟,然后第次我们跟他说,呃,我希望我能够上传乐来实现效果,看下第次的个运效果。这我们可以点击上传乐个件。 发 200:09:50 星空转问号在有三种模拟式:条形、圆形和波形图。所以改了第次。改到第次的时候,它的效果已经挺好的了。然后这是就是deepseek的嗯这个案例,然后我们再看下K2实现同样的个。 发 200:10:18 Pir这直接就让我们可以进个频的加载。上传之后,呃,点击播放,点击播放这是没有声 的啊。那我们也给他第次回答。上传乐后没有声。 发 200:10:44 再来看下mini max M2第次的个效果,胶播放器呃依然是个形式。但是呃minimax会成个件夹,有三个项更完整些。现在我们点击频件上传。这是点不动的,这是点不动的。只能点击右下的这个上传。 发 200:11:23 嗯,然后上传之后也是没有声,所以相当于这三个模型第次都失败了。依然告诉我M2哦,上传之后没有声。 发 200:11:47 这个案例包括cloudsonic四点五,其实它的第次成也是上传之后没有声。当我们给他第次让他修改的时候,嗯,可以再看下他的个效果。 发 200:12:19 对cloud状态4.5第次修改的时候,呃,也是没有改好,没有改出来。嗯,先再来看下K2和M2有没有改好。 发 100:13:08 刚刚deepseek了多久改出来的? 发 200:13:12 Deepseek在代码成还是较快的。呃,它的思考过程我们可以看到,呃,这之所以说它可能有思维链。把跟R1给结合起来,就是因为每次的V3的呃这个运思,就是提问,我们也可 以选择这个深度思考,让他思考后再回答。且就是可能R2后不定再再会有更新了,它会和v系列结合在起,让呃让推理和这个成结合,然后我们再看下K2改了之后的个效果。 发 200:14:07 对,然后然后他这次改了之后依然是依然是没有成功,还是可以上传。 发 200:14:21 就失败了,再看下M2。 发 200:14:50 这是他修改之后的个效果,呃,再次点击上传频件。 发 200:15:01 对,然后依然没有声,家可以听到。依然是没有声。所以M2和K2在这个案例上,其实都呃没有k没有这个V3. 发 200:15:17 2的强,3.2也是了两次,其他的也是了两次。但是第次的时候3.2就成功了,且效果也不错。这个案例嗯其实cloud sonnet4.5的话,它第次也是失败的,然后也是需要进步去修改。这这个,第三个是。 发 100:15:39 这样看下来这个案例是V3.2的效果其实还可以,对吧? 发 200:15:43 对对,然后第三个是这个流体动学交互模拟,也是我们经常使的,啊,每个每个模型第次 成的效果看下,就是Deepseek V3.2的个效。效果跟上版本,它的确有较明显的进步 ,因为上版本它还是呃粒的式来模拟,现在已经有流体和这个速,湍流流速的感觉了。那我们可以加呃滑块,类似于物体脱,呃,这个障碍物,然后看下在这种流动的场景下,这个会带来什么样的效果?他也有进些模拟,包括流速箭头来模拟出来。所以效果也是不错的。当然要是跟最强的模型,如Jamna3呃还是会有些差距。 发 200:16:44 再看下K2的同个案例。嗯,K2还是跟就原先样这种粒的式来模拟流体,但实际上啊没有没有没有什么。没效果,没有什么动画效果。这是K2再看下M2M2就是原先呃V3还有可能些千问的模型,千问的前版、前代模型会采的种式,粒的式来模拟流体。嗯,其实也没有达到我们想要的个效果。对,但可能交互上会好些些。啊,这是这个案例,就这个案例。如果从这三个来。来看的话,其实V3在呃V3. 发 200:18:03 2在代码的进步还