AI智能总结
发 100:00:00 互联 传媒 席杨晓峰,还有我的同事华普AI互联 级研究员郑希如。呃,今天主要是给各位领导测试 下,就是呃Deepseek的新出的模型。那么其实我们现在呃因为 家也经常听到过谁谁 第 了,所以我们今天是从相对 较客观的 度来看 模型的能 。 Deepseek v3.2测评251201 发 100:00:00 互联 传媒 席杨晓峰,还有我的同事华普AI互联 级研究员郑希如。呃,今天主要是给各位领导测试 下,就是呃Deepseek的新出的模型。那么其实我们现在呃因为 家也经常听到过谁谁 第 了,所以我们今天是从相对 较客观的 度来看 模型的能 。 先呢我们看 下 模型的 个使 量,然后再我们看 下就是价格,但是因为Deepseek V3.2现在还没有 规模的使 ,所以说现在还没有使 量的数据。那么最后的结果 定是有使 量才能证明你成功,啊,这是有投屏下把那个展开 下,就 前来看国产模型哪些是使 较好,使 多的,你在 上展开 下。 发 100:00:39 就 前来看,我们看到的国产模型使 较多的模型包括呃就是呃 前来看啊,除了Deepseek以外,其实就是Minimax所以我们可以看 下,就是这个模型 概多少钱?呃,我们之前介绍过,就是 模型现在就是在不同的价位上跟别 竞争,存 能 其实没太 意义,你说嗯 个低端的。模型去跟 端模型 ,那其实没太 意义的。那么看看就是 家的定位在哪 ?就是如果说呃MiniMax 前处在哪个地位呢?是 美元左右的档位。海外分,海外有 端的是 到 五美元,那么我们来看 下,就是这 次的DeepSeek V3在哪个档位?呃,你你可以在这 搜 下价格,嗯,多多少钱的单位。 发 100:01:27 对,我们可以看,就是 前来看整个,呃,不,你就在open root 搜,它其实是有的。DPC对,第 个就是了,是3.2的正式版嘛,应该对你可以看 下它的价格是多少。嗯,另外 个吧,就现在这个还没有价格。呃,它V3.2的另外 个版本,呃,spectre,对对对。是没有啊,都没有价格吗? 发 200:01:53 嗯,你可以到他的官 档看 下。 发 100:01:57 嗯,好,你可以看,因为我这边deepseek是有价格的。所以我们得知道它到底它的价格在什么档位,才能知道它的竞争 怎么样。啊,我这边有,已经有 跑出来了, 概是0. 发 100:02:08 42美元。所以说其实他的对 就是 美元左右的那些模型,对,所以呃如果说我们觉得说嗯你你打开 下。嗯,有吗?是不是0.42美元? 发 200:02:21 对,差不多差不多。 发 100:02:23 啊,对,你说差不多,所以 家可以看 个现象,就说如果说这个模型真的把GPT5 翻了, 家可以想象 下这个概率是不,呃,说实话是那整个 业就变天了,说 了就是你0.4美元,你把 个10美元的模型给 死了,所以 家可以,这个我觉得有点夸张了。对,所以这样的话就是嗯,这是不是你也对 下,就是这个模型在0.5这个价位能不能 掉 美元啊,你可以对 下那个Mimax,还可以 对 下呃那个就是GPT5还有就是像其他的模型,对,就是说 了这个嗯我们觉得说这个东西还。是要呃相对 较客观的去评价,因为你如果说 个0. 发 100:03:03 4的美元把 家15美元的 掉了,那这个就是说明 个问题,就是整个 业都会有 的变化。好的,那当然,后续我们今天是第 次使 ,还没有 使 。嗯,这 有 个 度是什么,怎么来判断呢?哎,你把那个open root再打开 下,就是我们可以看到为什么最近Kimi没声 了,就是因为你在这 搜的时候,你搜 下open root呃,Kimi当 时为什么没有成功,核 的原因是当时他卖的价格太贵了。他卖这个差不多是零点呃差不多卖卖两美元,所以其实后 就没啥 。对,所以这样的话你就会发现呃价格 个性能价格过 是没 的,那你现在价格是0.5美元,那么就看看他能不能把0.5美元把 美元的 掉,或者说在同等价位的 平,好的,这些论你这样对 下吧。 发 200:03:52 嗯,好的。嗯,下 我们主要看先看 下deepseek mini max和K 的 个效果,然后。这 次的Deepseek V3. 发 200:04:02 2他们对,也也有去对标ChatGPT系列的模型,所以我们也会拿它和呃ChatGPT Codex Max这个模型来做 下对 。主要有以下 个例 , 先第 个是呃让他们 成 个动态 ,来让我们展 这个太阳系中的各星球的位置和 关系,最好有交互的 个效果。然后 先我们看到的是Deepseek3. 发 200:04:29 2的 个效果,因为现在新的模型已经呃上线了他们的APP ,还有API端。我这 下载 下。这是DeepSeek V3.1的呃 个效果。对于这个案例,它更多的是采 呃把它理解成了 个教学 ,然后有很多的 字、 字的描述信息。 发 200:04:59 可以选择。地球内太阳系,还有 态巨 星,呃,但是实际上的效果的话,还是有 些些的这个和我们想要的有些偏差,然后看 下K2呃,同样的 个案例,太阳系可视化。呃,这是K2的 个效果,我们可以把它给。 发 100:05:29 那那就相当说,呃,这些了。那相当说这个是两美元的,他 不过对吧? 发 200:05:35 嗯,这个案例上来看是这样啊。 发 100:05:37 好,那你看看 美元的kimi kill看。 发 200:05:42 嗯,好的。 发 100:05:46 然后你你你等会也给各位领导补充 下,就V3.2开始是不是带四位链了?就以后没有R系列了,是这意思吧?你看看有没有呃证据能说明这个问题啊。 发 200:05:56 嗯,好的。那下 我们来看到的这个就是 美元价格的这个miniMax的M2,然后它也是 成了 个 。呃,这 的这个效果的话,呃,看上去也是 deep seek的要更精致 些, 且它像刚才的K2和M2可能更多的就关注这个动态的展 效果没有那么多的 字去说明,呃,放 看 下。这是M2的 个效果。相 较来说的话,这 个呃也是 较不错的。然后再看 下这个 较 较强的这个OpenAI他们的Codec模型。 发 100:07:36 对,所以就是呃 前来看,有的说法就相对 较夸张。说 了就是 业已经到这个阶段了,都是 分价钱 分货。对,所以我们其实可以看 下,就是 前。当然这个刚才我们也看到,就是Kimi K2 的 少的 个核 原因就是因为价格是Mini Max的两倍,但效果上可能没有达到两倍的效果,确实好了 点点。 发 200:07:59 嗯,那现在。看到的是GPT5 Codex的 个效果,呃,其实其实他做的也不是也不是特别好。 发 100:08:12 发 200:08:15 是吧?对,呃。他 较的简单做的。 发 100:08:24 嗯,好的,那这个也没问题,因为open3毕竟主要是搞c端的,那确实呃不太 ,那你再换个新案例吧。 发 200:08:31 再对 下。好的,然后下 第 个案例不那么看重呃现实模拟,是 个功能 的,这个 啊 构建。我们让它 成 个 胶唱 的 乐播放器,这 个也是我们原先 Jamia3 Pro去做过的。嗯,我我们先看 下DeepSeek V3. 发 200:08:57 1这个它使 了两次才实现了这个正常的功能。 先第 次的时候,呃,他并没有。实现让我们可以去呃上传 的 乐播放, 是给我们随机到不同的电台,然后模拟 频,但是没有声 的效果。因为这个也可以理解,因为他们没有实际上是没有 乐的。只是 个模拟,然后第 次我们跟他说,呃,我希望我 能够上传 乐来实现效果,看 下第 次的 个运 效果。这 我们可以点击上传 乐 个 件。 发 200:09:50 星空转问号在 有三种模拟 式:条形、圆形和波形图。所以改了第 次。改到第 次的时候,它的效果已经挺好的了。然后这是就是deepseek的嗯这个案例,然后我们再看 下K2实现同样的 个。 发 200:10:18 Pir这 直接就让我们可以进 个 频的加载。上传之后,呃,点击播放,点击播放这 是没有声 的啊。那我们也给他第 次回答。上传 乐后没有声 。 发 200:10:44 再来看 下mini max M2第 次的 个效果, 胶播放器呃依然是 个 形式。但是呃minimax会 成 个 件夹, 有三个项 更完整 些。现在我们点击 频 件上传。这 是点不动的,这 是点不动的。只能点击右下 的这个上传。 发 200:11:23 嗯,然后上传之后也是没有声 ,所以相当于这三个模型第 次都失败了。依然告诉我M2哦,上传之后没有声 。 发 200:11:47 这个案例包括cloudsonic四点五,其实它的第 次 成也是上传之后没有声 。当我们给他第 次让他修改的时候,嗯,可以再看 下他的 个效果。 发 200:12:19 对cloud状态4.5第 次修改的时候,呃,也是没有改好,没有改出来。嗯,先再来看 下K2和M2有没有改好。 发 100:13:08 刚刚deepseek 了多久改出来的? 发 200:13:12 Deepseek在代码 成 还是 较快的。呃,它的思考过程我们可以看到,呃,这 之所以说它可能有思维链。把跟R1给结合起来,就是因为每 次的V3的呃这个运 思,就是提问,我们也可 以选择这个深度思考,让他思考后再回答。 且就是可能R2后 不 定再再会有更新了,它会和v系列结合在 起,让呃让推理和这个 成结合,然后我们再看 下K2改了之后的 个效果。 发 200:14:07 对,然后然后他这 次改了之后依然是依然是没有成功,还是可以上传。 发 200:14:21 就失败了,再看 下M2。 发 200:14:50 这是他修改之后的 个效果,呃,再次点击上传 频 件。 发 200:15:01 对,然后依然没有声 , 家可以听到。依然是没有声 。所以M2和K2在这 个案例上,其实都呃没有k没有这个V3. 发 200:15:17 2的强,3.2也是 了两次,其他的也是 了两次。但是第 次的时候3.2就成功了, 且效果也不错。这个案例嗯其实cloud sonnet4.5的话,它第 次也是失败的,然后也是需要进 步去修改。这这个,第三个是。 发 100:15:39 这样看下来这个案例 是V3.2的效果其实还可以,对吧? 发 200:15:43 对对,然后第三个是这个流体动 学交互模拟,也是我们经常使 的,啊,每个每个模型第 次 成的效果看 下,就是Deepseek V3.2的 个效。效果跟上 版本 ,它的确有 较明显的进步 ,因为上 版本它还是呃 粒 的 式来模拟,现在已经有流体和这个速,湍流流速的感觉了。那我们可以加 呃滑块,类似于物体脱,呃,这个障碍物,然后看 下在这种流动的场景下,这个会带来什么样的效果?他也有进 些模拟,包括流速 箭头来模拟出来。所以效果也是不错的。当然要是跟最强的模型, 如Jamna3呃 还是会有 些差距。 发 200:16:44 再看 下K2的同 个案例。嗯,K2还是跟就原先 样 这种粒 的 式来模拟流体,但实际上啊没有没有没有什么。没效果,没有什么动画效果。这是K2再看 下M2M2就是原先呃V3还有可能 些千问的模型,千问的前 版、前 代模型会采 的 种 式, 粒 的 式来模拟流体。嗯,其实也没有达到我们想要的 个效果。对,但可能交互上会好 些些。啊,这是这 个案例,就这个案例。如果从这三个来。来看的话,其实V3在呃V3. 发 200:18:03 2在代码 的进步还