做了个DeepSeek的测评,我发现它真是有点幽默感的
← 返回产品测评

做了个DeepSeek的测评,我发现它真是有点幽默感的

上周 DeepSeek V4 发布了,说实话,我还挺激动的,抽空做了个简单的测评,想看看它的能力怎么样。

另外最近 DeepSeek 在搞活动,V4 Pro 打到了骨折价,不愧是梁圣…太牛逼了,这可是百万上下文的模型。

话不多说,我们来开始测评

01 说话风格

说来也怪,现在 AI 越来越擅长完成各种 Agent 任务,在 Coding 各方面的能力越来越强,而在写作方面,能力那是嘎嘎往小掉,所以我想看一下DeepSeek在创作方面怎么样。

我想到了个有意思的方法,给它发了个人才看得懂的幽默段子,这比写长文什么的感觉更能体现出水平。

大家猜一下哪个是DeepSeek,哪个是GPT 5.5

。 。 。 。

5s后

答案揭晓,左边的是DeepSeek,右边是GPT,可以发现DeepSeek还是懂人类的幽默的,还会跟你开个玩笑,而GPT真就正儿八经给你提供解决方案,像个呆瓜直男。

因为时间原因,这次没做特别全面的测评。DeepSeek 自己也在文章里写了,后端 Coding 能力目前离顶尖模型确实有差距,所以我就没测后端业务逻辑了。我主要想看看它的审美,前端能力到底怎么样。

接下来,我重点测试了DeepSeek的前端能力,因为DeepSeek自己也提到,目前离顶尖模型还是有点差距,所以我就不测它在复杂后端逻辑上的能力了。

02 复刻网易云音乐

我让它复刻一个网易云音乐。提示词也非常简单,就是让它帮我设计一个网易云播放器的 HTML 页面,要求能够真实播放。

花了几分钟,它搞完后修了下检测到的 bug,就直接能用了。

可以看下面这个视频——不光是页面风格基本和网易云差不多,你点私人雷达什么的,是真正能听的。虽然有部分数据源有些错误,但后面让它优化就能解决。

总体来说,这个交互和UI设计,完成度是非常高的。

然后播放界面有网易云经典的黑胶唱片效果,还有经典的红色主题,歌词也能实时滚动。

我用 GPT 做了同样的任务,真的很拉垮。而且我还让它调用了前端设计相关的 Skill 去做,不是模型直出…

结果,但你会发现它下面全是非常经典的 GPT 风格——带那种淡淡的橘红色底色,一眼 GPT 味,跟 DeepSeek 比起来,可以说是被完虐。

多提一嘴,这DeepSeek 做的播放器,你真别说,推荐的歌比网易云给我推荐的还要好听…

03 设计阿里云仪表盘

接下来看看它们设计B端后台的能力,这对交互和业务能力的理解有一定要去。我让它设计一个阿里云的仪表盘,完成度还是非常高的。

04 上点难度,做个星云特效

最后,我们给它上点难度,我让它做了星云特效的网页,而且可以跟随鼠标滚动控制星云方向。提示词是下面这段:

用 HTML + Canvas/WebGL 实现一个星空穿越(Star Warp)效果:视角从中心向外,星星从远处飞来并加速掠过屏幕边缘星星有拖尾效果(motion trail),速度越快拖尾越长鼠标位置控制飞行方向(鼠标偏左,星星从左边飞来)滚轮控制飞行速度星星颜色有冷暖变化(慢速偏蓝,高速偏白/橙)背景有淡淡的星云雾气效果保证流畅运行(1000+ 星星,60fps)

你会发现,生成出来的效果还挺酷的,星星的移动方向跟鼠标一致,指哪打哪,鼠标滚轮还能控制飞行速度。


到这里我们就简单测完了,DeepSeekV4 Pro虽然在后端能力上还是差点火候,但它在前端和创作能力上真没得说,还挺强的,再看看它的价格,只能说两个"真香",以后我的前端都可以放心的用kimi、Gemini、DeepSeek交叉搞了。