国产之光 Deepseek R1 更新体验:惊喜与遗憾并存?
Deepseek R1 发布:有哪些值得关注的更新?
Deepseek 近期更新了 R1 版本,延续了以往在节假日前发布新版本的传统。虽然官网消息推送低调,版本号未变,但已方便各类 AI 客户端升级。OpenRouter 等第三方 API 服务商也第一时间提供了支持。那么,Deepseek R1 的效果到底如何呢?
Deepseek R1 在不同场景下的应用测试效果如何?
为了更直观地了解 Deepseek R1 的性能,我们进行了一系列测试,以下是测试结果:
1. 3D 台球游戏生成:物理碰撞效果惊艳,但仍有瑕疵
- 提示词:使用通用 3D 游戏生成提示词。
- 测试结果:虽然漏掉了球洞,不算真正能玩的游戏,但物理碰撞效果非常逼真,令人惊艳。
- 体验地址:3D 台球游戏
2. 横版卷轴射击游戏复刻:测试失败,不如 Claude 4 sonnet
- 提示词:使用通用 3D 游戏生成提示词,并指定游戏类型为“类似沙罗曼蛇(Salamander)的外太空射击游戏”。
- 测试结果:完全不能玩。
- 对比:Claude 4 sonnet 给出了一个相当出色的版本,不仅带音效,还有各种特殊道具,如增加生命或强化武器等。
- Claude 4 sonnet 体验地址:横版卷轴射击游戏
3. 坦克大战游戏复刻:能操控能射击,但 Bug 较多
- 提示词:使用通用 3D 游戏生成提示词,并添加“复刻经典游戏:坦克大战”的指令。
- 测试结果:能操控,能射击,但 Bug 较多,例如按空格会回到原位。3D 效果尚可。
- 体验地址:坦克大战游戏
4. Flappy Bird 游戏复刻:样子相似,但 无法运行
- 测试结果:游戏样子是那么回事儿,但无法点击运行。
- 对比:Claude 4 sonnet 真的给出了一个可玩的版本,但难度较高。
- Claude 4 sonnet 体验地址:Flappy Bird 游戏
5. 前端网页生成:审美在线,与 Claude 4 sonnet 不相上下
6. 金句卡片生成:精细度提升,可与 Claude 4 sonnet 媲美
7. 笑话创作:中规中矩,不如 Claude 4 Sonnet
- 提示词:使用提供的笑话创作提示词。
- 测试结果:个人感觉没 Claude 4 Sonnet 生成的精彩,算中规中矩。
8. 爆款标题生成:咪蒙风格标题吸睛,评分标题更实用
- 原始标题:Deepseek R1 发布了。
- 测试一(咪蒙风格提示词):
- “《今天起,所有ChatGPT用户都可能被这个中国AI杀死!》”
- “《128K上下文+完全免费!这枚国产核弹炸穿了所有AI的智商底线》”
- “《程序员集体失业夜:Deepseek R1让写代码成了认字游戏》”
- 测试二(评分标题提示词):
总结:Deepseek R1 的优缺点有哪些?
总体来说,Deepseek R1 在一些方面带来了惊喜,但也存在一些遗憾。在部分游戏可玩性和交互性上,仍有进步空间。作为国产大模型,Deepseek 表现出色,且团队行事风格低调。然而,目前模型并非多模态,限制了一些应用场景。期待 Deepseek R2 的表现。
我认为:这 Deepseek R1 的测试,正如一场百戏,锣鼓喧天,却也难掩几分尴尬。有的节目,碰撞出火花,引人喝彩;有的节目,却只落得个冷场。然而,即便如此,我们也不能妄自菲薄,毕竟,敢于亮剑,方能进步。期待 Deepseek R2 能够带来更多的惊喜,少一些遗憾,让国产大模型在世界的舞台上,发出更响亮的声音!
© 版权声明
文章版权归作者所有,未经允许请勿转载。