Deepseek R1测评:游戏有惊喜,国产AI仍有瑕疵?

AI前言1天前发布 yizz
2,483 0 0
广告也精彩

国产之光 Deepseek R1 更新体验:惊喜与遗憾并存?

Deepseek R1 发布:有哪些值得关注的更新

Deepseek 近期更新了 R1 版本,延续了以往在节假日前发布新版本的传统。虽然官网消息推送低调,版本号未变,但已方便各类 AI 客户端升级。OpenRouter 等第三方 API 服务商也第一时间提供了支持。那么,Deepseek R1 的效果到底如何呢?

Deepseek R1 在不同场景下的应用测试效果如何?

为了更直观地了解 Deepseek R1 的性能,我们进行了一系列测试,以下是测试结果

1. 3D 台球游戏生成物理碰撞效果惊艳,但仍有瑕疵

  • 提示词:使用通用 3D 游戏生成提示词
  • 测试结果:虽然漏掉了球洞,不算真正能玩的游戏,但物理碰撞效果非常逼真,令人惊艳。
  • 体验地址3D 台球游戏

2. 横版卷轴射击游戏复刻测试失败,不如 Claude 4 sonnet

  • 提示词:使用通用 3D 游戏生成提示词,并指定游戏类型为“类似沙罗曼蛇(Salamander)的外太空射击游戏”。
  • 测试结果完全不能玩
  • 对比Claude 4 sonnet 给出了一个相当出色的版本,不仅带音效,还有各种特殊道具,如增加生命或强化武器等。
  • Claude 4 sonnet 体验地址横版卷轴射击游戏

3. 坦克大战游戏复刻能操控能射击,但 Bug 较多

  • 提示词:使用通用 3D 游戏生成提示词,并添加“复刻经典游戏:坦克大战”的指令。
  • 测试结果能操控,能射击,但 Bug 较多,例如按空格会回到原位。3D 效果尚可。
  • 体验地址坦克大战游戏

4. Flappy Bird 游戏复刻样子相似,但 无法运行

  • 测试结果:游戏样子是那么回事儿,但无法点击运行
  • 对比Claude 4 sonnet 真的给出了一个可玩的版本,但难度较高。
  • Claude 4 sonnet 体验地址Flappy Bird 游戏

5. 前端网页生成审美在线,与 Claude 4 sonnet 不相上下

  • 提示词:使用 2.1 版本的前端网页生成提示词
  • 测试结果:生成效果审美相当在线,个人认为与 Claude 4 sonnet 不相上下。
  • 体验地址前端网页

6. 金句卡片生成精细度提升,可与 Claude 4 sonnet 媲美

  • 提示词:使用 V2 版本的金句卡片生成提示词
  • 测试结果:效果 Nice,比 0324 版本精细了很多,完全可以和 Claude 4 sonnet 扳手腕。
  • 在线体验金句卡片

7. 笑话创作中规中矩,不如 Claude 4 Sonnet

  • 提示词:使用提供的笑话创作提示词
  • 测试结果:个人感觉Claude 4 Sonnet 生成的精彩,算中规中矩。

8. 爆款标题生成咪蒙风格标题吸睛,评分标题更实用

  • 原始标题Deepseek R1 发布了。
  • 测试一(咪蒙风格提示词)
    • “《今天起,所有ChatGPT用户都可能被这个中国AI杀死!》”
    • “《128K上下文+完全免费!这枚国产核弹炸穿了所有AI的智商底线》”
    • “《程序员集体失业夜:Deepseek R1让写代码成了认字游戏》”
  • 测试二(评分标题提示词)
    • ⭐️ (9.0分) 重磅发布!DeepSeek-R1 128K上下文,打工人速领!
    • ⭐️ (8.8分) DeepSeek R1 突然上线:免费开放,性能如何?
    • ⭐️ (8.5分) 【国产大模型新星】DeepSeek R1 正式登场,128K上下文解读

总结Deepseek R1 的优缺点有哪些?

总体来说,Deepseek R1 在一些方面带来了惊喜,但也存在一些遗憾。在部分游戏可玩性和交互性上,仍有进步空间。作为国产大模型Deepseek 表现出色,且团队行事风格低调。然而,目前模型并非多模态,限制了一些应用场景。期待 Deepseek R2 的表现。

我认为:这 Deepseek R1 的测试,正如一场百戏,锣鼓喧天,却也难掩几分尴尬。有的节目,碰撞出火花,引人喝彩;有的节目,却只落得个冷场。然而,即便如此,我们也不能妄自菲薄,毕竟,敢于亮剑,方能进步。期待 Deepseek R2 能够带来更多的惊喜,少一些遗憾,让国产大模型在世界的舞台上,发出更响亮的声音!

© 版权声明
chatgpt4.0

相关文章

error: Content is protected !!