
昨天下午下班后,DeepSeek R1更新了
但是,他们已悄悄地将此消息发布给微信集团。
说这是一个小版本,可以尝试升级
因此,我开始了这些曲折,并以强烈的好奇心进行了检查。
心情真的上升了
我最初尝试了一些情况,包括写作,代码和数学。
我首先觉得效果实际上得到了改善,并且该学位比该官员高一些,但是顶部Claude4模型仍然存在明显的差距。
例如,用于城市智能运输的视觉跟踪平台由测试生成的大数据
左侧是DeepSeek R1的新版本,右侧是Claude4
例如,以下是气候变化数据审查平台
左侧是右iSclaude的新版本DeepSeek R14
显然还有一个明显的差距?此外,Claude生成的网页实际上具有数据交互并会更改。几乎没有新的DeepSeek R1的版本
当时,我看到许多其他博客作者发表的文章正在吹些淡淡的发现,我觉得他们正在爆炸吗?
测量后,我意识到出了问题。 DeepSeek R1是推理的模型。我不应该像Claude4这样的复杂单词提示!
例如,以下
该死的!我只是记得DeepSeek R1不需要结构化和复杂的单词。
可以用简单的句子完成
所以我立即改变了单词,逃离了以前的情况
足够了,这一代人的影响是合格的跳跃〜
例如,下面的天气数据评估平台可以通过伊桑句子解决
豆Ako。这个直接词很复杂,因为它限制了R1的性能。将其更改为句子后,效果将大大改善。
为了防止这种情况发生,我去了城市智能流量大数据可视监视平台的情况,或者只有一个句子
比较这一代的先前效果,该级别和美学立即得到改善
并创建一个大鱼吃小鱼的游戏也有点捏。
直接词是同一句话
请为我构建一个简单但有趣的“大鱼吃小鱼” HTML5网络游戏
我最近一直在使用Gemini2.5 Pro和Claude4。我已经很长时间没有使用DeepSeek R1,所以我忘记了这个即时R1单词的平等。
很酷,可以与结婚P一起做这件事。如果您说太多,它将限制其性能。
对于大多数普通百姓来说,这是一个福音。
尽管这是一个句子,但您应该尝试清楚地表达您的需求
在实际测试之后,我的结论是,代码能力得到了极大的提高,实际上并不小于Claude4。它可能相对较短,但非常接近。
最有可能的是,这将是在R1和V3的0324的EEK-V3-0324代码的Marchang代码中进行的,因此代码和AES新版本的R1的增强非常明显。
我的写作能力感觉略有提高,而且我的数学能力似乎还不清楚,因为我给了一些我以前已经测试过的困难奥运会数学问题,但是很长一段时间后,我仍然没有给出正确的答案。老实说,说实话,将推理模型与男人的基本模型Claude4真正丢失了...
但是我相信DeepSeek将尽快创造出更多的荣耀,因此请等待R2〜的到来
最后,以上仅代表个人意见。如果有任何错误,请随时在评论部分中纠正它。
深夜创建并不容易,所以我给您免费的三场支持〜谢谢
战斗眼睑,睡眠,晚安
结尾
金融的官方帐户
24小时广播滚动滚动最新的财务和视频信息,并扫描QR码以供更多粉丝遵循(Sinafinance)