DeepSeek 爆火,你认为 DeepSeek 会成为2025年开发者必备的神器吗?
个人真诚回答,无客套。问题1:
阿里宣传的是百万Tokens,但是实际是1千万Tokens.足够使用很久。这个希望宣传的时候改一下。我还特地数了好多0.其他的模型确实都是一百万,r1是1千万,我不知道是不是故意设置的。 使用过程是用api访问,cherry studio 直接调用r1或v3模型或千问的其他模型。整体表现尚可。 但是输出会比较慢,有的时候会卡在一个地方,过一段时间之后又继续输出。api使用tokens无法直观的查看。在模型观察页面,只有调用次数和延迟等不是很关键的参数,我个人觉得tokens最重要。建议放在汇总页面。费用计算,建议以百万为单位计算,或者可切换的方式去简单的进行显示。如果0数多了,没有一个明确的概念,反而容易增加很多第一感觉很不专业的样子。尝试过自己部署,但综合电费等损耗来讲,还不如直接用api访问来的直接。
问题2:
先给个肯定回答:DeepSeek肯定会成为开发者的必备的神器。为什么?加了思维模型以及RL训练。从R1出来之后基本上所有的模型都追加了Think类型,并且基本都免费了。用户能使用到近乎免费并且高性能高准确性的AI。同时,它仿佛可以补充人们思维的过程一样。可以在从思维的过程中用户也是可以查看到很多知识,并补齐自己的思考。实现用户和AI的协调进步。R1出来已经1个多月了,按照每1个月DeepSeek基本会搞个大动作的节奏,从V3到R1,从R1到本月的分享周,估计DeepSeek-R2会在3月底也就是4月之前与大家见面。甚至在年前可能迭代出DeepSeek-R3版本,想想都非常可怕。当然现在竞争也很激烈。腾讯在社交上发力,绑定DeepSeek。阿里在基础模型千问系列发力,字节在豆包和火山引擎上推广比较大。开发上来说,嵌入代码部分,如果没有特别强大的模型,可能像通义灵码,MarsCode等等与编码相关的都会使用到DeepSeek。个人觉得还是很好的,并且会一直使用。
后续建议:
希望阿里能继续,当然让模型能更好一些是很好的。目前主要是用这个。每个人的精力是有限的,在寻求知识方面或者工程方面,谁准确肯定是绝大部分优先用谁的,目前DeepSeek是这样的。按照如今的趋势,之后应该也是这样的。
赞37
踩0