1341114158554635_个人页

1341114158554635
个人头像照片
0
1
0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2025年02月

正在加载, 请稍后...
暂无更多信息
  • 回答了问题 2025-02-27

    DeepSeek 爆火,你认为 DeepSeek 会成为2025年开发者必备的神器吗?

    个人真诚回答,无客套。问题1: 阿里宣传的是百万Tokens,但是实际是1千万Tokens.足够使用很久。这个希望宣传的时候改一下。我还特地数了好多0.其他的模型确实都是一百万,r1是1千万,我不知道是不是故意设置的。 使用过程是用api访问,cherry studio 直接调用r1或v3模型或千问的其他模型。整体表现尚可。 但是输出会比较慢,有的时候会卡在一个地方,过一段时间之后又继续输出。api使用tokens无法直观的查看。在模型观察页面,只有调用次数和延迟等不是很关键的参数,我个人觉得tokens最重要。建议放在汇总页面。费用计算,建议以百万为单位计算,或者可切换的方式去简单的进行显示。如果0数多了,没有一个明确的概念,反而容易增加很多第一感觉很不专业的样子。尝试过自己部署,但综合电费等损耗来讲,还不如直接用api访问来的直接。 问题2: 先给个肯定回答:DeepSeek肯定会成为开发者的必备的神器。为什么?加了思维模型以及RL训练。从R1出来之后基本上所有的模型都追加了Think类型,并且基本都免费了。用户能使用到近乎免费并且高性能高准确性的AI。同时,它仿佛可以补充人们思维的过程一样。可以在从思维的过程中用户也是可以查看到很多知识,并补齐自己的思考。实现用户和AI的协调进步。R1出来已经1个多月了,按照每1个月DeepSeek基本会搞个大动作的节奏,从V3到R1,从R1到本月的分享周,估计DeepSeek-R2会在3月底也就是4月之前与大家见面。甚至在年前可能迭代出DeepSeek-R3版本,想想都非常可怕。当然现在竞争也很激烈。腾讯在社交上发力,绑定DeepSeek。阿里在基础模型千问系列发力,字节在豆包和火山引擎上推广比较大。开发上来说,嵌入代码部分,如果没有特别强大的模型,可能像通义灵码,MarsCode等等与编码相关的都会使用到DeepSeek。个人觉得还是很好的,并且会一直使用。 后续建议: 希望阿里能继续,当然让模型能更好一些是很好的。目前主要是用这个。每个人的精力是有限的,在寻求知识方面或者工程方面,谁准确肯定是绝大部分优先用谁的,目前DeepSeek是这样的。按照如今的趋势,之后应该也是这样的。
    踩0 评论0
正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息