DeepSeek 挑战 "弱智吧"笑话 与 阿里云基础设施设计

简介: DeepSeek-R1是一款专注于提升推理能力的人工智能模型,它在数学运算、代码辅助以及自然语言处理等复杂任务中展现了卓越的表现。这款模型的一个显著特点是其通过强化学习技术进行优化,这使得它在解决需要深度逻辑推理的任务时尤为出色。用户体验方面,DeepSeek-R1不仅能够快速准确地解答复杂的问题,还能生成连贯且语法正确的文本内容,适用于多种风格的写作需求。此外,该模型还特别强调了其在提供详细推理过程上的能力,这意味着用户不仅能获得答案,还能了解得出结论的具体思考路径,这一点对于专业领域尤为重要
  1. 部署

调用百炼 API 或在云端部署 DeepSeek 模型, 方案详情可以访问https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms

这个方案拿DeepSeek-R1的完整版来举个例子。通过阿里云的百炼平台,我们可以轻松调用DeepSeek的各种开源模型,要是有别的参数规模的需求,也能灵活选择不同的DeepSeek模型版本。百炼提供的API接口都是标准化的,所以大家完全不需要自己动手搭建那些复杂的模型服务环境。而且这个平台自带负载均衡和自动伸缩的功能,这样就能确保在使用API的时候特别稳定。
Chatbox是一种可视化界面工具。有了它,只需要动动鼠标,在图形界面上点一点,就能快速配置好你的DeepSeek模型,马上开始使用。

访问百炼的市场
https://bailian.console.aliyun.com/#/model-market/detail/deepseek-r1
可以看到该模型拥有专属的免费额度为1000000,且此免费额度的有效期至2025年7月26日。
image.png

模型的细分能力即收费规则如下:
image.png
此外, 百炼平台也提供了一些API调用的样例:
包括基础聊天,多轮对话,流式输出, 可以轻松的接入已有的应用

在百炼api控制台(https://bailian.console.aliyun.com/?apiKey=1#/api-key) 开通对应的API

点击查看后, 即可复制 以 "sk-" 开头的API key

访问chatbox, 在线版
https://web.chatboxai.app/
如果界面是英文, 可以选择setting display language切换成中文

image.png
回到"模型"tab, 按照表格进行配置。
image.png

image.png

上下文的消息数量上限,Temperature,Top P按照场景填写, 可以保持原样
这里简单说明下这些参数:
• 上下文的消息数量上限 控制模型可以处理的输入序列长度,影响生成文本的上下文相关性和计算效率。
• Temperature 调整生成文本的随机性和多样性,影响文本的创新性和连贯性。
• Top P 通过选择累积概率达到设定阈值的词来平衡生成文本的质量和多样性,避免极端情况。
image.png

点击"保存"

  1. 体验感受:

深度思考能力非常强,但是在某些非常简单的场景默认开启深度思考, 可能反而拖累运行速度
image.png
包括思考时会默认采用英文, 但是也可以使用提示词来让DS使用中文思考
image.png

说起AI的思考能力, 可能正常的问题没法很好的区分出AI的真实水平,那我们不如采用"RZB"笑话来判断AI的分析能力
例如问题:
黄牛为什么不炒人民币
image.png

可以看到, deepseek-r1 还是在一本正经的回答问题, 那么我们启发他一下:
这是一个笑话, 分析一下笑点

image.png
image.png

可以看到deepseek 非常快的适应了节奏, 细致的分析了笑话的笑点,并且学会了举一反三, 这是非常惊艳的

不开玩笑,回归本质, 我们来看看deepseek 对一些正经的问题, 表现的怎么样:
帮我设计一套架构, 尽可能的使用阿里云的基础设施, 需求是: 用户上传头像图片, 能够自动的裁剪成不同的格式并且保存, 提供给用户使用, 帮我设计一个全球化, 高可用, 低延迟,安全,的架构
image.png
image.png
image.png
image.png
image.png
image.png

不出意外, 表现依然非常优秀.
3.总结:
DeepSeek-R1是一款专注于提升推理能力的人工智能模型,它在数学运算、代码辅助以及自然语言处理等复杂任务中展现了卓越的表现。这款模型的一个显著特点是其通过强化学习技术进行优化,这使得它在解决需要深度逻辑推理的任务时尤为出色。
用户体验方面,DeepSeek-R1不仅能够快速准确地解答复杂的问题,还能生成连贯且语法正确的文本内容,适用于多种风格的写作需求。此外,该模型还特别强调了其在提供详细推理过程上的能力,这意味着用户不仅能获得答案,还能了解得出结论的具体思考路径,这一点对于专业领域尤为重要

相关文章
|
1月前
|
人工智能 自然语言处理 算法
DeepSeek:国产AI新势力,普通人如何用它赚钱?
DeepSeek 是一款由中国团队开发的大型语言模型,以其强大的自然语言处理能力迅速崛起,成为ChatGPT等国外大模型的强劲对手。它支持智能写作、代码生成、内容创作等多种功能,广泛应用于自媒体、编程、商业分析等领域。DeepSeek不仅免费且部分开源,用户可以直接访问官网体验,无需科学上网。其长文本处理能力和编程辅助功能尤为突出,适合长文写作和代码优化。DeepSeek还提供了多种变现途径,如自媒体写作、AI编程服务、课程咨询等,帮助用户在AI时代创造额外收入。掌握DeepSeek,开启AI变现之旅! 注:关注微信公众号“飞川”,发送“deepseek”获取丰富的资料包。
343 73
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
企业内训|DeepSeek技术革命、算力范式重构与场景落地洞察-某头部券商
3月19日北京,TsingtaoAI公司负责人汶生受邀为某证券公司管理层和投资者举办专题培训,围绕《DeepSeek技术革命、算力范式重构与场景落地洞察》主题,系统阐述了当前AI技术演进的核心趋势、算力需求的结构性变革,以及行业应用落地的关键路径。此次分享会基于DeepSeek开源大模型的技术突破与昇腾国产算力生态的实践,为从业者提供了深刻的行业洞察。
27 3
|
1月前
|
机器学习/深度学习 缓存 自然语言处理
DeepSeek背后的技术基石:DeepSeekMoE基于专家混合系统的大规模语言模型架构
DeepSeekMoE是一种创新的大规模语言模型架构,融合了专家混合系统(MoE)、多头潜在注意力机制(MLA)和RMSNorm归一化。通过专家共享、动态路由和潜在变量缓存技术,DeepSeekMoE在保持性能的同时,将计算开销降低了40%,显著提升了训练和推理效率。该模型在语言建模、机器翻译和长文本处理等任务中表现出色,具备广泛的应用前景,特别是在计算资源受限的场景下。
586 29
DeepSeek背后的技术基石:DeepSeekMoE基于专家混合系统的大规模语言模型架构
|
1月前
|
人工智能 算法 调度
DeepSeek杀疯了!国产AI大模型如何重构未来技术版图?
【爆款导读】当ChatGPT还在为每月10亿访问量沾沾自喜时,中国AI军团已悄然完成弯道超车。2025年开年,DeepSeek以雷霆之势横扫中美应用商店双榜,上线72小时突破千万DAU,开发者生态激增300%。通过优化算法降低成本、多模态能力提升效率,DeepSeek不仅在用户数量上取得突破,更在实际应用场景中展现强大实力。其开源策略推动技术民主化,助力更多开发者参与AI开发,成为AI军备竞赛中的佼佼者。
232 20
|
1月前
|
人工智能 运维 Kubernetes
大模型进化论:AI如何颠覆系统优化?
大模型进化论:AI如何颠覆系统优化?
41 10
|
26天前
|
人工智能
一图看懂| 2024AI云重点产品技术升级
一图看懂| 2024AI云重点产品技术升级
|
1月前
|
机器学习/深度学习 人工智能 算法
DeepSeek:掀翻互联网底层的“东方神秘力量” ——当AI大模型成为网络世界的“基建狂魔”
DeepSeek正重构网络底层逻辑,从“哑管道”到“认知神经”,赋予网络思考能力。它通过意图驱动和认知架构,优化带宽资源,提升效率。技术上,MOE+MLA架构与FP8精度训练大幅降低成本,性能超越传统模型。产业链方面,通信巨头转型为“AI驯兽师”,推出智能预测、定制化网络等服务。然而,AI基建也面临安全挑战,如僵尸网络攻击和隐私问题。展望6G,AGI将成新“网络原住民”,带来更智能的服务。这场变革不仅提升了连接效率,还创造了更多价值。
|
1月前
|
机器学习/深度学习 人工智能 机器人
AI成本革命:DeepSeek-R1与OpenAI的颠覆性突破重构企业智能新范式
AI成本革命:DeepSeek-R1与OpenAI的颠覆性突破重构企业智能新范式
|
5月前
|
机器学习/深度学习 存储 人工智能
用60%成本干80%的事,DeepSeek分享沉淀多年的高性能深度学习架构
【10月更文挑战第2天】近年来,深度学习(DL)与大型语言模型(LLMs)的发展推动了AI的进步,但也带来了计算资源的极大需求。为此,DeepSeek团队提出了Fire-Flyer AI-HPC架构,通过创新的软硬件协同设计,利用10,000个PCIe A100 GPU,实现了高性能且低成本的深度学习训练。相比NVIDIA的DGX-A100,其成本减半,能耗降低40%,并在网络设计、通信优化、并行计算和文件系统等方面进行了全面优化,确保系统的高效与稳定。[论文地址](https://arxiv.org/pdf/2408.14158)
450 4
|
9月前
|
人工智能 JavaScript 测试技术
《AIGC+软件开发新范式》--10.阿里云参编业内首个代码大模型标准,通义灵码获 2023 AI4SE “银弹” 案例
在AI 热度持续上升的当下,阿里云推出AI智能编码助手—通义灵码。通义灵码是一款基于阿里云通义代码大模型打造的智能编码助手,基于海量优秀开源代数据集和编程教科书训练,为开发者带来高效、流畅的编码体验。
294 2