DeepSeek 挑战 "弱智吧"笑话 与 阿里云基础设施设计

简介: DeepSeek-R1是一款专注于提升推理能力的人工智能模型,它在数学运算、代码辅助以及自然语言处理等复杂任务中展现了卓越的表现。这款模型的一个显著特点是其通过强化学习技术进行优化,这使得它在解决需要深度逻辑推理的任务时尤为出色。用户体验方面,DeepSeek-R1不仅能够快速准确地解答复杂的问题,还能生成连贯且语法正确的文本内容,适用于多种风格的写作需求。此外,该模型还特别强调了其在提供详细推理过程上的能力,这意味着用户不仅能获得答案,还能了解得出结论的具体思考路径,这一点对于专业领域尤为重要
  1. 部署

调用百炼 API 或在云端部署 DeepSeek 模型, 方案详情可以访问https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms

这个方案拿DeepSeek-R1的完整版来举个例子。通过阿里云的百炼平台,我们可以轻松调用DeepSeek的各种开源模型,要是有别的参数规模的需求,也能灵活选择不同的DeepSeek模型版本。百炼提供的API接口都是标准化的,所以大家完全不需要自己动手搭建那些复杂的模型服务环境。而且这个平台自带负载均衡和自动伸缩的功能,这样就能确保在使用API的时候特别稳定。
Chatbox是一种可视化界面工具。有了它,只需要动动鼠标,在图形界面上点一点,就能快速配置好你的DeepSeek模型,马上开始使用。

访问百炼的市场
https://bailian.console.aliyun.com/#/model-market/detail/deepseek-r1
可以看到该模型拥有专属的免费额度为1000000,且此免费额度的有效期至2025年7月26日。
image.png

模型的细分能力即收费规则如下:
image.png
此外, 百炼平台也提供了一些API调用的样例:
包括基础聊天,多轮对话,流式输出, 可以轻松的接入已有的应用

在百炼api控制台(https://bailian.console.aliyun.com/?apiKey=1#/api-key) 开通对应的API

点击查看后, 即可复制 以 "sk-" 开头的API key

访问chatbox, 在线版
https://web.chatboxai.app/
如果界面是英文, 可以选择setting display language切换成中文

image.png
回到"模型"tab, 按照表格进行配置。
image.png

image.png

上下文的消息数量上限,Temperature,Top P按照场景填写, 可以保持原样
这里简单说明下这些参数:
• 上下文的消息数量上限 控制模型可以处理的输入序列长度,影响生成文本的上下文相关性和计算效率。
• Temperature 调整生成文本的随机性和多样性,影响文本的创新性和连贯性。
• Top P 通过选择累积概率达到设定阈值的词来平衡生成文本的质量和多样性,避免极端情况。
image.png

点击"保存"

  1. 体验感受:

深度思考能力非常强,但是在某些非常简单的场景默认开启深度思考, 可能反而拖累运行速度
image.png
包括思考时会默认采用英文, 但是也可以使用提示词来让DS使用中文思考
image.png

说起AI的思考能力, 可能正常的问题没法很好的区分出AI的真实水平,那我们不如采用"RZB"笑话来判断AI的分析能力
例如问题:
黄牛为什么不炒人民币
image.png

可以看到, deepseek-r1 还是在一本正经的回答问题, 那么我们启发他一下:
这是一个笑话, 分析一下笑点

image.png
image.png

可以看到deepseek 非常快的适应了节奏, 细致的分析了笑话的笑点,并且学会了举一反三, 这是非常惊艳的

不开玩笑,回归本质, 我们来看看deepseek 对一些正经的问题, 表现的怎么样:
帮我设计一套架构, 尽可能的使用阿里云的基础设施, 需求是: 用户上传头像图片, 能够自动的裁剪成不同的格式并且保存, 提供给用户使用, 帮我设计一个全球化, 高可用, 低延迟,安全,的架构
image.png
image.png
image.png
image.png
image.png
image.png

不出意外, 表现依然非常优秀.
3.总结:
DeepSeek-R1是一款专注于提升推理能力的人工智能模型,它在数学运算、代码辅助以及自然语言处理等复杂任务中展现了卓越的表现。这款模型的一个显著特点是其通过强化学习技术进行优化,这使得它在解决需要深度逻辑推理的任务时尤为出色。
用户体验方面,DeepSeek-R1不仅能够快速准确地解答复杂的问题,还能生成连贯且语法正确的文本内容,适用于多种风格的写作需求。此外,该模型还特别强调了其在提供详细推理过程上的能力,这意味着用户不仅能获得答案,还能了解得出结论的具体思考路径,这一点对于专业领域尤为重要

目录
打赏
0
7
9
0
9
分享
相关文章
企业内训|DeepSeek技术革命、算力范式重构与场景落地洞察-某头部券商
3月19日北京,TsingtaoAI公司负责人汶生受邀为某证券公司管理层和投资者举办专题培训,围绕《DeepSeek技术革命、算力范式重构与场景落地洞察》主题,系统阐述了当前AI技术演进的核心趋势、算力需求的结构性变革,以及行业应用落地的关键路径。此次分享会基于DeepSeek开源大模型的技术突破与昇腾国产算力生态的实践,为从业者提供了深刻的行业洞察。
29 3
DeepSeek背后的技术基石:DeepSeekMoE基于专家混合系统的大规模语言模型架构
DeepSeekMoE是一种创新的大规模语言模型架构,融合了专家混合系统(MoE)、多头潜在注意力机制(MLA)和RMSNorm归一化。通过专家共享、动态路由和潜在变量缓存技术,DeepSeekMoE在保持性能的同时,将计算开销降低了40%,显著提升了训练和推理效率。该模型在语言建模、机器翻译和长文本处理等任务中表现出色,具备广泛的应用前景,特别是在计算资源受限的场景下。
590 29
DeepSeek背后的技术基石:DeepSeekMoE基于专家混合系统的大规模语言模型架构
DeepSeek 实践应用解析:合力亿捷智能客服迈向 “真智能” 时代
DeepSeek作为人工智能领域的创新翘楚,凭借领先的技术实力,在智能客服领域掀起变革。通过全渠道智能辅助、精准对话管理、多语言交互、智能工单处理、个性化推荐、情绪分析及反馈监控等功能,大幅提升客户服务效率和质量,助力企业实现卓越升级,推动智能化服务发展。
83 1
阿里云设计中心携手金鸡电影节青年创作人,用AI技术加速电影工业升级
阿里云设计中心携手金鸡电影节青年创作人,用AI技术加速电影工业升级
全网招募 100 位 AI 程序员体验官,感受 DeepSeek 加持下智能编码
通义灵码联合阿里云开发者社区,全网寻找 100 位 AI 程序员体验官,感受 AI 程序员和满血版 Deepseek 加持下的智能编码新功能,体验需求开发、跨语言编程、单元测试自动生成、图生代码等 AI 程序员能力,领取 Cherry 机械键盘、智能手环等奖品。
DeepSeek:掀翻互联网底层的“东方神秘力量” ——当AI大模型成为网络世界的“基建狂魔”
DeepSeek正重构网络底层逻辑,从“哑管道”到“认知神经”,赋予网络思考能力。它通过意图驱动和认知架构,优化带宽资源,提升效率。技术上,MOE+MLA架构与FP8精度训练大幅降低成本,性能超越传统模型。产业链方面,通信巨头转型为“AI驯兽师”,推出智能预测、定制化网络等服务。然而,AI基建也面临安全挑战,如僵尸网络攻击和隐私问题。展望6G,AGI将成新“网络原住民”,带来更智能的服务。这场变革不仅提升了连接效率,还创造了更多价值。
一文彻底拿下,赶紧本地部署DeepSeek体验一下最牛的大模型
本文介绍如何本地化部署DeepSeek大模型(deepseek-r1)及open-webui的安装过程,包括命令行操作、版本兼容性处理等详细步骤。DeepSeek号称“国运级”大模型,性能媲美OpenAI,支持直接对话,降低使用门槛。通过本教程,读者可以快速上手体验这一强大的推理模型。
153 0
一文彻底拿下,赶紧本地部署DeepSeek体验一下最牛的大模型
阿里国际版o1来了,Marco-o1:聚焦开放式问题推理
阿里巴巴推出的国际版大型语言模型(LLM)——Marco-o1,基于OpenAI的o1模型,由多位专家研发。Marco-o1在开放式问题推理方面进行了优化,采用链式思维微调、蒙特卡洛树搜索、反思机制等技术,提升了数学、编程及翻译任务的表现。实验结果显示其在MGSM数据集上显著改进,但依然面临多语言处理和计算效率的挑战。
43 3
打通智能体自我进化全流程!复旦推出通用智能体平台AgentGym
【6月更文挑战第21天】复旦大学推出AgentGym平台,聚焦通用智能体的自我进化。该平台提供多样环境及任务,使用AgentEvol算法让智能体在学习中进化,提升泛化能力。实验显示智能体性能媲美先进模型,但计算效率和模型扩展性仍是挑战。平台强调伦理安全,推动智能体发展同时确保与人类价值观一致。[论文链接](https://arxiv.org/abs/2406.04151)
203 5
DeepSeek新作Janus:解耦视觉编码,引领多模态理解与生成统一新范式
DeepSeek-AI团队提出的Janus框架,通过解耦视觉编码,实现了多模态理解与生成的统一。该框架在多模态理解和生成任务上均表现出色,尤其在MMBench、SEED-Bench等多个基准测试中取得领先结果。Janus的设计提高了任务灵活性和可扩展性,但也面临计算成本和训练数据需求的挑战。
244 8