DeepSeek全尺寸模型上线阿里云百炼!

简介: 阿里云百炼平台近日上线了DeepSeek-V3、DeepSeek-R1及其蒸馏版本等六款全尺寸AI模型,参数量达671B,提供高达100万免费tokens。这些模型在数学、代码、自然语言推理等任务上表现出色,支持灵活调用和经济高效的解决方案,助力开发者和企业加速创新与数字化转型。示例代码展示了如何通过API使用DeepSeek-R1模型进行推理,用户可轻松获取思考过程和最终答案。

引言

在当今快速发展的科技领域,人工智能作为创新的前沿,正不断推动着各行各业的变革与进步。2025年伊始,一场关于智能模型的革命悄然展开,为数据科学家、开发者以及企业带来了前所未有的机遇。就在2月9日,阿里云宣布了一个重磅消息:阿里云百炼平台全面上线DeepSeek-V3、DeepSeek-R1及其蒸馏版本DeepSeek-R1-Distill-Qwen-32B等六款全尺寸模型。这一举措不仅标志着AI技术的新里程碑,也为广大用户提供了更加灵活和经济高效的解决方案。

随着数字化转型加速,企业和个人对高效能、低成本的人工智能服务需求日益增长。此次阿里云推出的DeepSeek系列模型,正是为了满足市场对于先进算法和技术能力的需求。其中,DeepSeek-V3和DeepSeek-R1满血版各自提供了高达100万免费tokens的使用额度,而其蒸馏版本则以极具竞争力的价格——仅需1元即可享受最高200万tokens的服务。这无疑为广大开发者和中小企业提供了一个强大的工具箱,使得他们能够更轻松地探索AI领域的无限可能。

DeepSeek全尺寸模型上线阿里云百炼

百炼提供了 DeepSeek 模型调用的 API ,其中 deepseek-r1 与 deepseek-v3 分别有 100万的免费 Token,部分蒸馏模型限时免费体验。

image.png
image.png

DeepSeek-R1 模型包含 671B 参数,激活 37B,在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力,尤其在数学、代码、自然语言推理等任务上。

DeepSeek-V3 为DeepSeek自研的 MoE 模型,671B 参数,激活 37B,在 14.8T Token 上进行了预训练,在长文本、代码、数学、百科、中文能力上表现优秀。

DeepSeek-R1-Distill 系列模型是基于知识蒸馏技术,通过使用 DeepSeek-R1 生成的训练样本对 Qwen、Llama 等开源大模型进行微调训练后,所得到的增强型模型。

image.png

快速开始

API 使用前提:已获取API Key并完成配置API Key到环境变量。如果通过SDK调用,还需要安装OpenAI SDK。对于 DeepSeek-R1 类模型,思考过程会通过reasoning_content字段返回,最终回复会通过content字段返回。

示例代码

import os
from openai import OpenAI

client = OpenAI(
    # 若没有配置环境变量,请用百炼API Key将下行替换为:api_key="sk-xxx",
    api_key=os.getenv("DASHSCOPE_API_KEY"), # 如何获取API Key:https://help.aliyun.com/zh/model-studio/developer-reference/get-api-key
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
    model="deepseek-r1",  # 此处以 deepseek-r1 为例,可按需更换模型名称。
    messages=[
        {
   'role': 'user', 'content': '9.9和9.11谁大'}
        ]
)

# 通过reasoning_content字段打印思考过程
print("思考过程:")
print(completion.choices[0].message.reasoning_content)
# 通过content字段打印最终答案
print("最终答案:")
print(completion.choices[0].message.content)

返回结果

思考过程:

嗯,用户问的是9.99.11谁大。首先,我需要确认这两个数字的数值到底是多少。表面上看起来都是小数,但可能用户有不同的表示方式需要注意。

首先,9.9应该就是平常的小数,也就是99/10,等于9.9。而9.11可能有两种解读:一种是直接的小数,即911/100,也就是9.11;另一种可能是版本号或者某种编号,比如软件版本中的9.99.11,这时候可能需要按顺序比较,比如9.9之后是9.10,再是9.11,所以9.11会比9.9大。不过通常情况下,数学问题中的数字还是按照数值来比较的,所以应该排除版本号的解释,直接比较数值大小。

不过用户的问题可能是在数学比较,所以接下来要确认两个数的数值大小。首先,比较整数部分,都是9,所以整数部分相同。接下来比较小数部分。对于9.9来说,小数部分是0.9,而9.11的小数部分是0.11。这时候可能会有人误以为0.90.11小,因为911小,但其实是错误的,因为小数位数不同。正确的做法应该是将两个数的小数部分对齐位数来比较,或者把两个数都转换成相同位数的小数。

比如,把9.9写成9.90,这样和9.11的两位小数对齐。现在比较0.900.11,显然0.90大于0.11,所以9.90(即9.9)大于9.11。因此,正确的结论应该是9.99.11大。

不过可能用户会有其他考虑,比如如果9.11代表的是某种特殊单位,比如时间的话,9小时11分钟和9小时9分钟,这时候9小时11分钟更长。但问题中没有提到单位,所以应该按纯数字比较。

另外,也有可能用户是在混淆小数点和分隔符,比如有些国家用逗号作为小数点,而点作为千位分隔符,但题目中的数字显然是小数的写法,因此不需要考虑这种情况。

还有一种可能,用户的小数点后面是两位数和三位数,比如9.9其实是9.900,而9.119.110,这时候比较的话依然是9.900更大。但无论怎样,只要对齐小数位数,都是9.9更大。

总结一下,正确的数值比较中,9.9等于9.90,而9.11等于9.11,所以9.90大于9.11,也就是9.9大于9.11。不过为了避免混淆,可能用户需要更详细的步骤解释。

最终答案:
9.99.11大。

**详细比较步骤:**

1. **统一小数位数**:将9.9写成9.90,使其与9.11的小数位数一致。
2. **逐位比较**- **整数部分**:两者均为9,相等。
   - **小数部分**:比较0.909.9的小数部分)和0.119.11的小数部分)。由于0.90 > 0.11,因此9.90 > 9.11**结论**9.9的数值大于9.11。

若涉及版本号(如软件版本),通常按顺序排列为9.99.109.11,此时9.11较新。但按纯数学数值比较,9.9更大。

注意事项

  • 稳定性:如果执行后没有响应、响应超时或者报错An internal error has occured, please try again later or contact service support,请尝试重试或者更换其他DeepSeek模型,也可以尝试使用Qwen最新模型qwen-max-2025-01-25。

  • 输入输出参数:关于API的输入输出参数,请参见DeepSeek的对话文档。

  • DeepSeek-R1:上述代码以 deepseek-r1 为例,DeepSeek-R1 模型不支持 Function Call、JSON Output 等功能,具体请参见DeepSeek的推理模型文档。

  • DeepSeek-V3:DeepSeek-V3暂未支持Function Call,敬请关注后续动态。

  • 我的应用和模型在线体验:暂未支持DeepSeek模型,敬请关注后续动态。

相关文章
人工智能
1545 0
|
Java 数据处理
阿里云百炼工作流支持多模型协同标注,三模型投票分类用户意图实战
本文介绍了一种基于多模型协作的高效分类工作流方案,用于解决传统标注工作中人力依赖大、易出错的问题。通过通义千问系列的 Qwen-Plus、Qwen-Max 和 Qwen3-30b-a3b 三大模型,结合投票机制,实现售前售后意图识别的精准分类。文中详细讲解了如何在阿里云百炼应用广场创建任务型工作流,包括模型节点配置、条件判断设置及测试发布全流程。此外,还提供了批量打标的 Java 示例代码,适用于更复杂的意图标注场景。跟随文章步骤,即可快速构建高效率、高准确性的分类系统。
1987 0
|
7月前
|
JSON 数据格式
本地部署的qwen3-8b模型和百炼上的qwen3-8b模型效果不一致
我在使用Function Call时发现,百炼平台上的Qwen3-8B模型与本地部署的Qwen3-8B模型效果存在差异,主要体现在函数参数生成上,本地模型常出现漏参或JSON格式错误,而百炼模型表现正常。想确认百炼平台的Qwen3-8B是否为更高版本?
1560 1
|
10月前
|
机器学习/深度学习 人工智能 NoSQL
JAVA接入DeepSeek大模型接口开发---阿里云的百炼模型
随着大模型的越来越盛行,现在很多企业开始接入大模型的接口,今天我从java开发角度来写一个demo的示例,用于接入DeepSeek大模型,国内的大模型有很多的接入渠道,今天主要介绍下阿里云的百炼模型,因为这个模型是免费的,只要注册一个账户,就会免费送百万的token进行学习,今天就从一个简单的可以执行的示例开始进行介绍,希望可以分享给各位正在学习的同学们。
1854 3
JAVA接入DeepSeek大模型接口开发---阿里云的百炼模型
|
10月前
|
人工智能 负载均衡 数据可视化
评测|零门槛,即刻拥有DeepSeek-R1满血版 | 阿里云百炼调用DeepSeek
本方案以 DeepSeek-R1 满血版为例进行演示,通过百炼模型服务进行 DeepSeek 开源模型调用,可以根据实际需求选择其他参数规模的 DeepSeek 模型。
230 0
|
10月前
|
人工智能 JavaScript 前端开发
【最佳实践系列】AI程序员让我变成全栈:基于阿里云百炼DeepSeek的跨语言公告系统实战
本文介绍了如何在Java开发中通过跨语言编程,利用阿里云百炼服务平台的DeepSeek大模型生成公告内容,并将其嵌入前端页面。
669 10
|
机器学习/深度学习 人工智能 测试技术
阿里云百炼已上线超强推理开源模型QwQ-32B,尺寸更小,性能比肩DeepSeek满血版
通义千问团队推出了320亿参数的QwQ-32B模型,通过大规模强化学习和多阶段训练,在数学、编程及通用能力上达到或超越了DeepSeek-R1等先进模型。QwQ-32B模型已在阿里云百炼上线,支持API调用,用户可通过官方文档了解详细使用方法。未来,团队将继续探索智能体与RL集成,推动人工通用智能的发展。
9433 0
|
10月前
|
弹性计算 API Docker
在ECS上使用百炼部署满血版DeepSeek R1
本文为您介绍如何在ECS实例上部署Open WebUI,并通过大模型服务平台百炼API调用DeepSeek-R1模型推理服务。帮助您快速体验满血版DeepSeek-R1模型。

相关产品

  • 大模型服务平台百炼