DeepSeek全尺寸模型上线阿里云百炼!

本文涉及的产品
通义法睿合同智能审查,1个月8份合同免费体验
简介: 阿里云百炼平台近日上线了DeepSeek-V3、DeepSeek-R1及其蒸馏版本等六款全尺寸AI模型,参数量达671B,提供高达100万免费tokens。这些模型在数学、代码、自然语言推理等任务上表现出色,支持灵活调用和经济高效的解决方案,助力开发者和企业加速创新与数字化转型。示例代码展示了如何通过API使用DeepSeek-R1模型进行推理,用户可轻松获取思考过程和最终答案。

引言

在当今快速发展的科技领域,人工智能作为创新的前沿,正不断推动着各行各业的变革与进步。2025年伊始,一场关于智能模型的革命悄然展开,为数据科学家、开发者以及企业带来了前所未有的机遇。就在2月9日,阿里云宣布了一个重磅消息:阿里云百炼平台全面上线DeepSeek-V3、DeepSeek-R1及其蒸馏版本DeepSeek-R1-Distill-Qwen-32B等六款全尺寸模型。这一举措不仅标志着AI技术的新里程碑,也为广大用户提供了更加灵活和经济高效的解决方案。

随着数字化转型加速,企业和个人对高效能、低成本的人工智能服务需求日益增长。此次阿里云推出的DeepSeek系列模型,正是为了满足市场对于先进算法和技术能力的需求。其中,DeepSeek-V3和DeepSeek-R1满血版各自提供了高达100万免费tokens的使用额度,而其蒸馏版本则以极具竞争力的价格——仅需1元即可享受最高200万tokens的服务。这无疑为广大开发者和中小企业提供了一个强大的工具箱,使得他们能够更轻松地探索AI领域的无限可能。

DeepSeek全尺寸模型上线阿里云百炼

百炼提供了 DeepSeek 模型调用的 API ,其中 deepseek-r1 与 deepseek-v3 分别有 100万的免费 Token,部分蒸馏模型限时免费体验。

image.png
image.png

DeepSeek-R1 模型包含 671B 参数,激活 37B,在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力,尤其在数学、代码、自然语言推理等任务上。

DeepSeek-V3 为DeepSeek自研的 MoE 模型,671B 参数,激活 37B,在 14.8T Token 上进行了预训练,在长文本、代码、数学、百科、中文能力上表现优秀。

DeepSeek-R1-Distill 系列模型是基于知识蒸馏技术,通过使用 DeepSeek-R1 生成的训练样本对 Qwen、Llama 等开源大模型进行微调训练后,所得到的增强型模型。

image.png

快速开始

API 使用前提:已获取API Key并完成配置API Key到环境变量。如果通过SDK调用,还需要安装OpenAI SDK。对于 DeepSeek-R1 类模型,思考过程会通过reasoning_content字段返回,最终回复会通过content字段返回。

示例代码

import os
from openai import OpenAI

client = OpenAI(
    # 若没有配置环境变量,请用百炼API Key将下行替换为:api_key="sk-xxx",
    api_key=os.getenv("DASHSCOPE_API_KEY"), # 如何获取API Key:https://help.aliyun.com/zh/model-studio/developer-reference/get-api-key
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
    model="deepseek-r1",  # 此处以 deepseek-r1 为例,可按需更换模型名称。
    messages=[
        {
   'role': 'user', 'content': '9.9和9.11谁大'}
        ]
)

# 通过reasoning_content字段打印思考过程
print("思考过程:")
print(completion.choices[0].message.reasoning_content)
# 通过content字段打印最终答案
print("最终答案:")
print(completion.choices[0].message.content)

返回结果

思考过程:

嗯,用户问的是9.99.11谁大。首先,我需要确认这两个数字的数值到底是多少。表面上看起来都是小数,但可能用户有不同的表示方式需要注意。

首先,9.9应该就是平常的小数,也就是99/10,等于9.9。而9.11可能有两种解读:一种是直接的小数,即911/100,也就是9.11;另一种可能是版本号或者某种编号,比如软件版本中的9.99.11,这时候可能需要按顺序比较,比如9.9之后是9.10,再是9.11,所以9.11会比9.9大。不过通常情况下,数学问题中的数字还是按照数值来比较的,所以应该排除版本号的解释,直接比较数值大小。

不过用户的问题可能是在数学比较,所以接下来要确认两个数的数值大小。首先,比较整数部分,都是9,所以整数部分相同。接下来比较小数部分。对于9.9来说,小数部分是0.9,而9.11的小数部分是0.11。这时候可能会有人误以为0.90.11小,因为911小,但其实是错误的,因为小数位数不同。正确的做法应该是将两个数的小数部分对齐位数来比较,或者把两个数都转换成相同位数的小数。

比如,把9.9写成9.90,这样和9.11的两位小数对齐。现在比较0.900.11,显然0.90大于0.11,所以9.90(即9.9)大于9.11。因此,正确的结论应该是9.99.11大。

不过可能用户会有其他考虑,比如如果9.11代表的是某种特殊单位,比如时间的话,9小时11分钟和9小时9分钟,这时候9小时11分钟更长。但问题中没有提到单位,所以应该按纯数字比较。

另外,也有可能用户是在混淆小数点和分隔符,比如有些国家用逗号作为小数点,而点作为千位分隔符,但题目中的数字显然是小数的写法,因此不需要考虑这种情况。

还有一种可能,用户的小数点后面是两位数和三位数,比如9.9其实是9.900,而9.119.110,这时候比较的话依然是9.900更大。但无论怎样,只要对齐小数位数,都是9.9更大。

总结一下,正确的数值比较中,9.9等于9.90,而9.11等于9.11,所以9.90大于9.11,也就是9.9大于9.11。不过为了避免混淆,可能用户需要更详细的步骤解释。

最终答案:
9.99.11大。

**详细比较步骤:**

1. **统一小数位数**:将9.9写成9.90,使其与9.11的小数位数一致。
2. **逐位比较**- **整数部分**:两者均为9,相等。
   - **小数部分**:比较0.909.9的小数部分)和0.119.11的小数部分)。由于0.90 > 0.11,因此9.90 > 9.11**结论**9.9的数值大于9.11。

若涉及版本号(如软件版本),通常按顺序排列为9.99.109.11,此时9.11较新。但按纯数学数值比较,9.9更大。

注意事项

  • 稳定性:如果执行后没有响应、响应超时或者报错An internal error has occured, please try again later or contact service support,请尝试重试或者更换其他DeepSeek模型,也可以尝试使用Qwen最新模型qwen-max-2025-01-25。

  • 输入输出参数:关于API的输入输出参数,请参见DeepSeek的对话文档。

  • DeepSeek-R1:上述代码以 deepseek-r1 为例,DeepSeek-R1 模型不支持 Function Call、JSON Output 等功能,具体请参见DeepSeek的推理模型文档。

  • DeepSeek-V3:DeepSeek-V3暂未支持Function Call,敬请关注后续动态。

  • 我的应用和模型在线体验:暂未支持DeepSeek模型,敬请关注后续动态。

相关实践学习
如何快速创建插件agent
阿里云百炼应用基于Assistant API技术架构,结合大语言模型(LLM)的推理、知识检索增强、插件调度等能力,构建应对各类复杂场景任务的场景应用。通过集成化、直观易用的产品界面,为开发者提供了丰富的应用配置选项,包括大型语言模型(LLM)选择、Pro
相关文章
|
23天前
|
人工智能 API
【保姆级教程]】5分钟用阿里云百炼满血版DeepSeek, 手把手做一个智能体
阿里云推出手把手学AI直播活动,带你体验DeepSeek玩法。通过阿里云百炼控制台,用户可免费开通满血版R1模型,享受100w token免费额度。活动还包括实验步骤、应用开发教程及作业打卡赢好礼环节,提交优秀作品更有机会获得定制礼品。快来参与吧!
|
2天前
|
机器学习/深度学习 人工智能 NoSQL
JAVA接入DeepSeek大模型接口开发---阿里云的百炼模型
随着大模型的越来越盛行,现在很多企业开始接入大模型的接口,今天我从java开发角度来写一个demo的示例,用于接入DeepSeek大模型,国内的大模型有很多的接入渠道,今天主要介绍下阿里云的百炼模型,因为这个模型是免费的,只要注册一个账户,就会免费送百万的token进行学习,今天就从一个简单的可以执行的示例开始进行介绍,希望可以分享给各位正在学习的同学们。
65 3
JAVA接入DeepSeek大模型接口开发---阿里云的百炼模型
|
14天前
|
机器学习/深度学习 人工智能 测试技术
阿里云百炼已上线超强推理开源模型QwQ-32B,尺寸更小,性能比肩DeepSeek满血版
通义千问团队推出了320亿参数的QwQ-32B模型,通过大规模强化学习和多阶段训练,在数学、编程及通用能力上达到或超越了DeepSeek-R1等先进模型。QwQ-32B模型已在阿里云百炼上线,支持API调用,用户可通过官方文档了解详细使用方法。未来,团队将继续探索智能体与RL集成,推动人工通用智能的发展。
|
10天前
|
人工智能 JavaScript 前端开发
【最佳实践系列】AI程序员让我变成全栈:基于阿里云百炼DeepSeek的跨语言公告系统实战
本文介绍了如何在Java开发中通过跨语言编程,利用阿里云百炼服务平台的DeepSeek大模型生成公告内容,并将其嵌入前端页面。
|
1月前
|
人工智能 自然语言处理 机器人
在钉钉中与百炼DeepSeek大模型对话
DeepSeek发布了两款先进AI模型V3和R1,分别适用于对话AI、内容生成及推理任务。阿里云百炼提供DeepSeek模型API,通过AppFlow可在钉钉中快速配置与DeepSeek的对话功能,无需代码开发,10分钟内完成全部设置。用户需在钉钉开放平台创建应用、配置消息卡片、授权权限,并使用计算巢AppFlow创建连接流,最后配置钉钉机器人并发布应用版本,即可实现与DeepSeek大模型的交互。
在钉钉中与百炼DeepSeek大模型对话
|
23天前
|
自然语言处理 开发者
DeepSeek全尺寸模型上线阿里云百炼!
DeepSeek全尺寸模型上线阿里云百炼!
62 4
|
23天前
|
人工智能 Java 语音技术
零基础上手百炼语音AI模型|Github示例工程介绍
零基础上手百炼语音AI模型|Github示例工程介绍
|
1月前
|
人工智能 负载均衡 数据可视化
阿里云出手了,基于百炼一键部署DeepSeek满血版,告别服务器繁忙1
阿里云百炼平台推出一键部署DeepSeek-R1满血版671B模型,提供100万免费Token,无需编码,新手5分钟内即可完成部署。通过Chatbox客户端配置API,轻松实现模型调用,解决服务器繁忙问题,支持自动弹性扩展,降低硬件成本。详情及教程见阿里云百炼官网。
340 5
|
7天前
|
人工智能 负载均衡 数据可视化
评测|零门槛,即刻拥有DeepSeek-R1满血版 | 阿里云百炼调用DeepSeek
本方案以 DeepSeek-R1 满血版为例进行演示,通过百炼模型服务进行 DeepSeek 开源模型调用,可以根据实际需求选择其他参数规模的 DeepSeek 模型。
36 0
|
1月前
|
人工智能 Java 语音技术
【最佳实践系列】零基础上手百炼语音AI模型
阿里云百炼语音AI服务提供了丰富的功能,包括语音识别、语音合成、实时翻译等。通过`alibabacloud-bailian-speech-demo`项目,可以一键调用这些服务,体验语音及大模型的魅力,降低接入门槛。该项目支持Python和Java,涵盖从简单的一句话合成到复杂的同声传译等多个示例,助力开发者快速上手并进行二次开发。

热门文章

最新文章

相关产品

  • 大模型服务平台百炼