官方博客-第26页-阿里云开发者社区

  • 2025-01-10
    510

    Qwen2.5 的云端新体验,5 分钟完成极速部署

    将 Qwen2.5 模型部署于函数计算 FC,用户能依据业务需求调整资源配置,有效应对高并发场景,并通过优化资源配置,如调整实例规格、多 GPU 部署和模型量化来提升推理速度。此外,函数计算支持多样化 GPU 计费模式(按需计费、阶梯定价、极速模式),可根据业务需求调整,在面对高频请求和大规模数据处理时,能够显著降低综合成本。

  • 2025-01-16
    318

    AI 场景下,函数计算 GPU 实例模型存储最佳实践

    当前,函数计算 FC 已被广泛应用在各种 AI 场景下,函数计算支持通过使用容器镜像部署 AI 推理应用,并且提供多种选项来访问训练好的模型。为了帮助开发者高效地在函数计算上部署 AI 推理应用,并快速解决不同场景下的模型存储选型问题,本文将对函数计算的 GPU 模型存储的优缺点及适用场景进行对比分析,以期为您的模型存储决策提供帮助。

    318
  • 2025-02-11
    661

    0 代码!2 种方式,一键部署 DeepSeek 系列模型

    DeepSeek 凭借其卓越的性能和广泛的应用场景,迅速在全球范围内获得了极高的关注度和广泛的用户基础。DeepSeek-R1-Distill 是使用 DeepSeek-R1 生成的样本对开源模型进行蒸馏得到的小模型,拥有更小参数规模,推理成本更低,基准测试同样表现出色。依托于函数计算 FC 算力,Serverless+ AI 开发平台 CAP 现已提供模型服务、应用模版两种部署方式辅助您部署 DeepSeek R1 系列模型。完成模型部署后,您即可与模型进行对话体验;或以 API 形式进行调用,接入 AI 应用中。欢迎您立即体验。

  • 2023-06-29
    2220

    一键体验RocketMQ六大环境活动操作手册

    中间件产品门槛高?短时间无法深入了解?免费试用+30秒一键体验,低代码,无部署环境,带你了解“历经万亿级数据洪峰考验”的云消息队列RocketMQ。

  • 2023-06-29
    844

    基于云原生网关的全链路灰度实践

    基于云原生网关的全链路灰度实践

    844
  • 2023-09-06
    686

    沉浸式学习PostgreSQL|PolarDB 12: 如何快速构建 海量 逼真 测试数据

    本文主要教大家怎么用好数据库, 而不是怎么运维管理数据库、怎么开发数据库内核.

    686
  • 2023-10-12
    1324

    沉浸式学习PostgreSQL|PolarDB 19: 体验最流行的开源企业ERP软件 odoo

    本文主要教大家怎么用好数据库, 而不是怎么运维管理数据库、怎么开发数据库内核.

    1,324
  • 2024-05-15
    136132

    云原生场景下,AIGC 模型服务的工程挑战和应对

    本文介绍了在云原生场景下,AIGC 模型服务的工程挑战和Fluid 在云原生 AIGC 模型推理场景的优化。

  • 2024-05-15
    165229

    一键开启 GPU 闲置模式,基于函数计算低成本部署 Google Gemma 模型服务

    本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

    165,229
  • 1
    ...
    25
    26
    27
    ...
    59
    到第