官方博客-第32页-阿里云开发者社区

亦达

2025-02-20

686

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

686

阿里云开发者

2025-02-20

607

在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

如何在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

阿里云开发者

607

阿里云云原生

2025-04-25

644

理工科 MCP Server 神器，补足人工智能幻觉短板

本文介绍了为何需要WolframAlpha及其在解决大语言模型“幻觉”问题上的优势。大型语言模型如GPT-4虽在自然语言处理方面表现出色，但在科学与数学问题上常出错。WolframAlpha凭借其强大的计算能力和广泛的知识库，能准确处理复杂问题。Higress MCP市场已上线WolframAlpha LLM API，支持多种调用方式，并提供每月10次免费试用。配置流程包括获取API工具、安装Lobechat及配置Higress MCP插件。测试案例显示，WolframAlpha在数学推理、日常计算和图像绘制等方面表现优异，未来结合更多服务将推动AI技术发展。

阿里云云原生

644

阿里云云原生

2025-06-03

661

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

本文介绍了如何使用通义灵码编程智能体与高德 MCP 2.0 制作北京端午3天旅行攻略页面。首先需下载通义灵码 AI IDE 并获取高德申请的 key，接着通过添加 MCP 服务生成 travel_tips.html 文件，最终在手机端查看已发布上线的攻略。此外还详细说明了利用通义灵码打造专属 MCP 服务的过程，包括开发计划、代码编写、部署及连接服务等步骤，并提供了自由探索的方向及相关资料链接。

阿里云云原生

661

杳天

2022-12-13

2958

技术原理，Hologres Binlog技术原理揭秘

详细介绍Hologres Binlog技术原理以及最佳实践。

杳天

2,958

查斌

2023-04-14

571

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

Nydus+Dragonfly 组合减少容器启动过程中镜像的拉取时间，提升集群间的镜像分发效率。

查斌

571

霖玉

2023-06-15

13999

大数据SQL数据倾斜与数据膨胀的优化与经验总结

目前市面上大数据查询分析引擎层出不穷，但在业务使用过程中，大多含有性能瓶颈的SQL，主要集中在数据倾斜与数据膨胀问题中。本文结合业界对大数据SQL的使用与优化，尝试给出相对系统性的解决方案。

霖玉

13,999

云服务器ECS

2023-12-01

80156

AI 时代的 GPU 生存工具包，每个开发人员必须知道的最低限度

AI技术迎来了“百花齐放”的春天，这既是我们的挑战也是机会。而AI+千行百业创造了无限可能，也为独立开发者提供了大量的资源、支持以及学习经验的机会。本文分享一篇摘录自Hexmos 期刊的AI 时代的 GPU 生存工具包。

云服务器ECS

80,156

昕羽

2024-05-15

65567

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

Apache Paimon 和 Apache Hudi 作为数据湖存储格式，有着高吞吐的写入和低延迟的查询性能，是构建数据湖的常用组件。本文在阿里云EMR上，针对数据实时入湖场景，对 Paimon 和 Hudi 的性能进行比对，并分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。

昕羽

65,567

官方博客-第32页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

理工科 MCP Server 神器，补足人工智能幻觉短板

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

技术原理，Hologres Binlog技术原理揭秘

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

大数据SQL数据倾斜与数据膨胀的优化与经验总结

AI 时代的 GPU 生存工具包，每个开发人员必须知道的最低限度

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

官方博客-第32页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

理工科 MCP Server 神器，补足人工智能幻觉短板

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

技术原理，Hologres Binlog技术原理揭秘

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

大数据SQL数据倾斜与数据膨胀的优化与经验总结

AI 时代的 GPU 生存工具包，每个开发人员必须知道的最低限度

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse