官方博客-第22页-阿里云开发者社区

龙蜥社区OpenAnolis

2024-11-06

1385

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

模块相比传统文件有哪些优势？

龙蜥社区OpenAnolis

1,385

亦达

2025-02-20

799

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

799

飒爽

2024-09-04

603

用Prompt技巧激发无限创意

本文深入探讨当前最前沿的prompt engineering方案，结合OpenAI、Anthropic和Google等大模型公司的资料，以及开源社区中宝贵的prompt技巧分享，全面解析这一领域的实践策略。

飒爽

603

不达

2024-09-11

348

内核网络小白之故障寻踪记

本文记述了一次由 skb（socket buffer）异常导致的内核故障排查过程。

不达

348

龙蜥社区OpenAnolis

2024-11-22

537

手把手教学攻略：在Anolis OS上部署OpenVINO深度学习模型

Anolis OS 作为国内首个正式提供 OpenVINO 开发包和镜像的服务器端操作系统，推动国内 AI 推理生态和能力的升级。

龙蜥社区OpenAnolis

537

资源编排ROS

2019-12-23

1897

资源编排ROS之自定制资源（多云部署AWS篇）

资源编排服务（Resource Orchestration Service，简称ROS）是阿里云提供的一项简化云计算资源管理的服务。您可以遵循ROS定义的模板规范编写资源栈模板，在模板中定义所需的云计算资源（例如ECS实例、RDS数据库实例）、资源间的依赖关系等。

资源编排ROS

1,897

林以琳

2024-05-15

1016

基于PAI-DSW快速启动Stable Diffusion WebUI

基于PAI-DSW快速启动Stable Diffusion WebUI，创作你的专属冬日主题AI画作！

林以琳

1,016

ModelScope

2024-05-15

661

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

本文将以Yuan2.0最新发布的Februa模型为例进行测试验证，用更小规模的模型达到更好的效果。

ModelScope

661

ModelScope

2024-05-15

425

用消费级显卡微调属于自己的Agent

本文为魔搭社区轻量级训练推理工具SWIFT微调实战教程系列

ModelScope

425

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

用Prompt技巧激发无限创意

内核网络小白之故障寻踪记

手把手教学攻略：在Anolis OS上部署OpenVINO深度学习模型

资源编排ROS之自定制资源（多云部署AWS篇）

基于PAI-DSW快速启动Stable Diffusion WebUI

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

用消费级显卡微调属于自己的Agent

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

用Prompt技巧激发无限创意

内核网络小白之故障寻踪记

手把手教学攻略：在Anolis OS上部署OpenVINO深度学习模型

资源编排ROS之自定制资源（多云部署AWS篇）

基于PAI-DSW快速启动Stable Diffusion WebUI

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

用消费级显卡微调属于自己的Agent