官方博客-第23页-阿里云开发者社区

阿里云云原生

2025-02-19

549

一键构建智能导购 AI 助手，轻松重塑购物体验

在数字化时代，线上购物已成为消费者生活中不可或缺的消费方式，而消费者的购物习惯和需求逐渐呈现多样化的趋势，为了帮助商家全天候、自动化地满足顾客的购物需求，本方案将详细介绍如何基于商品内容构建一个智能商品导购助手。

阿里云云原生

549

亦达

2025-02-20

799

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

799

阿里云云原生

2025-04-28

810

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

810

阿里云云原生

2024-05-15

136184

云原生场景下，AIGC 模型服务的工程挑战和应对

本文介绍了在云原生场景下，AIGC 模型服务的工程挑战和Fluid 在云原生 AIGC 模型推理场景的优化。

阿里云云原生

136,184

乔普

2024-05-15

1465

Koordinator v1.4 正式发布，为用户带来更多的计算负载类型和更灵活的资源管理机制

Koordinator v1.4 正式发布！为用户带来更多的计算负载类型和更灵活的资源管理机制

乔普

1,465

ModelScope

2024-05-15

660

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

本文将以Yuan2.0最新发布的Februa模型为例进行测试验证，用更小规模的模型达到更好的效果。

ModelScope

660

阿里云基础设施.

2025-05-01

476

ACK AI Profiling：从黑箱到透明的问题剖析

本文从一个通用的客户问题出发，描述了一个问题如何从前置排查到使用AI Profiling进行详细的排查，最后到问题定位与解决、业务执行过程的分析，从而展现一个从黑箱到透明的精细化的剖析过程。

阿里云基础设施.

476

史泽寰

2023-09-19

1145

全网最细，深度解析 Istio Ambient Mesh 流量路径

本文旨在对 Istio Ambient Mesh 的流量路径进行详细解读，力求尽可能清晰地呈现细节，以帮助读者完全理解 Istio Ambient Mesh 中最为关键的部分。

史泽寰

1,145

林以琳

2024-05-15

1015

基于PAI-DSW快速启动Stable Diffusion WebUI

基于PAI-DSW快速启动Stable Diffusion WebUI，创作你的专属冬日主题AI画作！

林以琳

1,015

官方博客-第23页-阿里云开发者社区

类目筛选

内容类型

一键构建智能导购 AI 助手，轻松重塑购物体验

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

云原生场景下，AIGC 模型服务的工程挑战和应对

Koordinator v1.4 正式发布，为用户带来更多的计算负载类型和更灵活的资源管理机制

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

ACK AI Profiling：从黑箱到透明的问题剖析

全网最细，深度解析 Istio Ambient Mesh 流量路径

基于PAI-DSW快速启动Stable Diffusion WebUI

官方博客-第23页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

一键构建智能导购 AI 助手，轻松重塑购物体验

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

云原生场景下，AIGC 模型服务的工程挑战和应对

Koordinator v1.4 正式发布，为用户带来更多的计算负载类型和更灵活的资源管理机制

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

ACK AI Profiling：从黑箱到透明的问题剖析

全网最细，深度解析 Istio Ambient Mesh 流量路径

基于PAI-DSW快速启动Stable Diffusion WebUI