官方博客-第19页-阿里云开发者社区

玄飏

2024-07-04

37062

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

相较于 AliyunLogConfig，AliyunPipelineConfig 在配置格式、行为逻辑上做了很大改进，主打灵活、简单、稳定。点击本文，手把手教你如何配置 AliyunPipelineConfig，欢迎大家使用~

玄飏

37,062

阿里云云原生

2024-08-12

475

5 大场景上手通义灵码企业知识库 RAG

大家好，我是通义灵码，你的智能编程助手！今天就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

475

贾缃

2024-09-04

480

WASM性能分析-插桩方案

本文结合了代码插桩和性能火焰图的技术，以 WebAssembly 为例介绍了性能分析的方法和相关实现。

贾缃

480

浅奕

2024-09-24

566

通过实验深入了解 TCP 数据的发送和接收

本系列文章是组内写给新人和实习生的 TCP入门系列教程，结合了理论和实践，本篇为第二篇，建议先读上篇《通过实验深入了解TCP 连接的建立和关闭》。

浅奕

566

易定

2024-12-06

1031

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,031

望宸

2025-02-20

644

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

644

亦达

2025-02-20

706

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

706

言澈

2025-02-28

1172

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,172

阿里云云原生

2025-04-28

704

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

704

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

5 大场景上手通义灵码企业知识库 RAG

WASM性能分析-插桩方案

通过实验深入了解 TCP 数据的发送和接收

【实战干货】AI大模型工程应用于车联网场景的实战总结

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

进行GPU算力管理

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

5 大场景上手通义灵码企业知识库 RAG

WASM性能分析-插桩方案

通过实验深入了解 TCP 数据的发送和接收

【实战干货】AI大模型工程应用于车联网场景的实战总结

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

进行GPU算力管理

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度