官方博客-第22页-阿里云开发者社区

阿里云存储

2024-05-15

95394

AIGC训练场景下的存储特征研究

在今天这样以AIGC为代表的AI时代下，了解训练场景对于存储的具体诉求同样是至关重要的。本文将尝试解读WEKA的一个相关报告，来看看AIGC对于存储有哪些具体的性能要求。

阿里云存储

95,394

ModelScope

2024-05-15

767

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

767

无哲

2024-08-13

13210

更快更强，SLS 推出高性能 SPL 日志查询模式

从海量的日志数据中，按照各种灵活的条件进行即时查询搜索，是可观测场景下的基本需求。本文介绍了 SLS 新推出的高性能 SPL 日志查询模式，支持 Unix 风格级联管道式语法，以及各种丰富的 SQL 处理函数。同时通过计算下推、向量化计算等优化，使得 SPL 查询可以在数秒内处理亿级数据，并支持 SPL 过滤结果分布图、随机翻页等特性。

无哲

13,210

阿里云云原生

2024-12-17

867

10 分钟打造你的专属 AI 客服

在这个数字化时代，提供卓越的客户服务已成为企业脱颖而出的关键。为了满足这一需求，越来越多的企业开始探索人工智能（AI）助手的应用，以实现全天候（7x24）的客户咨询响应，全面提升用户体验和业务竞争力。本解决方案通过函数计算FC 和大模型服务平台百炼，为您提供一个高效便捷构建 AI 助手思路。

阿里云云原生

867

望宸

2025-02-20

683

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

683

亦达

2025-02-20

747

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

747

柯灵

2025-03-11

1602

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力，核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理（OOS）一键部署OpenWebUI+Ollama方案，轻松将QwQ-32B模型部署到ECS，或连接阿里云百炼的在线模型。整个过程无需编写代码，全部在控制台完成，适合新手操作。

柯灵

1,602

丕天

2025-03-21

1174

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,174

望宸魁宇

2025-04-07

441

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

是否还记得 2022 年 K8s Ingress Nginx 披露了的 3 个高危安全漏洞（CVE-2021-25745, CVE-2021-25746, CVE-2021-25748），并在那一年宣布停止接收新功能 PR，专注修复并提升稳定性。

望宸魁宇

441

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

AIGC训练场景下的存储特征研究

联合XTuner，魔搭社区全面支持数据集的长文本训练

更快更强，SLS 推出高性能 SPL 日志查询模式

10 分钟打造你的专属 AI 客服

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

AI 推理场景的痛点和解决方案

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AIGC训练场景下的存储特征研究

联合XTuner，魔搭社区全面支持数据集的长文本训练

更快更强，SLS 推出高性能 SPL 日志查询模式

10 分钟打造你的专属 AI 客服

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

AI 推理场景的痛点和解决方案

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群