阿里云云原生

2024-05-24

AIOps 智能运维：比专家经验更优雅的错/慢调用分析工具

本文主要介绍ARMS 错/慢 Trace 分析功能基本原理；该功能能够覆盖哪些异常 Trace 根因；最后会介绍一些最佳实践案例。

阿里云云原生

49,859

阿里云云原生

2024-05-22

60101

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

超算快速弹性伸缩场景下，如何构建一套准确、快速、可靠的监控体系成为关键点。阿里云在超算场景的主机监控落地实践，解决超算场景面临的挑战，交付一套可靠和全面的主机监控体系。

阿里云云原生

60,101

阿里云云原生

2024-05-16

56184

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

56,184

澄潭董艺荃

2024-05-16

87947

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

87,947

阿里云云原生

2024-05-15

72332

通义灵码技术解析，打造 AI 原生开发新范式

本文第一部分先介绍 AIGC 对软件研发的根本性影响，从宏观上介绍当下的趋势；第二部分将介绍 Copilot 模式，第三部分是未来软件研发 Agent 产品的进展。

阿里云云原生

72,332

阿里云云原生

2024-05-15

57113

低成本、高稳定性 | 满帮集团 Eureka 和 ZooKeeper 的上云实践

业务体量增大后，日益凸显的架构稳定性问题该如何解决？满帮集团选择了上阿里云，采用阿里云 MSE Nacos，MSE ZooKeeper 产品替换原先的 Eureka 和 Zookeeper 集群，做到了低成本快速的架构升级，以及上云期间业务流量的无损平滑迁移。

阿里云云原生

57,113

ModelScope

2024-05-15

177

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

177

周新宇

2024-05-15

84174

AutoMQ：基于阿里云计算与存储产品实现云原生架构升级

AutoMQ[1] 是新一代基于共享存储架构实现的云原生 Kafka。得益于其存算分离的共享存储架构，通过和阿里云合作，深度使用阿里云可靠、先进的云服务如对象存储OSS、块存储 ESSD、弹性伸缩ESS以及抢占式实例实现了相比 Apache Kafka 10倍的成本优势并且提供了自动弹性的能力。

周新宇

84,174

阿里云云原生

2024-05-15

66776

无需重新学习，使用 Kibana 查询/可视化 SLS 数据

本文演示了使用 Kibana 连接 SLS ES 兼容接口进行查询和分析的方法。

阿里云云原生

66,776

类目筛选

内容类型

AIOps 智能运维：比专家经验更优雅的错/慢调用分析工具

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

通义灵码技术解析，打造 AI 原生开发新范式

低成本、高稳定性 | 满帮集团 Eureka 和 ZooKeeper 的上云实践

联合XTuner，魔搭社区全面支持数据集的长文本训练

AutoMQ：基于阿里云计算与存储产品实现云原生架构升级

无需重新学习，使用 Kibana 查询/可视化 SLS 数据