官方博客-第19页-阿里云开发者社区

笃敏

2024-05-15

546

【最佳实践】使用CloudLens排查日志时间解析错误问题

本文主要介绍如何使用CloudLens for SLS定位和解决iLogtail日常使用中的常见问题之一：日志时间解析错误问题。

笃敏

546

ModelScope

2024-05-15

734

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

734

玄飏

2024-07-04

37065

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

相较于 AliyunLogConfig，AliyunPipelineConfig 在配置格式、行为逻辑上做了很大改进，主打灵活、简单、稳定。点击本文，手把手教你如何配置 AliyunPipelineConfig，欢迎大家使用~

玄飏

37,065

穿杨

2024-08-21

403

谈谈优雅的钩子--bpftrace

bpftrace是一个内核跟踪工具，简单来说就是在函数上挂个钩子，挂上钩子后就可以将函数的入参和返回值取出来再放入程序进行二次编程，最终能让程序按照我们的意图来对函数进行观测。

穿杨

403

阿里云瑶池数据库

2024-11-21

1524

拥抱Data+AI｜“全球第一”雅迪如何实现智能营销？DMS+PolarDB注入数据新活力

针对雅迪“云销通App”的需求与痛点，本文将介绍阿里云瑶池数据库DMS+PolarDB for AI提供的一站式Data+AI解决方案，助力销售人员高效用数，全面提升销售管理效率。

阿里云瑶池数据库

1,524

正己

2025-01-06

328

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

328

阿里云云原生

2025-05-23

554

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

554

阿里云云原生

748

警惕日志采集失败的 6 大经典雷区：从本地管理反模式到 LoongCollector 标准实践

本文探讨了日志管理中的常见反模式及其潜在问题，强调科学的日志管理策略对系统可观测性的重要性。文中分析了6种反模式：copy truncate轮转导致的日志丢失或重复、NAS/OSS存储引发的采集不一致、多进程写入造成的日志混乱、创建文件空洞释放空间的风险、频繁覆盖写带来的数据完整性问题，以及使用vim编辑日志文件导致的重复采集。针对这些问题，文章提供了最佳实践建议，如使用create模式轮转日志、本地磁盘存储、单线程追加写入等方法，以降低日志采集风险，提升系统可靠性。最后总结指出，遵循这些实践可显著提高故障排查效率和系统性能。

阿里云云原生

748

山泽

2024-05-15

1314

从零构建现代深度学习框架(TinyDL-0.01)

本文主要以一个Java工程师视角，阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架（类比AI的操作系统）。

山泽

1,314

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

【最佳实践】使用CloudLens排查日志时间解析错误问题

联合XTuner，魔搭社区全面支持数据集的长文本训练

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

谈谈优雅的钩子--bpftrace

拥抱Data+AI｜“全球第一”雅迪如何实现智能营销？DMS+PolarDB注入数据新活力

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

警惕日志采集失败的 6 大经典雷区：从本地管理反模式到 LoongCollector 标准实践

从零构建现代深度学习框架(TinyDL-0.01)

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

【最佳实践】使用CloudLens排查日志时间解析错误问题

联合XTuner，魔搭社区全面支持数据集的长文本训练

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

谈谈优雅的钩子--bpftrace

拥抱Data+AI｜“全球第一”雅迪如何实现智能营销？DMS+PolarDB注入数据新活力

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

警惕日志采集失败的 6 大经典雷区：从本地管理反模式到 LoongCollector 标准实践

从零构建现代深度学习框架(TinyDL-0.01)