官方博客-第19页-阿里云开发者社区

正己

2025-01-06

336

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

336

新念

2025-02-14

1438

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,438

阿里云实时计算Flink

2023-04-13

1252

海量数据实时分析引擎 Apache Flink

当系统出现大量或者重大的错误却不被人感知，将会对业务产生影响，从而导致资产损失。当竞争对手实施了新战术，却无法及时感知，跟不上竞争对手的节奏，总是追着对方尾巴走。当要做决策的时候，海量的业务数据增长却无法实时看到聚合结果，决策总是凭借过往经验或者过时的数据分析之上。

阿里云实时计算Flink

1,252

王明橙鲤黄俊

2024-05-15

64129

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

64,129

非有

2024-05-15

1499

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

1,499

孟威

2024-05-15

105544

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

105,544

行疾

2024-05-15

3239

阿里云容器服务 ACK AI 助手正式上线

期待已久！阿里云容器服务 ACK AI 助手正式上线

行疾

3,239

阿里云实时数仓Hologres

2024-05-15

1027

Flink+Paimon+Hologres 构建实时湖仓数据分析

本文整理自阿里云高级专家喻良，在 Flink Forward Asia 2023 主会场的分享。

阿里云实时数仓Hologres

1,027

铠旋

2024-05-15

708

某海外视频网站AWS S3 搬迁至OSS解决方案

某网站主体位于AWS，经营视频直播/点播以及其他互联网衍生业务，面向广大的海外手机端客户。目前已经在使用阿里云的VOD SDK，并将主要视频数据存放于S3。现需要将业务从AWS S3迁移至阿里云OSS。

铠旋

708

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

DeepSeek-V3 高效训练关键技术分析

海量数据实时分析引擎 Apache Flink

通义千问开源模型在PAI灵骏的最佳实践

一文详解 Java 限流接口实现

SLS 大模型可观测&安全推理审计标准解决方案

阿里云容器服务 ACK AI 助手正式上线

Flink+Paimon+Hologres 构建实时湖仓数据分析

某海外视频网站AWS S3 搬迁至OSS解决方案

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

DeepSeek-V3 高效训练关键技术分析

海量数据实时分析引擎 Apache Flink

通义千问开源模型在PAI灵骏的最佳实践

一文详解 Java 限流接口实现

SLS 大模型可观测&安全推理审计标准解决方案

阿里云容器服务 ACK AI 助手正式上线

Flink+Paimon+Hologres 构建实时湖仓数据分析

某海外视频网站AWS S3 搬迁至OSS解决方案