2024-05-15
164876

OpenKruise v1.6 版本解读:增强多域管理能力

OpenKruise 在 2024.3 发布了最新的 v1.6 版本(ChangeLog),本文对新版本的核心特性做整体介绍。

2024-05-15
117

DCDN助力企业灰度上云产品实践

提起CDN,大家想到的字眼可能是缓存、转发、调度,用来提升终端用户体验、保护源站IP、降低源站流量风险,同时可以将源站的应用功能卸载到边缘,进一步释放边缘算力满足业务需求。DCDN脱胎于CDN,面向动态元素,通过智能路由、协议优化、压缩传输等手段,将转发场景的性能提到极限,广泛应用于电商、游戏、政企等行业。在互联网蓬勃发展,传统企业寻求数字化转型机会的今天,DCDN作为流量的入口,搭配灵活易扩展的“高级条件”及“EdgeScript”,可以通过流量转发这一技术手段,实现客户上云的“安全灰度”。

117
2024-05-15
132

基于ASK+TFJob快速完成分布式Tensorflow训练任务

本文介绍如何使用TFJob在ASK+ECI场景下,快速完成基于GPU的TensorFlow分布式训练任务。

132
2024-05-15
789

高并发架构设计三大利器:缓存、限流和降级

软件系统有三个追求:高性能、高并发、高可用,俗称三高。本篇讨论高并发,从高并发是什么到高并发应对的策略、缓存、限流、降级等。

789
2024-05-15
138290

用软硬协同设计下的飞天盘古降低存储系统开销

历经 15 载,如今的飞天盘古系统已迭代至第三代,数千万行代码和 1,000 余项专利,从大规模、到高性能、到高效能的分布式存储系统的演进,更高效地让数据中心成为一台计算机。

138,290
2024-05-15
145345

弹性调度助力企业灵活应对业务变化,高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化,并高效管理云上资源。

145,345
2024-05-15
92570

阿里云云原生弹性方案,用弹性解决集群资源利用率难题

本文主要介绍了通过弹性,实现成本优化,解决集群资源利用率难题。

92,570
2024-05-15
100722

大语言模型推理提速,TensorRT-LLM 高性能推理实践

大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

100,722
2024-05-15
104064

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示,SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能,自定义仪表盘;SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据,建设完整统一的大模型可观测方案,为用户的大模型安全推理审计提供全面合规支持。

104,064
1
...
2
3
4
5
6
到第
1
2
3
4
5
6
4/6