|
弹性计算 运维 监控
|

云产品评测|云服务诊断 (两项功能诊断测评)

从阿里云官方了解到云服务诊断这个产品,作为一位云运维工程师,对这方面是比较持续关注的;本次基于产品的两个常见功能进行体验测试,整体感受下来的效率和体验感是很不错的,实用可靠,推荐使用!

286 25
|
弹性计算 关系型数据库 MySQL
|

阿里云服务器搭建网站教程:经济型e实例2核2G快速搭建网站图文教程参考

目前在阿里云的活动中,轻量应用服务器2核2G3M带宽只要68元1年,2核4G4M带宽只要298元1年。云服务器ECS经济型e实例2核2G 3M固定带宽,价格只要99元/1年,新老用户都可购买,企业用户购买2核4G5M带宽199元一年,为用户提供长期权益。这些都是个人和普通企业用户搭建网站使用较多的云服务器,本文为大家展示使用经济型e实例2核2G3M带宽快速搭建网站的相关教程,以供参考。

735 18
来自: 云服务器ECS  版块
|
存储 算法 数据挖掘
|

服务器数据恢复—nas中raid6阵列失效,存储无法访问的数据恢复案例

一台nas上共有14块硬盘组建了一组raid6磁盘阵列。 该nas在工作过程中,raid6阵列中硬盘出现故障离线,导致raid6阵列失效,nas无法正常访问。

264 3
|
机器学习/深度学习 弹性计算 人工智能
|

阿里云服务器ECS架构区别及选择参考:X86计算、ARM计算等架构介绍

在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选,有的用户并不清楚他们之间有何区别,本文主要简单介绍下这些架构各自的主要性能及适用场景,以便大家了解不同类型的架构有何不同,主要特点及适用场景有哪些。

1821 10
来自: 云服务器ECS  版块
|
负载均衡 定位技术 网络安全
|

阿里云国际站注册教程:阿里云cdn加速怎样

通过阿里云CDN加速,用户可以实现网站内容的快速加载,提升用户体验,同时减轻源站服务器的压力,提高网站的访问速度和稳定性

437 19
|
存储 数据挖掘 数据库
|

Netapp数据恢复—Netapp存储误删除lun的数据恢复

Netapp数据恢复数据恢复环境&故障: 一台Netapp存储中有72块SAS硬盘,管理员误操作删除了12个lun。 Netapp数据恢复过程: 1、将故障Netapp存储中所有磁盘编号后取出。硬件工程师检测后没有发现有硬盘存在硬件故障,都可以正常读取。将所有硬盘以只读方式进行扇区级全盘镜像。镜像完成后将所有磁盘按照标记原样还原到原存储中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。 2、基于镜像文件对分析所有磁盘底层数据,找到了盘头位置的超级块,分析超级块信息获取到磁盘组的起始块信息、磁盘组名称、逻辑组起始块号、raid编号等基本信息。

185 4
|
弹性计算 存储 对象存储
|

7、如何在阿里云ECS服务器上进行数据备份?

1470 12
来自:云服务器ECS 版块
已解决
|
监控 安全 数据库
|

阿里云国际站:如何使用阿里云国际站服务器

阿里云国际站服务器是一种强大的云计算服务,可以帮助用户轻松搭建和管理自己的网站、应用程序和数据库。本文将介绍如何使用阿里云国际站服务器,包括注册账户、选择服务器配置、安装操作系统、配置网络和安全设置等方面。

833 5
|
机器学习/深度学习 弹性计算 缓存
|

简单聊聊,阿里云2核2G3M带宽云服务器与轻量应用服务器区别及选择参考

2核2G3M带宽云服务器与轻量应用服务器是目前阿里云的活动中,入门级走量型云服务器,轻量云服务器2核2G3M带宽68元一年,经济型e实例云服务器2核2G3M带宽99元1年。同样的配置,对于有的新手用户来说,有必要了解一下他们之间的区别,以及各自的购买和续费相关政策,从而选择更适合自己需求的云服务器。本文为大家简单分析一下我们应该选择哪一款。

499 8
来自: 云服务器ECS  版块
|
消息中间件 机器学习/深度学习 人工智能
|

AI赋能运维:实现运维任务的智能化自动分配

AI赋能运维:实现运维任务的智能化自动分配

1071 24
|
机器学习/深度学习 人工智能 运维
|

人工智能在事件管理中的应用

人工智能在事件管理中的应用

352 21
|
供应链 监控 安全
|

对话|企业如何构建更完善的容器供应链安全防护体系

随着云计算和DevOps的兴起,容器技术和自动化在软件开发中扮演着愈发重要的角色,但也带来了新的安全挑战。阿里云针对这些挑战,组织了一场关于云上安全的深度访谈,邀请了内部专家穆寰、匡大虎和黄竹刚,深入探讨了容器安全与软件供应链安全的关系,分析了当前的安全隐患及应对策略,并介绍了阿里云提供的安全解决方案,包括容器镜像服务ACR、容器服务ACK、网格服务ASM等,旨在帮助企业构建涵盖整个软件开发生命周期的安全防护体系。通过加强基础设施安全性、技术创新以及倡导协同安全理念,阿里云致力于与客户共同建设更加安全可靠的软件供应链环境。

150543 32
来自: 云服务器ECS  版块
|
人工智能 监控 测试技术
|

阿里云磐久服务器稳定性实践之路

阿里云服务器质量智能管理体系聚焦自研服务器硬件层面的极致优化,应对高并发交付、短稳定性周期、早问题发现和快修复四大挑战。通过“三个重构”(质量标准、开发流程、交付模式)、“六个归一”(架构、硬件、软件、测试、部件、制造)策略,实现芯片、整机和云同步发布,确保快速稳定上量。此外,全场景测试体系与智能预警、分析、修复系统协同工作,保障服务器在萌芽阶段发现问题并及时解决,提升整体质量水平。未来,阿里云将继续深化大数据驱动的质量管理,推动服务器行业硬件质量的持续进步。

1280 5
|
弹性计算 人工智能 运维
|

阿里云算力服务的稳定性演进

本文介绍了弹性计算稳定性技术的基础能力研究,涵盖稳定性底座、实例异常检测、变更异常检测、风险规避和故障处置等方面。重点讲解了阿里云在ECS稳定性方面的进展,包括高可用架构设计、故障演练验证、持续运行阶段的稳定性保障以及相关工具和功能。此外,还探讨了Confidential AI的最佳实践,解决了大模型场景下的系统级安全风险,并介绍了机密计算产品的能力规划。最后,文章阐述了ACK容器服务的稳定性演进,包括高可用架构、托管节点池、供应链安全、事件体系、全链路检测、版本升级和成本管理等功能,确保用户能够获得高效稳定的容器服务体验。

777 3
|
存储 弹性计算 监控
|

从外到内:阿里云弹性与资源交付效率的全景透视

本文介绍了弹性服务的概念及其在云计算中的重要性。弹性服务通过动态调整云资源,帮助用户应对流量波动,降低成本并提高自动化水平。文中详细探讨了如何从“使用弹性”迈向“善用弹性”,包括定时任务、报警任务和目标追踪等伸缩模式的应用。同时,文章还介绍了阿里云在ECS弹性能力方面的建设成果,如每分钟交付万台实例的能力,并分享了汇量科技和Auto MQ两个客户案例的成功实践。最后,展望了未来在弹性计算领域的技术创新和发展方向,强调了持续优化和提升弹性能力的重要性。

496 1
|
运维 数据挖掘 Windows
|

服务器数据恢复—服务器硬盘指示灯亮黄灯的数据恢复案例

服务器硬盘指示灯闪烁黄灯是一种警示,意味着服务器硬盘出现故障即将下线。发现这种情况建议及时更换硬盘。 一旦服务器上有大量数据频繁读写,硬盘指示灯会快速闪烁。服务器上某个硬盘的指示灯只有黄灯亮着,而其他颜色的灯没有亮的话,通常表示这块硬盘出现故障,这时候更换新硬盘同步数据即可。 如果没有及时发现硬盘损坏或者更换硬盘失败导致服务器崩溃,应该如何恢复数据呢?下面通过一个真实案例讲解一下服务器硬盘指示灯亮黄色的数据恢复案例。

958 1
|
编解码 弹性计算 大数据
|

软硬结合助力倚天云原生算力再进化,加速大数据、视频转码上云步伐

本文介绍了云原生算力的进化,重点讨论了倚天710 CPU在大数据和视频转码场景中的应用与优势。倚天710采用ARM架构,通过物理核设计和CIPU加速卡优化,显著提升了高负载下的性能稳定性,并在实际应用中帮助客户实现了20%-40%的性能提升和成本降低。此外,文章还探讨了操作系统、编译器等底层软件的优化,以及如何通过龙蜥社区和阿里云平台支持更多应用场景,助力企业实现高效迁移和性能优化。

457 0
来自: 云服务器ECS  版块
|
弹性计算 Linux 数据安全/隐私保护
|

阿里云服务器最新购买流程与试用流程参考,购买与试用图文教程和注意事项

如何购买和试用阿里云服务器,教程参考来了。阿里云服务器分为免费版和收费版,新用户可免费领取一台云服务器作为试用,轻量应用服务器2核2G目前38元1年,云服务器ECS2核2G3M的价格为99元1年,2核4G5M配置199元1年,下面小编来介绍一下2025年我们购买和试用阿里云服务器的详细流程,以图文形式展示给大家,适合新手用户参考。

2162 3
来自: 云服务器ECS  版块
|
人工智能 运维 监控
|

AI辅助的运维流程自动化:实现智能化管理的新篇章

AI辅助的运维流程自动化:实现智能化管理的新篇章

1716 22
|
存储 数据挖掘
|

服务器数据恢复—zfs文件系统服务器数据恢复案例

一台配有32块硬盘的服务器在运行过程中突然崩溃不可用。经过初步检测,基本上确定服务器硬件不存在物理故障。管理员重启服务器后问题依旧。需要恢复该服务器中的数据。

185 1
|
存储 人工智能 运维
|

面向AI的服务器计算软硬件架构实践和创新

阿里云在新一代通用计算服务器设计中,针对处理器核心数迅速增长(2024年超100核)、超多核心带来的业务和硬件挑战、网络IO与CPU性能增速不匹配、服务器物理机型复杂等问题,推出了磐久F系列通用计算服务器。该系列服务器采用单路设计减少爆炸半径,优化散热支持600瓦TDP,并实现CIPU节点比例灵活配比及部件模块化可插拔设计,提升运维效率和客户响应速度。此外,还介绍了面向AI的服务器架构挑战与软硬件结合创新,包括内存墙问题、板级工程能力挑战以及AI Infra 2.0服务器的开放架构特点。最后,探讨了大模型高效推理中的显存优化和量化压缩技术,旨在降低部署成本并提高系统效率。

1682 6
|
缓存 安全 数据挖掘
|

阿里云服务器目前活动中各实例规格适用场景汇总,选择指南参考

本文将基于2025年阿里云服务器相关活动的最新内容,对各个实例规格的适用场景进行详细汇总,并提供选择指南参考,帮助用户轻松选购到最适合自己的云服务器实例。

450 4
来自: 云服务器ECS  版块
|
存储 弹性计算 调度
|

云上普惠高性能计算平台,助力HPC行业创新

EHPC(弹性高性能计算)产品架构分为三个层次:资源层、服务层和使用界面层。资源层按HPC行业需求编排ECS实例、存储和调度管理资源,形成支持VPC和RDMA网络的集群。服务层提供集群资源管理、应用管理和作业调度等功能,并支持基于负载的弹性伸缩。使用界面层包括控制台、HPC PORTAL和Open API,方便不同用户操作。今年新发布的功能包括基于英特尔八代处理器的HPC实例、RDMA网络支持IB Verbs接口、拓扑感知的弹性伸缩能力以及Instant计算环境,优化了性能和成本。EHPC通过这些设计帮助客户快速上云并高效利用资源。

347 2
|
人工智能 弹性计算 运维
|

ECS控制台,AI助手与极简管控体验

本文介绍了ECS控制台的演进及最新AI工具功能。控制台作为运维平台,需兼顾用户体验、可靠性和安全性。针对不同用户(个人开发者、企业级用户、资源管理员和架构师),控制台提供了定制化AI助手,涵盖售前选型、售中购买、售后运维等全链路支持。AI助手可智能分析用户需求,推荐合适规格,并提供实例诊断、命令解释等功能,简化操作流程。此外,还推出了简洁版控制台,优化了小资源量用户的使用体验,减少复杂度,提升效率。未来,控制台将朝着更智能、个性化的chat ops方向发展。

654 6
来自: 云服务器ECS  版块
|
机器学习/深度学习 运维 监控
|

利用深度学习进行系统健康监控:智能运维的新纪元

利用深度学习进行系统健康监控:智能运维的新纪元

406 30
|
机器学习/深度学习 人工智能 资源调度
|

基于AI的运维资源调度:效率与智能的双重提升

基于AI的运维资源调度:效率与智能的双重提升

1771 16
|
存储 运维 安全
|

阿里云弹性裸金属服务器是什么?产品规格及适用场景介绍

阿里云服务器ECS包括众多产品,其中弹性裸金属服务器(ECS Bare Metal Server)是一种可弹性伸缩的高性能计算服务,计算性能与传统物理机无差别,具有安全物理隔离的特点。分钟级的交付周期将提供给您实时的业务响应能力,助力您的核心业务飞速成长。本文为大家详细介绍弹性裸金属服务器的特点、优势以及与云服务器的对比等内容。

1231 23
来自: 云服务器ECS  版块
|
存储 弹性计算 Kubernetes
|

阿里云弹性计算稳定性最佳实践

本文介绍了ECS实例稳定性最佳实践的重要性及其具体实施方法。首先,阐述了ECS作为底层基础设施,其稳定性对业务连续性至关重要,并通过一系列工程化方法构建稳定的基础架构。其次,详细描述了用户如何通过合适规格选择、操作系统更新、事件响应机制等手段规避风险,提升业务稳定性。此外,还探讨了实例Panic风险消除、故障诊断及自动分析等技术细节,以及通过云助手插件实现自动化监控和故障处理的最佳实践。最后,分享了制造业客户的实际案例,展示了如何有效解决大规模Panic事件,确保业务的持续稳定运行。通过这些措施,用户可以充分利用ECS的稳定性优势,保障业务的高效与可靠。

417 9
|
存储 弹性计算 人工智能
|

弹性计算第九代企业级ECS实例新品发布

阿里云第九代企业级实例基于全新CIPU 2.0架构,搭载最新英特尔和AMD处理器,大幅提升性能、安全性和稳定性。G9i实例采用英特尔新一代处理器,内存带宽和L3缓存显著提升,标配AMX加速器;G9A实例则搭载AMD先进处理器,提供更高的性价比和端到端加密能力。九代产品在算力、IO能力和安全性上全面升级,尤其适用于搜推、大数据处理等场景,助力客户实现更高业务价值。

1062 8
来自: 云服务器ECS  版块
|
机器学习/深度学习 运维 监控
|

灵骏智算实例异常预测技术

本文介绍了灵骏智算实例异常预测技术,旨在提前预测GPU等设备的故障,确保大模型训练的稳定性。文章首先探讨了为何需要进行异常预测,指出大规模GPU集群在大模型训练中面临的稳定性挑战。接着阐述了预测的可行性和原理,通过分析复杂系统中的小异常逐步积累导致故障的现象,利用时序指标和关键指标分布模式进行预测。目前该技术可在1-250分钟内提前预测故障,准确率达95%以上,召回率超过20%。最后介绍了系统的集成与应用,强调了端侧部署预测模型的优势,包括降低网络开销、保护用户数据隐私等。

793 7
|
机器学习/深度学习 人工智能 PyTorch
|

阿里云GPU云服务器怎么样?产品优势、应用场景介绍与最新活动价格参考

阿里云GPU云服务器怎么样?阿里云GPU结合了GPU计算力与CPU计算力,主要应用于于深度学习、科学计算、图形可视化、视频处理多种应用场景,本文为您详细介绍阿里云GPU云服务器产品优势、应用场景以及最新活动价格。

985 8
来自: 云服务器ECS  版块
|
存储 数据挖掘 数据库
|

XSAN数据恢复-XSAN文件系统数据迁移过程中全部丢失的数据恢复案例

XSAN数据恢复环境: 昆腾存储+MAC OS操作系统,存储数据主要是视频类数据如MXF、MOV等格式文件。 该昆腾存储中有9个数据卷:1个META信息卷和8个DATA信息卷。 XSAN故障情况: 将存储空间从XSAN架构迁移到STORNEXT架构后,发现存储空间中数据全部丢失。

217 11
|
人工智能 弹性计算 监控
|

分布式大模型训练的性能建模与调优

阿里云智能集团弹性计算高级技术专家林立翔分享了分布式大模型训练的性能建模与调优。内容涵盖四大方面:1) 大模型对AI基础设施的性能挑战,强调规模增大带来的显存和算力需求;2) 大模型训练的性能分析和建模,介绍TOP-DOWN和bottom-up方法论及工具;3) 基于建模分析的性能优化,通过案例展示显存预估和流水线失衡优化;4) 宣传阿里云AI基础设施,提供高效算力集群、网络及软件支持,助力大模型训练与推理。

1146 5
|
人工智能 资源调度 调度
|

云上AI Infra解锁大模型创新应用

本节课程由阿里云智能集团资深技术专家王超分享,主题为AI基础设施的发展趋势。课程聚焦于AI Infra设计与Scaling Law,探讨了下一代AI基础设施的设计目标、功能升级及推理场景中的应用。主要内容包括高效支持大规模模型训练和推理、全球调度系统的设计、Rack level的Scale优化以及多租户容器化使用方式。通过这些改进,旨在提升并行效率、资源利用率及稳定性,推动AI基础设施迈向更高性能和更优调度的新阶段。

672 2

弹性计算

云服务器(Elastic Compute Service,简称 ECS)是一种简单高效、处理能力可弹性伸缩的计算服务,可快速构建更稳定、安全的应用,提升运维效率,降低 IT 成本。

1
今日
8872
内容
90
活动
424183
关注
你好!
登录掌握更多精彩内容

相关产品

  • 云服务器 ECS
  • 轻量应用服务器
  • 无影云电脑