如何搞定云运维——云计算IT基础设施与自动化运维论坛掠影

简介:

5月18日~20日,第八届云计算大会在京召开,工业和信息化部副部长怀进鹏出席会议并讲话,云计算大数据领域的9位院士和200多位专家在全体大会和专题论坛上作报告,三天共有超过15000人次听众参会。这个数字远远超过了往届会议,从侧面也足以说明,云计算在国内已经取得了足够的认可和关注。

事实上,有一种趋势无法忽视。企业对云计算的主要诉求从“经济”转变为“业务”,也就是说,云计算推广初期所高举的“省钱”大旗不再是企业关注的主要方向,企业更关注云对其业务创新的支撑,这就对云计算在及时交付、应用支持以及业务云化方面提出了更高要求。

在这种情况下,IT运维与前端开发和业务团队的边界越来越模糊,如何构建面向客户服务的IT运维就成了企业必须思考的重要问题。5月19日下午,由中国电子学会主办、ZD至顶网协办的云计算IT基础设施与自动化运维论坛召开,会议由北京科技大学网络中心主任杨扬主持。

如何搞定云运维——云计算IT基础设施与自动化运维论坛掠影

北京科技大学网络中心主任杨扬

杨扬表示,云计算的发展给未来的运维和管理带来了非常大的挑战。云的环境下,企业新旧设备并存,同构、异构软件并存,加上对数据的需求,这些让企业运维越来越难。各行各业都有这些困惑,云计算未来的架构应该是什么样子?它的管理,不论从软硬件的管理,流程的管理和其他的方方面面的管理是一些什么样子?下面就请各位专家给大家解答这些问题。

如何搞定云运维——云计算IT基础设施与自动化运维论坛掠影

新浪微博系统研发总监刘道儒

随着微博业务的发展,由明星、社会事件等引发的热点事件越来越频繁,2015年6月1日李晨事件更是将微博核心系统的请求量翻了一倍,由于服务器冗余度不足而影响了业务。在后续的服务器扩容的过程中也发现了新服务器采购慢、机房机架紧缺等问题。同时,由于热点事件流量大、时间短,长期扩大部署规模也会造成很大的成本压力。

结合微博在Docker技术上的积累,利用Docker抹平服务部署差异的能力,以及阿里云ECS快速扩缩容的能力,微博平台对整个运维体系进行了升级改造,研发了一套全自动化的混合云运维管理系统,能够在20分钟内完成50台服务器的快速扩容。借助这套系统,在2016年微博春晚峰值保障时,为公司提供了1000多台服务器的支持,同时,接下来会继续推进混合云体系在整个微博的应用。

如何搞定云运维——云计算IT基础设施与自动化运维论坛掠影

微软亚太科技有限公司资深总监王枫

微软亚太科技有限公司资深总监王枫分享了,以微软云平台为主的生态环境,从三个方面打造现代化的数据中心,帮助企业共同在云的创新上实现共赢。第一,构建基于云的、可靠的,可扩展性、安全性的、高可用性的基础平台;第二,在云平台的基础上,适应业务的需求,低成本响应业务部门的需求,提供更好的服务,提供更好的市场应用;第三,通过检测、监控、问题修复,并进行前瞻性的分析,实现跨平台的管理。

此外,王枫还分享了微软Azure的云平台、软件定义网络、软件定义存储,以及如何在低成本,快速响应、创新的基础上去开发、部署、实现、投放面向业务部门和面向用户的应用。另外,现在的数据中心要求开发人员、业务人员和管理人员之间实现紧密的结合,要通过一个中央的数据库,能够把所有的应用、基础设施的资源整合统一起来,通过DevOps实现监控、预测、实施、处理,应用跟IT维护人员之间无缝结合。

如何搞定云运维——云计算IT基础设施与自动化运维论坛掠影

Juniper Networks 亚太区资深产品总监马绍文

Juniper Networks 亚太区资深产品总监马绍文分享了Juniper软件定义网络的解决方案,为简单、基本的给云计算铺路。

如何搞定云运维——云计算IT基础设施与自动化运维论坛掠影

云英技术VP胡湿

云英技术VP胡湿介绍了云英作为创业云计算公司,致力为企业提供一套易用、高效的云计算服务,展示了从云存储到网络,从监控到自动化运维,提升底层虚拟机的实施调整和管理,以及实现开发、测试、运维整个流程化的工作。

如何搞定云运维——云计算IT基础设施与自动化运维论坛掠影

1号店资深运维架构师陈绍东

1号店资深运维架构师陈绍东表示,业务系统的稳定运行是大家最关心的问题,1号店有着大规模的应用集群和复杂的系统架构,任何一个系统故障、网络故障或者任何一次小的变更操作都有可能引起大规模的线上事故,出现事故后如何定位问题根源以及如何快速修复一直是困扰着运维人员的难题。此次,陈绍东分享了1号店从服务器手动安装、配置、代码的发布和添加监控,到实现自动化监控以及快速故障定位和故障修复的实践。

如何搞定云运维——云计算IT基础设施与自动化运维论坛掠影

国美在线云平台架构师刘冰

国美在线云平台架构师刘冰,围绕目前几个正在持续研发的系统介绍国美在线在运维层面所做的工作。刘冰针对三个方向做一个论述,第一就是运维当中面临的挑战,第二是我们做的一些应对之道,第三是介绍运维管理平台。并通过自研的DCMS数据管理系统,在运维平台上实现自动化、流程化、标准化,达到稳定、高效、降低成本的目的。

如何搞定云运维——云计算IT基础设施与自动化运维论坛掠影

金山云云计算架构师杨峰

金山云云计算架构师杨峰介绍了金山云通过对物理机和网络的管理,最终实现更稳定的主机运营环境。






原文发布时间为:2016年5月28日 
本文作者:作者:赵东
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
目录
相关文章
|
12天前
|
人工智能 运维 自然语言处理
智能化运维:AI在IT运维领域的深度应用与实践####
本文探讨了人工智能(AI)技术在IT运维领域的深度融合与实践应用,通过分析AI驱动的自动化监控、故障预测与诊断、容量规划及智能决策支持等关键方面,揭示了AI如何赋能IT运维,提升效率、降低成本并增强系统稳定性。文章旨在为读者提供一个关于AI在现代IT运维中应用的全面视角,展示其实际价值与未来发展趋势。 ####
76 4
|
14天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
14天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维在企业IT管理中的应用与实践####
本文深入探讨了智能化运维(AIOps)的核心技术原理,通过对比传统运维模式,揭示了AIOps如何利用大数据、机器学习等先进技术提升故障预测准确性、优化资源分配及自动化处理流程。同时,文章详细阐述了智能化运维平台的实施步骤,包括数据收集与分析、模型训练与部署、以及持续监控与优化,旨在为企业IT部门提供一套切实可行的智能化转型路径。最后,通过几个典型应用案例,如某大型电商平台的智能告警系统和金融企业的自动化故障排查流程,直观展示了智能化运维在实际业务场景中的显著成效,强调了其在提升运维效率、降低运营成本方面的关键作用。 ####
41 4
|
16天前
|
数据采集 机器学习/深度学习 人工智能
智能运维在IT管理中的实践与探索
【10月更文挑战第21天】 本文深入探讨了智能运维(AIOps)技术在现代IT管理中的应用,通过分析其核心组件、实施策略及面临的挑战,揭示了智能运维如何助力企业实现自动化监控、故障预测与快速响应,从而提升整体运维效率与系统稳定性。文章还结合具体案例,展示了智能运维在实际环境中的显著成效。
39 4
|
25天前
|
运维 监控 安全
自动化运维的利剑:Ansible在现代IT架构中的应用
在数字化浪潮中,企业对IT系统的敏捷性和可靠性要求日益提高。Ansible,一种简单但强大的自动化运维工具,正成为现代IT架构中不可或缺的一部分。它通过声明式编程语言YAM,简化了系统配置、应用部署和任务自动化的过程,显著提升了运维效率和准确性。本文将深入探讨Ansible的核心特性、应用场景以及如何有效整合进现有IT环境,为读者揭示其在自动化运维中的实用价值和未来发展潜力。
|
18天前
|
机器学习/深度学习 运维 监控
智能化运维:从自动化到AIOps的演进之路####
本文深入探讨了IT运维领域如何由传统手工操作逐步迈向高度自动化,并进一步向智能化运维(AIOps)转型的过程。不同于常规摘要仅概述内容要点,本摘要将直接引入一个核心观点:随着云计算、大数据及人工智能技术的飞速发展,智能化运维已成为提升企业IT系统稳定性与效率的关键驱动力。文章详细阐述了自动化工具的应用现状、面临的挑战以及AIOps如何通过预测性分析和智能决策支持,实现运维工作的质变,引领读者思考未来运维模式的发展趋势。 ####
|
18天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:从自动化到AIOps的演进与实践####
本文探讨了智能运维(AIOps)的崛起背景,深入分析了其核心概念、关键技术、应用场景及面临的挑战,并对比了传统IT运维模式,揭示了AIOps如何引领运维管理向更高效、智能的方向迈进。通过实际案例分析,展示了AIOps在不同行业中的应用成效,为读者提供了对未来智能运维趋势的洞察与思考。 ####
43 1
|
21天前
|
数据采集 机器学习/深度学习 人工智能
智能运维在IT管理中的实践与探索####
【10月更文挑战第21天】 本文深入探讨了智能运维(AIOps)技术在现代IT管理中的应用,通过分析其核心组件、实施策略及面临的挑战,揭示了智能运维如何助力企业实现自动化监控、故障预测与快速响应,从而提升整体运维效率与系统稳定性。文章还结合具体案例,展示了智能运维在实际环境中的显著成效。 ####
|
25天前
|
数据采集 机器学习/深度学习 运维
智能运维在IT服务管理中的实践与挑战####
本文深入探讨了智能运维(AIOps)在现代IT服务管理中的应用,通过分析其如何提升效率、预测故障并优化资源分配,阐述了智能运维的实施策略与面临的主要挑战。不同于传统摘要,本部分旨在直接概述文章的核心观点与结论,为读者提供快速了解全文主旨的窗口。
|
26天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:AI在IT运维中的应用与挑战###
本文探讨了人工智能(AI)技术在IT运维领域的应用现状、具体实现方式及其面临的挑战。通过分析AI如何优化故障预测、自动化处理和资源管理,文章旨在揭示AI赋能下运维工作的变革潜力与实践难题,为读者提供对智能化运维趋势的深刻理解。 ###