OpenStack建设企业私有云要解决五大问题

简介:

OpenStack已经成为一种趋势,但发行版OpenStack尚不完美,企业要建成私有云必须预先充分了解发行版OpenStack的缺点,并寻求专业OpenStack提供商的帮助与合作,才能扬长避短,真正发挥OpenStack的优势,建成最大化企业竞争优势的私有云。

OpenStack在企业里如何用好?还有哪些问题需要着重解决?OpenStack在企业里怎么才能用好?开发人员认为是使用姿势的问题;用户认为要稳定可靠,不能老宕机;老板认为多招几个牛X的开发和运维就可以搞定。

其实OpenStack在商用中存在的问题,主要在以下五个方面:稳定性、完整性、高可用性、易用性、双活和容灾。

先说稳定性。一个好的产品,性能并不是第一要素,稳定性对企业来说才是最重要的。

a.OpenStack在扩展性和稳定性上还远远不足,需要精心打磨。

从几十台增长到上千台甚至上万台,是否还可以一如既往的稳定工作不出问题?实践证明,随着规模的扩大,整体架构需要在稳定性方面做足功课。

比如需设计多个NOVA API和多个镜像、负载均衡和节点高可用、数据库的并发响应。

另外在社区中被吐槽最多的升级问题——Nova,Swift,Cinder和Neutron分别使用各自的数据库存储配置信息,要升级就要修改多个数据库schema,做不到热升级(在H版后升级问题得到改善)。

再如,某企业在部署网络服务(Neutron)时,遇到了噩梦般的经历,不得不重写网络组件的代码才能达到大规模应用的要求。

b.OpenStack缺乏完整性。

一个成熟的云平台应提供计算、存储、网络、安全、数据库、大数据、中间件、DevOps、监控运维等多种云产品。OpenStack只能提供计算、存储、网络三种云产品,如果企业客户需要信息安全保护的产品,则必须自助信息安全平台,集成第三方的产品。再比如大数据分析,通过Sahara可以快速部署Hadoop集群,那又怎么打通OpenStack和Hadoop之间的账户、安全、管理和运维监控体系?

c.OpenStack的虚拟机级别的高可用做的还不好。

目前并没有官方声明OpenStack支持虚拟机级别的高可用性,这个特性在Folsom版本被提出,但是后续又被放弃了。

目前 OpenStack有一个孵化项目Evacuate, 其作用是为OpenStack提供虚拟机级别高可用支持。Evacuate目前只能是管理员手动发起,Evacuate没有考虑VM的部署属性,导致资源调度策略失效。主机名的变化会导致nova-compute重启过程中误删所有虚拟机,这个问题的产生主要是因为Evacuate的清理机制。这个BUG在L版中得到修复。

d.OpenStack的易用性还不够好。

通过FUEL,可以实现OpenStack快速安装,但很多配置操作还需要命令行,离自动化部署一键交付还有距离。再例如OpenStack上用的比较广泛的CEPH分布式存储系统,目前还没有实现界面化的操作和配置。另外OpenStack还缺乏通用的基础版本。

使用OpenStack不会被厂商锁定,但OpenStack可下载的厂商定制版有20多个,客户的选择非常重要。

e.双活和容灾问题。

大型企业对业务连续性要求比较高,重点核心业务有同城双活和异地容灾的需求。同城双活是指用户关键的业务系统同时在同城的两个数据中心运行,同时为用户提供服务, 当某个数据中心的应用系统出现问题时,有另一个数据中心的应用来持续。

异地容灾,顾名思义就是在不同的地域,构建一套或者多套相同的应用或者数据库,起到灾难后立刻接管的作用。我们看到OpenStack虽然也有单站点(Smaug+Cinder)和跨站点(Smaug+Swift)的备份和恢复方案,但离企业真正的业务双活和异地容灾还相距甚远。

再比如Tricircle实现的跨数据中心级联,还是需要Cinder依靠存储后端自己的能力去进行灾备,Tricircle本身只是作为一个转发中继,为用户找到正确的需要操作的站点,其本身无法实现跨数据中心的容灾功能,这和VMWARE的SRM是不同的。

我们可以看到,在功能的支持方面和具体的细节上,OpenStack与VMware还是有差距的,仍然需要不断进步才能做的更好。但OpenStack作为开源管理框架,设计初衷是好的。随着企业里OpenStack的使用和发展,必将推动和加速它的成熟。

最后就是运维自动化,在大规模云的运维场景下,需要将重复度高的工作,基于监控数据智能决策触发,实现无人参与的自动操作的运维能力,这部分还有待OpenStack发掘。

结语

建设企业私有云的过程不是一蹴而就的,而且这将是持续不断的投入过程,需要在实践中不断摸索前进。在下一个10年,将是云2.0时代,企业是云化的主力代表。展望未来,拥抱开源。在中国,在亚洲,在全球,OpenStack已经成为一种趋势,我们有理由相信在未来三年,OpenStack将成为企业去V首选。


本文转自d1net(转载)

相关文章
|
存储 Java 编译器
鸿蒙开发:ArkTs数据类型
最后一点是,ArkTS不支持any和unknown类型,需要显式指定具体类型,否则会报异常,具体原因是,这是ArkTS的特性之一,那就是使用静态类型;如果程序采用静态类型,即所有类型在编译时都是已知的,那么开发者就能够容易理解代码中使用了哪些数据结构。同时,由于所有类型在程序实际运行前都是已知的,编译器可以提前验证代码的正确性,从而可以减少运行时的类型检查,有助于提升性能。
584 8
鸿蒙开发:ArkTs数据类型
|
弹性计算 Linux 云计算
阿里云操作系统控制台——ECS操作及云计算应用实践
本文详细介绍了云服务器ECS的使用流程,包括开通服务、系统配置、权限管理、组件安装及内存全景诊断等关键步骤。通过开通阿里云操作系统服务、授予RAM用户权限和安装必要组件,可实现对服务器的有效管理与维护。在内存诊断部分,展示了如何发起诊断并解析结果,帮助精准定位内存问题。此外,文章还讲解了利用ECS训练模型的操作方法,从上传文件到终端命令执行,直至完成模型训练。最后总结指出,掌握这些技能不仅提升了对云服务器架构的理解,还为实际业务提供了高效解决方案,展现了ECS在数据处理与分析中的重要价值。
阿里云操作系统控制台——ECS操作及云计算应用实践
|
监控 Linux
Linux查看关机时间
在Linux系统中,如何查看系统什么时候执行了shutdown命令关闭服务器了呢?   方法1:使用 last -x|grep shutdown 查看shutdown的历史记录   [root@mylnx20 log]# last -x|grep shutdown shutdown system down  2.
3242 0
|
15天前
|
人工智能 数据可视化 安全
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
本文详解如何用阿里云Lighthouse一键部署OpenClaw,结合飞书CLI等工具,让AI真正“动手”——自动群发、生成科研日报、整理知识库。核心理念:未来软件应为AI而生,CLI即AI的“手脚”,实现高效、安全、可控的智能自动化。
34803 40
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
|
9天前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
本文介绍了Claude Code终端AI助手的使用指南,主要内容包括:1)常用命令如版本查看、项目启动和更新;2)三种工作模式切换及界面说明;3)核心功能指令速查表,包含初始化、压缩对话、清除历史等操作;4)详细解析了/init、/help、/clear、/compact、/memory等关键命令的使用场景和语法。文章通过丰富的界面截图和场景示例,帮助开发者快速掌握如何通过命令行和交互界面高效使用Claude Code进行项目开发,特别强调了CLAUDE.md文件作为项目知识库的核心作用。
10054 30
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
|
5天前
|
人工智能 JavaScript Ubuntu
低成本搭建AIP自动化写作系统:Hermes保姆级使用教程,长文和逐步实操贴图
我带着怀疑的态度,深度使用了几天,聚焦微信公众号AIP自动化写作场景,写出来的几篇文章,几乎没有什么修改,至少合乎我本人的意愿,而且排版风格,也越来越完善,同样是起码过得了我自己这一关。 这个其实OpenClaw早可以实现了,但是目前我觉得最大的区别是,Hermes会自主总结提炼,并更新你的写作技能。 相信就冲这一点,就值得一试。 这篇帖子主要就Hermes部署使用,作一个非常详细的介绍,几乎一步一贴图。 关于Hermes,无论你赞成哪种声音,我希望都是你自己动手行动过,发自内心的选择!
2027 21
|
27天前
|
人工智能 JSON 机器人
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
本文带你零成本玩转OpenClaw:学生认证白嫖6个月阿里云服务器,手把手配置飞书机器人、接入免费/高性价比AI模型(NVIDIA/通义),并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿,5分钟完成热点→文章全流程!
45691 155
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
下一篇
开通oss服务