OpenStack建设企业私有云要解决五大问题

简介:

OpenStack已经成为一种趋势,但发行版OpenStack尚不完美,企业要建成私有云必须预先充分了解发行版OpenStack的缺点,并寻求专业OpenStack提供商的帮助与合作,才能扬长避短,真正发挥OpenStack的优势,建成最大化企业竞争优势的私有云。

OpenStack在企业里如何用好?还有哪些问题需要着重解决?OpenStack在企业里怎么才能用好?开发人员认为是使用姿势的问题;用户认为要稳定可靠,不能老宕机;老板认为多招几个牛X的开发和运维就可以搞定。

其实OpenStack在商用中存在的问题,主要在以下五个方面:稳定性、完整性、高可用性、易用性、双活和容灾。

先说稳定性。一个好的产品,性能并不是第一要素,稳定性对企业来说才是最重要的。

a.OpenStack在扩展性和稳定性上还远远不足,需要精心打磨。

从几十台增长到上千台甚至上万台,是否还可以一如既往的稳定工作不出问题?实践证明,随着规模的扩大,整体架构需要在稳定性方面做足功课。

比如需设计多个NOVA API和多个镜像、负载均衡和节点高可用、数据库的并发响应。

另外在社区中被吐槽最多的升级问题——Nova,Swift,Cinder和Neutron分别使用各自的数据库存储配置信息,要升级就要修改多个数据库schema,做不到热升级(在H版后升级问题得到改善)。

再如,某企业在部署网络服务(Neutron)时,遇到了噩梦般的经历,不得不重写网络组件的代码才能达到大规模应用的要求。

b.OpenStack缺乏完整性。

一个成熟的云平台应提供计算、存储、网络、安全、数据库、大数据、中间件、DevOps、监控运维等多种云产品。OpenStack只能提供计算、存储、网络三种云产品,如果企业客户需要信息安全保护的产品,则必须自助信息安全平台,集成第三方的产品。再比如大数据分析,通过Sahara可以快速部署Hadoop集群,那又怎么打通OpenStack和Hadoop之间的账户、安全、管理和运维监控体系?

c.OpenStack的虚拟机级别的高可用做的还不好。

目前并没有官方声明OpenStack支持虚拟机级别的高可用性,这个特性在Folsom版本被提出,但是后续又被放弃了。

目前 OpenStack有一个孵化项目Evacuate, 其作用是为OpenStack提供虚拟机级别高可用支持。Evacuate目前只能是管理员手动发起,Evacuate没有考虑VM的部署属性,导致资源调度策略失效。主机名的变化会导致nova-compute重启过程中误删所有虚拟机,这个问题的产生主要是因为Evacuate的清理机制。这个BUG在L版中得到修复。

d.OpenStack的易用性还不够好。

通过FUEL,可以实现OpenStack快速安装,但很多配置操作还需要命令行,离自动化部署一键交付还有距离。再例如OpenStack上用的比较广泛的CEPH分布式存储系统,目前还没有实现界面化的操作和配置。另外OpenStack还缺乏通用的基础版本。

使用OpenStack不会被厂商锁定,但OpenStack可下载的厂商定制版有20多个,客户的选择非常重要。

e.双活和容灾问题。

大型企业对业务连续性要求比较高,重点核心业务有同城双活和异地容灾的需求。同城双活是指用户关键的业务系统同时在同城的两个数据中心运行,同时为用户提供服务, 当某个数据中心的应用系统出现问题时,有另一个数据中心的应用来持续。

异地容灾,顾名思义就是在不同的地域,构建一套或者多套相同的应用或者数据库,起到灾难后立刻接管的作用。我们看到OpenStack虽然也有单站点(Smaug+Cinder)和跨站点(Smaug+Swift)的备份和恢复方案,但离企业真正的业务双活和异地容灾还相距甚远。

再比如Tricircle实现的跨数据中心级联,还是需要Cinder依靠存储后端自己的能力去进行灾备,Tricircle本身只是作为一个转发中继,为用户找到正确的需要操作的站点,其本身无法实现跨数据中心的容灾功能,这和VMWARE的SRM是不同的。

我们可以看到,在功能的支持方面和具体的细节上,OpenStack与VMware还是有差距的,仍然需要不断进步才能做的更好。但OpenStack作为开源管理框架,设计初衷是好的。随着企业里OpenStack的使用和发展,必将推动和加速它的成熟。

最后就是运维自动化,在大规模云的运维场景下,需要将重复度高的工作,基于监控数据智能决策触发,实现无人参与的自动操作的运维能力,这部分还有待OpenStack发掘。

结语

建设企业私有云的过程不是一蹴而就的,而且这将是持续不断的投入过程,需要在实践中不断摸索前进。在下一个10年,将是云2.0时代,企业是云化的主力代表。展望未来,拥抱开源。在中国,在亚洲,在全球,OpenStack已经成为一种趋势,我们有理由相信在未来三年,OpenStack将成为企业去V首选。


本文转自d1net(转载)

相关文章
|
存储 Java 编译器
鸿蒙开发:ArkTs数据类型
最后一点是,ArkTS不支持any和unknown类型,需要显式指定具体类型,否则会报异常,具体原因是,这是ArkTS的特性之一,那就是使用静态类型;如果程序采用静态类型,即所有类型在编译时都是已知的,那么开发者就能够容易理解代码中使用了哪些数据结构。同时,由于所有类型在程序实际运行前都是已知的,编译器可以提前验证代码的正确性,从而可以减少运行时的类型检查,有助于提升性能。
598 8
鸿蒙开发:ArkTs数据类型
|
弹性计算 Linux 云计算
阿里云操作系统控制台——ECS操作及云计算应用实践
本文详细介绍了云服务器ECS的使用流程,包括开通服务、系统配置、权限管理、组件安装及内存全景诊断等关键步骤。通过开通阿里云操作系统服务、授予RAM用户权限和安装必要组件,可实现对服务器的有效管理与维护。在内存诊断部分,展示了如何发起诊断并解析结果,帮助精准定位内存问题。此外,文章还讲解了利用ECS训练模型的操作方法,从上传文件到终端命令执行,直至完成模型训练。最后总结指出,掌握这些技能不仅提升了对云服务器架构的理解,还为实际业务提供了高效解决方案,展现了ECS在数据处理与分析中的重要价值。
阿里云操作系统控制台——ECS操作及云计算应用实践
|
监控 Linux
Linux查看关机时间
在Linux系统中,如何查看系统什么时候执行了shutdown命令关闭服务器了呢?   方法1:使用 last -x|grep shutdown 查看shutdown的历史记录   [root@mylnx20 log]# last -x|grep shutdown shutdown system down  2.
3272 0
|
2天前
|
人工智能 JSON 供应链
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
LucianaiB分享零成本畅用JVS Claw教程(学生认证享7个月使用权),并开源GeoMind项目——将JVS改造为科研与产业地理情报可视化AI助手,支持飞书文档解析、地理编码与腾讯地图可视化,助力产业关系图谱构建。
23277 2
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
|
4天前
|
人工智能 API 开发工具
Claude Code国内安装:2026最新保姆教程(附cc-switch配置)
Claude Code是我目前最推荐的AI编程工具,没有之一。 它可能不是最简单的,但绝对是上限最高的。一旦跑通安装、接上模型、定好规范,你会发现很多原本需要几小时的工作,现在几分钟就能搞定。 这套方案的核心优势就三个字:可控性。你不用依赖任何不稳定服务,所有组件都在自己手里。模型效果不好?换一个。框架更新了?自己决定升不升。 这才是AI时代开发者该有的姿势——不是被动等喂饭,而是主动搭建自己的生产力基础设施。 希望这篇保姆教程,能帮你顺利上车。做出你自己的作品。
6980 13
Claude Code国内安装:2026最新保姆教程(附cc-switch配置)
|
11天前
|
缓存 人工智能 自然语言处理
我对比了8个Claude API中转站,踩了不少坑,总结给你
本文是个人开发者耗时1周实测的8大Claude中转平台横向评测,聚焦Claude Code真实体验:以加权均价(¥/M token)、内部汇率、缓存支持、模型真实性及稳定性为核心指标。
4449 23
|
6天前
|
人工智能 缓存 BI
Claude Code + DeepSeek V4-Pro 真实评测:除了贵,没别的毛病
JeecgBoot AI专题研究 把 Claude Code 接入 DeepSeek V4Pro,跑完 Skills —— OA 审批、大屏、报表、部署 5 大实战场景后的真实体验 ![](https://oscimg.oschina.net/oscnet/up608d34aeb6bafc47f
2572 8
Claude Code + DeepSeek V4-Pro 真实评测:除了贵,没别的毛病