借鉴:
https://www.163.com/dy/article/GVQ6DF8I0511DQI7.html
首先介绍一下什么是对象存储
对象存储是一种数据存储架构,允许您将大量非结构化数据存储在可扩展的对象结构中。它将数据存储为具有元数据和唯一标识符的对象,从而更容易访问该数据。
1.LakeFS
LakeFS 是一种开源数据环境工具,可让您管理基于对象存储的数据湖。这些数据湖是存储库,您可以在其中转储所有结构化和非结构化类型的数据。LakeFS 还集成了许多工具并支持 Amazon S3 和 Google Cloud Storage。此外,它适用于所有主要数据框架,例如 Hive、Spark、Presto、AWS Athena 等。
使用 LakeFS,您可以扩展 PB 级数据,还可以通过其类似于 Git 的分支和版本控制方法向其中添加数据,这使您可以在不破坏数据的情况下添加更新。这种类似于 Git 的方法还有助于轻松撤消数据更改,这使得处理数据更加容易和安全。
您还可以通过查看 LakeFS 文档了解其他特性和功能。
2.Ceph
Ceph 是对象存储、块存储和文件系统的开源平台。它提供与 Amazon 的 S3 REST API 和 OpenStack 的 API Swift 完全兼容的对象存储功能。
Ceph 的对象存储允许您使用本地语言绑定和 Ceph 提供的其他技术轻松访问数据对象。如果您想转变公司的 IT 基础架构及其管理大量非结构化数据的能力,这是一个很好的解决方案。他们还有一些软件库,使用 Java、C、C++、Python、PHP 和其他几个编写的软件能够使用原生 API 的强大功能访问 Ceph 的对象存储系统。
MinIO
MinIO 是一款开源云存储软件,提供高性能分布式对象存储,专为大规模数据基础设施而设计。它与 Amazon S3 API 兼容,并且它在 GitHub 上拥有超过 26,000 颗星,有超过 680 名贡献者在为它工作。
MinIO 服务器存储所有类型的非结构化数据,例如照片、视频、日志文件等。它也可在开源 Apache V2 许可下使用,许多最强大的大数据和机器学习应用程序都使用 MinIO S3 对象存储。您可以在 MinIO 网站上查看许多其他功能。
4.OpenIO
OpenIO 是一种开源对象存储解决方案,用于管理和保护大量非结构化数据。它允许您构建和操作具有弹性且安全的大规模存储基础架构。
OpenIO 与 S3 兼容,可以在任何硬件上部署或云托管。添加新硬件时也不需要重新分配数据;您可以立即使用额外的容量。OpenIO 还专为大规模基础设施和大数据工作负载而设计。除此之外,它还提供了一个直观的用户界面来简化存储管理员的日常生活。因此,您的数据变得非常易于访问且易于管理。
5.Apache Ozone
Ozone是Hadoop的可扩展、冗余和分布式对象存储。除了可以扩展到数十亿个大小不等的物体之外,Ozone还可以在Kubernetes和YARN等容器环境中有效发挥作用。使用ApacheSpark、Thread和Hive等框架的应用程序在本地运行,无需任何修改。Ozone建立在一个名为Hadoop分布式数据存储(HDD)的高可用复制块存储层上。Ozone现在已经普遍可用(GA),版本为1.2.1。