共享有关组织中非结构化数据所发生情况的信息比看起来要困难得多。沟通不畅几乎会对组织的各个方面产生负面影响,从 IT、存储团队和应用程序开发人员一直到业务和其他最终用户。然而,准确、全面地了解您的非结构化数据对于安全、高效、经济且成功地开展业务至关重要。
在长达 40 年的时间里,如何通过文件协议访问非结构化数据,而没有明确的方式来传达有关数据的重要细节?虽然存储团队负责管理平台并且是 数据管理员 对于众多利益相关者而言,他们不是数据所有者。通常,最终用户和应用程序所有者应该负责管理非结构化数据,但这种情况很少发生。所以,最后,没有人最终管理数据。没有其他 IT 领域如此盲目地对其平台做出决策,并让最终用户管理如此大的一部分。
从历史上看,非结构化数据管理使用免费工具来缓慢扫描文件系统并提供容量和文件计数详细信息以供规划。对于每个新的文件树选择,这些工具都会从头开始原始扫描过程,迫使用户等待数小时甚至更长时间才能完成(特别是在大型文件系统上)。之后,抽查各种随机文件上的时间戳。这些组合步骤充其量只能提供一个组织的非结构化数据的模糊视图。
有时,存储供应商的内部工具可以提供更清晰的信息,但即便如此,也只能提供有限的数据细节。在具有多个存储平台供应商的环境中,它甚至更加复杂。最后,如果 IT 决定删除或存档系统中的数据,则很少成功的搜索会开始尝试识别数据的所有者。实际上,没有人知道公司的数据“垃圾抽屉”中有什么,也没有人对此负责。非结构化数据的清晰度和清晰报告的缺乏使得在功能上无法在整个组织内进行管理和沟通。没有通信,数据将继续以指数速度增长,使问题越来越严重。
值得庆幸的是,那里有解决方案。组织应该寻求聘请供应商,以提供对非结构化数据的可见性并向所有相关利益相关者提供报告。此外,允许您组织和处理数据的解决方案可以帮助团队为非结构化数据实施生命周期管理策略。当 IT 可以快速获取有关顶级用户和组的消费能力的详细信息时,所有者已离开的数据(孤立数据)、数据集和相关排放的成本以及数据的年龄,然后才能采取实际行动。标记数据是另一种有用的查找能力,因此团队可以组织和分配数据集的所有权。自定义报告还允许对 元数据 和分配的标签。
帮助公司了解非结构化数据的解决方案使他们能够就他们需要的信息与 IT 管理、数据所有者以及存储、合规性和安全团队进行沟通。这样,就可以进行更有教育意义的讨论。从头开始设计的产品可在企业中大规模运行,与供应商无关,使组织能够对其非结构化数据采取行动,无论这些数据位于何处。有效和准确地交流数据是管理数据的第一步,管理数据可以为您的整个组织带来巨大的改进。
更多内容请关注 OushuDB 小课堂