机制 | 治理大数据可信度价值

简介:

大数据的利用价值取决于元数据的可靠程度。

一方面,中国现阶段由于数据管理的相关法律欠缺,加之法律层面没有将企业、政府甚至个人所拥有的合法数据界定为其重要资产,并且社会文化中收集、管理数据的意识不够,不重视对数据的保存和利用,从而忽视保护数据的真实性等,以上种种原因直接导致未来使用大数据的可信度。

另一方面,大量从社交媒体、社区互动等数据源收集来的数据,本身不一定可靠。很多信息发布随意性强,公开的数据找不到数据引用来源,有些个人或企业受利益驱使,刻意伪造数据等。这些都构成大数据使用过程中的障碍。

解决方案可以从依法保护各种公共数据的真实性,制定政策促进和鼓励企业、政府机构通过市场机制对各自拥有和掌握的数据进行买卖、交易等活动入手,从而带动全社会重视各种数据的真实性和可靠性。试想,谁会花大价钱去买假数据或水分很高的数据呢?企业拥有真实的数据,建立了可信赖的品牌效应,它就拥有了大数据的专业市场。这个就是市场机制倒逼个人、企业和政府机构对数据采取诚信负责的态度,促使政府依法惩处数据造假、篡改数据等非法行为,最终从文化、习惯和日常行为上减少和杜绝各种数据欺诈行为。

大数据可靠性是所有国家面临的挑战,非中国特有。例如美国石油研究院及其游说团体,为了推动一个从加拿大阿尔伯塔到得克萨斯州的石油项目立项,刻意利用推特这个社交平台造势,造成好像几十万用户都一边倒地支持这个项目的印象,试图以此影响政府决策,结果最终被高人识破,露出马脚。证据就是很多“支持”来自临时注册的水军账户,这些“用户”平时在社交平台上不活跃,仅仅在短时间内使得“支持率”大幅度攀升。如果仅靠这种被刻意扭曲了的“社会舆情数据”来做政府决策显然不靠谱。好在在美国,由于类似做法的组织者(例如企业、机构等)要为此承担相应的法律责任(公开欺诈罪和误导罪),加之雇用大量水军人工成本太高,这种行为无论从法律还是经济的角度来看都不可能长久。

长久以来,政府机构、企业多方收集各种数据,以满足自身业务的需求,而这些数据往往淹没在该组织的内部系统里,大多时候并没有充分利用和管理起来,慢慢就形成了人为的数据割据与封锁。政府、企业对内没有进行数据挖掘工作,对外又拒绝数据分享,最终直接导致整个社会大数据重复储存,无法整合,利用率低下,或者无法共享专业大数据。

在美国,类似的问题也很突出。据麦肯锡全球研究院估计,以医疗管理行业为例,由于同样的病人数据同时储存于医院、诊所、保险公司等不同地方,在无法即时分享数据的情况下,同样的数据又经过不同机构的病人管理系统、承销系统、索赔管理系统、供应商系统等进行操作,仅此重复程序和管理造成的直接行政费用一年就高达1000亿到1500亿美元。

要使得全社会可以依法使用、分享储存于各种政府机构互不关联的公共数据,最终还是要靠法律和规章,包括申诉程序。要提高全社会现有大数据的利用率,需要政府和企业通力合作。对政府而言,可以马上做到的就是在保障国家安全和公民个人隐私的前提下,依法开放公共数据,进而通过推出以数据创新为基础的公共服务,向企业和社会个人销售数据产品。政府可以支持鼓励国有企业依法对公众出售其有商业价值的数据。对企业而言,可以通过合法的途径和方式获取、收集、购买数据产品,进行数据交易。最终市场机制使数据依法在全社会自由流动,创造出最大社会价值。
本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
8天前
|
存储 SQL 分布式计算
闲侃数仓优化-大数据治理和优化
闲侃数仓优化-大数据治理和优化
22 0
|
7天前
|
数据采集 存储 监控
大数据治理:确保数据质量和合规性
【5月更文挑战第30天】大数据治理涉及数据分类、访问控制和质量监控,以确保数据安全和合规性。企业需保护个人隐私,防止数据泄露,并遵守各地法规,如GDPR和CCPA。技术实践包括数据加密、匿名化和严格访问控制。管理策略则强调制定政策、员工培训和法律合作。全面的数据治理能保障数据质量,驱动组织的创新和价值增长。
32 0
|
7天前
|
存储 分布式计算 算法
大数据处理:挖掘价值之道
大数据处理:挖掘价值之道
|
8天前
|
存储 数据采集 算法
大数据平台治理——运营的角度看数仓
大数据平台治理——运营的角度看数仓
13 0
|
8天前
|
存储 SQL 分布式计算
大数据平台治理资源成本化
大数据平台治理资源成本化
14 0
|
22天前
|
存储 数据可视化 大数据
大数据分析与处理:探索数据的深层价值
大数据分析与处理:探索数据的深层价值
46 2
|
22天前
|
存储 监控 大数据
数据仓库(11)什么是大数据治理,数据治理的范围是哪些
什么是数据治理,数据治理包含哪些方面?大数据时代的到来,给了我们很多的机遇,也有很多的挑战。最基础的调整也是大数据的计算和管理,数据治理是一个特别重要的大数据基础,他保证着数据能否被最好的应用,保证着数据的安全,治理等。那么数据治理到底能治什么,怎么治?
97 0
|
22天前
|
存储 数据采集 机器学习/深度学习
大数据分析:挖掘数据价值的技术和方法
在数字化时代,大数据已经成为企业和科研机构的重要资源之一。然而,对于海量的数据如何进行分析和挖掘却是一个巨大的挑战。本文将介绍大数据分析的基本概念、技术和方法,帮助读者了解如何利用现代技术和工具,挖掘数据中蕴藏的价值。
202 0
|
22天前
|
人工智能 安全 大数据
喜报|瓴羊Dataphin入选上海市经信委2023创新攻关成果、IDC企业大数据治理研究代表产品
喜报|瓴羊Dataphin入选上海市经信委2023创新攻关成果、IDC企业大数据治理研究代表产品
|
7月前
|
大数据
数据治理专业认证CDMP学习笔记(思维导图与知识点)- 第14章大数据与数据科学篇
数据治理专业认证CDMP学习笔记(思维导图与知识点)- 第14章大数据与数据科学篇

热门文章

最新文章