别盲目崇拜大数据

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

华东师范大学社会学研究所所长、教授文军在《人民日报》撰文指出,作为新发明和新服务的源泉,大数据正在改变人类的生活乃至理解世界的方式。但我们不应盲目崇拜,而要正视潜藏的风险和挑战,避免在大数据的洪流中迷失。

一要防止大数据的“去人性化”忽视人的主体价值和数据的社会文化意义。如果人及其各类社会行为都仅仅被看作一个个数据符号,我们就很难从中解读出充满朝气、富有激情的人,也就很难从数据塑造出来的没有个性特征的人去推导群体样态和社会构成。现在一些大数据研究存在的一个重大缺陷是,它只关注“客观数据”的呈现,而缺少对“主观数据”的反映。从社会学角度看,所有数据说到底都是有关“人”的符号。而符号所蕴含的社会文化意义,是我们真正需要了解和掌握的内容。

二要防止大数据的“巨量化”强化数据霸权。大数据的复杂性不仅在于其数据样本巨量,更在于其多源异构、多实体和多空间之间的交互动态性。当前只有少数人掌握处理这种复杂的巨量化大数据的技术,因此容易导致“数据暴力”。如何防止大数据霸权,是一个需要认真对待的问题。

三要防止大数据的“碎片化”导致人们难以系统认知复杂事物。当前,许多数据仅停留在“碎片化”阶段而难以被真正挖掘和分析。对这些碎片化的数据进行清理,进而形成规整的结构,是大数据能够得到充分利用的根本所在。在大数据中,其研究范式重在发现而不是推论;不是像传统的社会调查方法那样通过假设检验来进行推论,而应通过数据的总体归纳来达成对社会现象的总体分析。这不仅要求我们在数据清理技术、存储结构上进行优化,而且要在数据采集环节尽可能做到规范。

四要防止大数据的“模糊化”产生大量信息垃圾,从而为数据造假和不当传播打开方便之门。在大数据时代,我们想要获取的信息资源可能只占数据总体的万分之一甚至更少。从这个角度说,大量的信息其实都是垃圾。不仅如此,许多大数据本身就是模糊的,其中含有虚假和有害的内容。如果纯粹凭借数据来判断和分析,甚至不假思索地利用和传播,就会导致许多误判。因此,未经前期调研论证和规范分析所获取的信息,其数据量越大可能越模糊,得到的垃圾信息也就可能越多。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
SQL 机器学习/深度学习 数据可视化
漫谈对大数据的思考(下)
“大数据”已跃升为我们行业中最受炒作的术语之一,但炒作不应使人们忽视这样一个事实,即这是数据在世界上的作用真正重要的转变。
漫谈对大数据的思考(下)
|
存储 数据采集 消息中间件
漫谈对大数据的思考(上)
“大数据”已跃升为我们行业中最受炒作的术语之一,但炒作不应使人们忽视这样一个事实,即这是数据在世界上的作用真正重要的转变。
漫谈对大数据的思考(上)
|
存储 分布式计算 资源调度
大数据1
大数据1
638 0
大数据1
|
SQL 存储 分布式计算
|
人工智能 物联网 大数据
|
分布式计算 数据可视化 大数据
|
分布式计算 数据可视化 大数据