《社会调查数据管理——基于Stata 14管理CGSS数据》一3.2 和统计有关的术语

本文涉及的产品
数据管理 DMS,安全协同 3个实例 3个月
推荐场景:
学生管理系统数据库
简介:

本节书摘来自异步社区《社会调查数据管理——基于Stata 14管理CGSS数据》一书中的第3章,第3.2节,作者 唐丽娜,更多章节内容可以访问云栖社区“异步社区”公众号查看

3.2 和统计有关的术语

和数据管理密不可分的另一个专业是统计学。

在信息数据时代,每个人都要具备一定的统计学知识[1]。否则可能因为无法读懂数据、统计分析结果而错失良机,也有可能错误地解读各种数据,给个人生活和工作造成不便。

统计,即把数字统一起来计算。统计是一门关于数字的学科,包括统计描述和统计推断。所谓统计描述,指的是对原始数据进行概括总结的方法,而统计推断指的是基于样本数据来推断总体的某些特征或趋势的方法。

接下来介绍的都是和数据管理有关的统计学基础知识。

在统计学中,变量(variable)指的是要调查或测量的对象的某种特征或属性,如性别、年龄、受教育程度、态度等。

取值(value):指的是调查对象某种特征或属性的全部可能。取值不一定都是数字,也可以是文字,如性别的取值是男性和女性。

统计量(statistics):对抽样数据进行统计计算得出的数值,如平均值(mean)、总和(sum)、最大值(max value)、最小值(min value)。

参数(parameter):对研究总体进行统计计算得出的数值。

总体(population):要研究或调查的对象的全体。比如,要调查某个公司的员工平均收入,那么总体就是现在就职于该公司的所有员工。

样本(sampling):总体的一个子集。比如,要调查某跨国公司的员工平均收入,这个公司非常庞大,员工有几万人,且分布在世界各地,可以采用科学的抽样方法从中抽取3000人作为一个样本,只调查这3000名员工的收入情况。

信度(reliability):指的是测量方法的质量,即对同一现象进行重复观察是否可以得到相同的资料(艾尔·芭比,2014)。在社会调查中,信度和社会调查人员的工作质量息息相关(虚假数据的信度为零),严格按照调查项目的规定工作,方能保证执行过程的信度。社会调查数据采集完成后,科学、客观的数据管理是确保数据信度的有效方法。在社会调查中,常见的测量数据信度的方法是对分法,即把数据随机等分成两份,看两组数据的统计结果是否很接近,如果差异很大,测量信度就有可能有问题。

效度(validity):指的是实证社会调查问卷中的问题在多大程度上反映了要研究问题的真实含义。有效性关注的是提出的问题、收集的数据以及数据分析的正确性[2]。效度是研究设计优劣的一个非常重要的指标,很多研究耗费了大量的研究经费、调查了大量的研究对象,但研究问题并没有很好地测量到想要研究的问题或感兴趣的点,这样的研究和研究数据的效度就很低。

常见的检验效度有效性的标准有表面效度、标准关联效度、建构效度和内容效度[3]。

信度和效度是一对相互关联的概念,好的研究和数据必须效度和信度都要高。

均值(mean):调查对象某个特征(如收入)的总体平均情况,用数值表述是某个变量的算术平均值,类别变量(如性别)没有均值,即使能够算出一个均值,这个均值也没有实际意义。

众数(mode):调查对象在某个特征上出现次数最多的一种情况,用数值表述是某个变量有多个取值,调查对象选择次数最多的那个值就是众数。

中位数(median):是一个位置值,指的是位于中间(N/2或50%)的那个调查对象选择的取值。把调查对象在某个特征上(如收入)的所有可能出现的情况排序,位于第50%个位置上的人选择的特征(某一特定收入)就是中位数。用数值表述是把变量的取值按顺序排列,并列出每个取值出现的频数,第50%所在的取值就是中位数。

分位数(quartile):也是一个位置值,指的是第几个百分位数,和中位数的计算方法一样,中位数是分位数的一种,即中间分位数,常见的有上四分位数——25%分位数,下四分位数——75%分位数。其中下四分位数和上四分位数的差就是分位数差。

标准差(standard deviation):调查对象在某个特征上(如收入)的差异情况。用数值表述就是某个变量的均值减去每个取值的差的平方和,然后除以调查对象个数,再取平方根,这个平方根就是标准差,这个统计量只能用于定量变量。

数据管理和数据分析离不开统计,统计量是检验数据清理、数据分析的重要标准,数据管理人员必须掌握基础的统计知识。市面上的统计书籍已经相当丰富,且分门别类的十分详尽,如社会统计学、医学统计学、生物统计学等,可以根据自己的专业和工作需要选择阅读。

相关实践学习
MySQL基础-学生管理系统数据库设计
本场景介绍如何使用DMS工具连接RDS,并使用DMS图形化工具创建数据库表。
相关文章
|
3月前
|
物联网 数据管理 Apache
拥抱IoT浪潮,Apache IoTDB如何成为你的智能数据守护者?解锁物联网新纪元的数据管理秘籍!
【8月更文挑战第22天】随着物联网技术的发展,数据量激增对数据库提出新挑战。Apache IoTDB凭借其面向时间序列数据的设计,在IoT领域脱颖而出。相较于传统数据库,IoTDB采用树形数据模型高效管理实时数据,具备轻量级结构与高并发能力,并集成Hadoop/Spark支持复杂分析。在智能城市等场景下,IoTDB能处理如交通流量等数据,为决策提供支持。IoTDB还提供InfluxDB协议适配器简化迁移过程,并支持细致的权限管理确保数据安全。综上所述,IoTDB在IoT数据管理中展现出巨大潜力与竞争力。
108 1
|
4月前
|
SQL NoSQL 数据管理
数据管理DMS使用问题之如何批量导入MongoDB的数据文件
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。
|
22天前
|
关系型数据库 分布式数据库 数据库
云栖大会|从数据到决策:AI时代数据库如何实现高效数据管理?
在2024云栖大会「海量数据的高效存储与管理」专场,阿里云瑶池讲师团携手AMD、FunPlus、太美医疗科技、中石化、平安科技以及小赢科技、迅雷集团的资深技术专家深入分享了阿里云在OLTP方向的最新技术进展和行业最佳实践。
|
1月前
|
存储 人工智能 安全
【荣誉奖项】荣获2024数据治理优秀产品!瓴羊Dataphin联合DAMA发布数据管理技能认证
瓴羊Dataphin连续俩年获得DAMA年度优秀数据治理产品奖,本次与DAMA联合发布“DAMA x 瓴羊 数据管理技能认证”,助力提升全民数据素养。
148 0
【荣誉奖项】荣获2024数据治理优秀产品!瓴羊Dataphin联合DAMA发布数据管理技能认证
|
1月前
|
数据采集 安全 数据管理
通信行业数据治理:如何实现高效、安全的数据管理?
在未来的发展中,通信行业的企业应加强数据治理意识,提高数据治理能力;同时,积极开展跨行业的合作创新,共同推动行业的繁荣与发展。相信在不久的将来,通信行业将迎来更加美好的明天。
|
3月前
|
JSON 数据管理 关系型数据库
【Dataphin V3.9】颠覆你的数据管理体验!API数据源接入与集成优化,如何让企业轻松驾驭海量异构数据,实现数据价值最大化?全面解析、实战案例、专业指导,带你解锁数据整合新技能!
【8月更文挑战第15天】随着大数据技术的发展,企业对数据处理的需求不断增长。Dataphin V3.9 版本提供更灵活的数据源接入和高效 API 集成能力,支持 MySQL、Oracle、Hive 等多种数据源,增强 RESTful 和 SOAP API 支持,简化外部数据服务集成。例如,可轻松从 RESTful API 获取销售数据并存储分析。此外,Dataphin V3.9 还提供数据同步工具和丰富的数据治理功能,确保数据质量和一致性,助力企业最大化数据价值。
183 1
|
3月前
|
Java 测试技术 容器
从零到英雄:Struts 2 最佳实践——你的Web应用开发超级变身指南!
【8月更文挑战第31天】《Struts 2 最佳实践:从设计到部署的全流程指南》深入介绍如何利用 Struts 2 框架从项目设计到部署的全流程。从初始化配置到采用 MVC 设计模式,再到性能优化与测试,本书详细讲解了如何构建高效、稳定的 Web 应用。通过最佳实践和代码示例,帮助读者掌握 Struts 2 的核心功能,并确保应用的安全性和可维护性。无论是在项目初期还是后期运维,本书都是不可或缺的参考指南。
51 0
|
3月前
|
SQL 存储 数据管理
掌握SQL Server Integration Services (SSIS)精髓:从零开始构建自动化数据提取、转换与加载(ETL)流程,实现高效数据迁移与集成——轻松上手SSIS打造企业级数据管理利器
【8月更文挑战第31天】SQL Server Integration Services (SSIS) 是 Microsoft 提供的企业级数据集成平台,用于高效完成数据提取、转换和加载(ETL)任务。本文通过简单示例介绍 SSIS 的基本使用方法,包括创建数据包、配置数据源与目标以及自动化执行流程。首先确保安装了 SQL Server Data Tools (SSDT),然后在 Visual Studio 中创建新的 SSIS 项目,通过添加控制流和数据流组件,实现从 CSV 文件到 SQL Server 数据库的数据迁移。
215 0
|
4月前
|
运维 数据管理 数据库
数据管理DMS操作报错合集之数据归档时,遇到报错:"DMS获取内容为空,无须备份",该怎么办
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。
|
5月前
|
SQL 关系型数据库 数据管理
数据管理DMS产品使用合集之归档数据至其它MySQL数据库时,如何指定目的库
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。
74 1
下一篇
无影云桌面