《社会调查数据管理——基于Stata 14管理CGSS数据》一3.5 中国综合社会调查

本文涉及的产品
数据管理 DMS,安全协同 3个实例 3个月
推荐场景:
学生管理系统数据库
简介:

本节书摘来自异步社区《社会调查数据管理——基于Stata 14管理CGSS数据》一书中的第3章,第3.5节,作者 唐丽娜,更多章节内容可以访问云栖社区“异步社区”公众号查看

3.5 中国综合社会调查

中国综合社会调查(China General Social Survey,CGSS)始于2003年,是一项大型学术研究调查项目。CGSS发源于美国的GSS(General Social Survey,GSS),GSS是美国民意调查中心(National Opinion Research Center, NORC)运行时间最长的一个调查项目,该调查项目在全世界都享有盛誉,是国际社会调查界的旗舰。自1972年开始,该项目旨在通过收集当下美国社会的数据,来考察美国的社会变迁,研究美国社会日益增加的复杂性,解释人们的态度、行为和特征的变化趋势,考察整个社会的结构和功能,以及次级群体在社会中扮演的角色,进行国际比较。GSS的另一个目的是生产出高质量的数据,而且所有的学者、政策制定者及其他相关人员都能以最低的成本和等待时间来获取GSS数据(http://gss.norc.org/)。在美国,除了美国人口普查数据,GSS数据是社会科学界使用频率最高的一个数据来源。

为了给社会科学界提供一项高质量的社会调查数据,中国人民大学社会学系的李路路教授和当时在香港科技大学的边燕杰教授决心做中国自己的GSS,为学术界提供一个全国范围的、随机抽样的、高质量的调查数据。自2003年开始截止到本书出版前,一共完成11次调查。在第一个周期里,共完成5年调查,分别是2003、2004、2005、2006和2008年,除2004年的数据外,剩下4年的数据都已向全社会免费公开,用户可以到中国国家调查数据库(China National Survey Data Archive,CNSDA)注册下载。第二个周期计划从2010~2019年,为期10年,截止到2015年共完成6次调查,其中2010、2011、2012、2013共4年的数据也已经在CNSDA的网站上免费发布。

CGSS采用多阶段、分层次、随机抽样方法,获取的数据在全国范围具有代表性,但不能在省份这个层面上有代表性,因此不能用CGSS数据做31个省份之间的比较。

CGSS的问卷由两个部分构成:主体模块(primary module,即A部分)和主题模块(topic module,即B-Z部分)。历年的调查问卷中都包含A部分,不同之处在主题模块,见表3-4。


b01f478acad4fe000b1ac4590434af87e69c3fe6


e63f80ee2ad50f2c929590870152be6685a83515


d6e6a7b224fa9fd7b4287b49bd35c685c8710a8e


00d7a78641901657f1976af4bb2e384718d4d7ea


8b9a30dfb680e90a8b49bbf611d2818239c401c6


f39b76fb8a010cb4833a3eb05d5f3c861c514f69


071ef6bc7b0c77ac69c1d812cb1c9a9c5096bba0


972d2eeab7e602ff6c201c25954b3b31496f5716


8b85b26cb77776880fd9e4ea80800c1cbd615bea


28fe8a640a84341d3493206b02f1f76516546507


7ef95fa335221c64109dc057a23cbdd800ebe18d

使用CGSS数据的注意事项:

(1)样本代表性。CGSS采用多阶分层随机抽样方法,收集上来的数据只能用于推论全国,无法用于推论各省份。切记:不要用CGSS数据做分省份比较研究。

(2)样本量。同一年度的CGSS数据,在不同模块上的样本量可能不一样。CGSS的问卷结构是:主体模块 + 主题模块。其中主体模块是全样本数据,但主题模块的样本只是总样本中的一个子样本。也就是说,在全部调查对象中,所有人都会回答主体模块的问题,但只有一部分人会回答主题模块的问题(如CGSS2006的城乡居民数据有10151条数据,EASS模块——家庭模块——则只有3208条数据),而且不同的主题模块回答的人数也有微小差异(如CGSS2010的城乡居民数据有11783条数据,回答M部分——健康模块——的样本有3866个,而回答N部分——宗教模块——的样本有4231个)。

(3)变量名。为方便查阅数据,CGSS历年数据的变量名都以其对应的问卷中的题号为命名基准,这样的命名方式也方便用户把数据和问卷对应起来。

(4)职业和行业编码。为了更加准确地测量调查对象的行业和职业,对这两个变量CGSS采用间接测量的方法,具体操作方法是:在历年调查中,行业和职业都是开放题,由访问员把被访者从事的行业相关信息和职业相关信息填入相应的空格上,如下所示:

A59d. 您目前工作的具体职业是:

    具体职业名称[              ]

    具体工作内容[              ]

          [              ]

根据收集的文本资料,基于ISCO88,由至少2名专业人员进行编码,把文本资料转换成定量资料,以便研究者使用和分析。CGSS 项目组只发布编好码的行业和职业,不公布相应的开放题。

[1] 中国的小学数据课本中就包含了统计、调查等方面的基础知识。

[2]马丁•丹斯考姆. 做好社会研究的10个关键[M]. 杨子江,译. 北京:北京大学出版社,2008.

[3]这4个效度的详细内容,请参阅《社会研究方法(第11版)》的第146~147页,【美】艾尔•芭比著,邱泽奇译. 华夏出版社,2014

[4]//是给stata命令本身添加注释的一种方法,如果想给某条命令加注释,就可以在这条命令后面输入空格+//+注释。

[5]星号+注释是一种给do文件加注释的方法。

[6]不同版本的Stata能保存的最大字符数有差异,比如在Stata 12中,字符型变量最多只能保存244个字符,但是在Stata14中,字符型变量最多能保存2000000000个字符,而且还能保存二进制数。用户在创建变量时一定要注意,不要因为存储空间不足导致字符型数据丢失。

[7]通常的叫法是:if条件,in范围。

[8]在Stata的命令中,井号“#”代表数字。

相关实践学习
MySQL基础-学生管理系统数据库设计
本场景介绍如何使用DMS工具连接RDS,并使用DMS图形化工具创建数据库表。
相关文章
|
3月前
|
物联网 数据管理 Apache
拥抱IoT浪潮,Apache IoTDB如何成为你的智能数据守护者?解锁物联网新纪元的数据管理秘籍!
【8月更文挑战第22天】随着物联网技术的发展,数据量激增对数据库提出新挑战。Apache IoTDB凭借其面向时间序列数据的设计,在IoT领域脱颖而出。相较于传统数据库,IoTDB采用树形数据模型高效管理实时数据,具备轻量级结构与高并发能力,并集成Hadoop/Spark支持复杂分析。在智能城市等场景下,IoTDB能处理如交通流量等数据,为决策提供支持。IoTDB还提供InfluxDB协议适配器简化迁移过程,并支持细致的权限管理确保数据安全。综上所述,IoTDB在IoT数据管理中展现出巨大潜力与竞争力。
100 1
|
4月前
|
SQL NoSQL 数据管理
数据管理DMS使用问题之如何批量导入MongoDB的数据文件
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。
|
2天前
|
关系型数据库 分布式数据库 数据库
云栖大会|从数据到决策:AI时代数据库如何实现高效数据管理?
在2024云栖大会「海量数据的高效存储与管理」专场,阿里云瑶池讲师团携手AMD、FunPlus、太美医疗科技、中石化、平安科技以及小赢科技、迅雷集团的资深技术专家深入分享了阿里云在OLTP方向的最新技术进展和行业最佳实践。
|
17天前
|
存储 人工智能 安全
【荣誉奖项】荣获2024数据治理优秀产品!瓴羊Dataphin联合DAMA发布数据管理技能认证
瓴羊Dataphin连续俩年获得DAMA年度优秀数据治理产品奖,本次与DAMA联合发布“DAMA x 瓴羊 数据管理技能认证”,助力提升全民数据素养。
127 0
【荣誉奖项】荣获2024数据治理优秀产品!瓴羊Dataphin联合DAMA发布数据管理技能认证
|
29天前
|
数据采集 安全 数据管理
通信行业数据治理:如何实现高效、安全的数据管理?
在未来的发展中,通信行业的企业应加强数据治理意识,提高数据治理能力;同时,积极开展跨行业的合作创新,共同推动行业的繁荣与发展。相信在不久的将来,通信行业将迎来更加美好的明天。
|
3月前
|
JSON 数据管理 关系型数据库
【Dataphin V3.9】颠覆你的数据管理体验!API数据源接入与集成优化,如何让企业轻松驾驭海量异构数据,实现数据价值最大化?全面解析、实战案例、专业指导,带你解锁数据整合新技能!
【8月更文挑战第15天】随着大数据技术的发展,企业对数据处理的需求不断增长。Dataphin V3.9 版本提供更灵活的数据源接入和高效 API 集成能力,支持 MySQL、Oracle、Hive 等多种数据源,增强 RESTful 和 SOAP API 支持,简化外部数据服务集成。例如,可轻松从 RESTful API 获取销售数据并存储分析。此外,Dataphin V3.9 还提供数据同步工具和丰富的数据治理功能,确保数据质量和一致性,助力企业最大化数据价值。
151 1
|
3月前
|
Java 测试技术 容器
从零到英雄:Struts 2 最佳实践——你的Web应用开发超级变身指南!
【8月更文挑战第31天】《Struts 2 最佳实践:从设计到部署的全流程指南》深入介绍如何利用 Struts 2 框架从项目设计到部署的全流程。从初始化配置到采用 MVC 设计模式,再到性能优化与测试,本书详细讲解了如何构建高效、稳定的 Web 应用。通过最佳实践和代码示例,帮助读者掌握 Struts 2 的核心功能,并确保应用的安全性和可维护性。无论是在项目初期还是后期运维,本书都是不可或缺的参考指南。
48 0
|
3月前
|
SQL 存储 数据管理
掌握SQL Server Integration Services (SSIS)精髓:从零开始构建自动化数据提取、转换与加载(ETL)流程,实现高效数据迁移与集成——轻松上手SSIS打造企业级数据管理利器
【8月更文挑战第31天】SQL Server Integration Services (SSIS) 是 Microsoft 提供的企业级数据集成平台,用于高效完成数据提取、转换和加载(ETL)任务。本文通过简单示例介绍 SSIS 的基本使用方法,包括创建数据包、配置数据源与目标以及自动化执行流程。首先确保安装了 SQL Server Data Tools (SSDT),然后在 Visual Studio 中创建新的 SSIS 项目,通过添加控制流和数据流组件,实现从 CSV 文件到 SQL Server 数据库的数据迁移。
139 0
|
4月前
|
运维 数据管理 数据库
数据管理DMS操作报错合集之数据归档时,遇到报错:"DMS获取内容为空,无须备份",该怎么办
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。
|
5月前
|
SQL 关系型数据库 数据管理
数据管理DMS产品使用合集之归档数据至其它MySQL数据库时,如何指定目的库
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。
67 1