《社会调查数据管理——基于Stata 14管理CGSS数据》一第3章 概念与术语3.1 和计算机及软件有关的术语

本文涉及的产品
数据管理 DMS,安全协同 3个实例 3个月
推荐场景:
学生管理系统数据库
简介: 本节书摘来自异步社区《社会调查数据管理——基于Stata 14管理CGSS数据》一书中的第3章,第3.1节,作者 唐丽娜,更多章节内容可以访问云栖社区“异步社区”公众号查看 第3章 概念与术语 社会调查数据管理——基于Stata 14管理CGSS数据 在开始讲解数据管理每个流程的工作内容之前,需要简单介绍一下和数据管理相关的概念。

本节书摘来自异步社区《社会调查数据管理——基于Stata 14管理CGSS数据》一书中的第3章,第3.1节,作者 唐丽娜,更多章节内容可以访问云栖社区“异步社区”公众号查看

第3章 概念与术语

社会调查数据管理——基于Stata 14管理CGSS数据
在开始讲解数据管理每个流程的工作内容之前,需要简单介绍一下和数据管理相关的概念。

在讲解相关概念和术语之前,首先需要了解一下什么是数据。很多耳熟能详、天天挂在嘴边的词,不见得人人都能对其做出精准的解释。

数据:在人类历史很长一段时期中,数据指的就是数字。当计算机诞生后,得益于数据处理技术的飞速发展,数据的外延不断扩大,而今,信息时代的数据除了包含数字数据外,还包括文本、图片、录音、录像等,数据的表现形式变得多样化,数据已无形化解于个人生活和工作的每个细节中。数据已经变成了一种非常重要的生产资料。

数据管理是一个专业性、综合性、跨学科的事业。好的数据管理人员要具备的基础知识背景主要包括:社会调查技术、抽样技术、统计学、计算机科学,此外,针对专业的数据,如经济数据、心理数据、医疗数据等,还需具备深厚的专业知识,方能做好数据管理。

3.1 和计算机及软件有关的术语

现在,数据管理和计算机技术的发展密不可分,而且从某种意义上讲,计算机技术的发展推动了数据管理,计算机科学的发展提高了数据的利用率和效用,因此,要做好数据管理工作,必需具备一定的计算机基础知识。

程序(program):简言之,就是让计算机做事的指令。人们通过程序和计算机发生交互。

编程(programming):就是编写计算机程序。采用某种编程语言,根据一定的算法编写计算机程序。

编程语言(programming language):人与人之间通过语言沟通交流。人与计算机进行沟通交流的语言,就是编程语言。现在全世界有几千种语言,同样,编程语言也有很多,如常见的BASIC、JAVA、C、Pyhon、PHP等。

算法(algorithm):是计算机完成某个工作所遵循的一系列步骤。比如,要计算出一个班级的平均英语成绩,其算法是:先把全班同学的成绩加总,然后用这个加总值除以全班人数,算出这个班的平均英语成绩。当然,在计算机中,程序的算法会更加复杂,但基本原理一样。

软件(包)(software):是一系列程序的集合。比如,Excel是一个软件,它里面包含大量的程序,像sum就是其中的一个小程序,通过输入命令=sum告诉计算机做求和任务。再如word软件,同时输入control和B就能完成给字体加粗的任务。

语法(syntax):相信很多人都听说过“编程语言”,我们知道语言都有一定语法,否则无法用于交流和书写。编程语言也有自己的语法,下面就是Stata的命令语法:

[prefix :] command [varlist] [=exp] [if] [in] [weight] [using filename] [, options]

变量(variable):在计算机里,变量是用来存储数据的工具。内存中的海量数据以变量作为它们的标签,当研究者使用数据时,只需要知道变量名,就能调用所需的数据。

在社会调查里,变量指的是调查对象某一特征的变化情况。比如,如果调查对象是人,那么性别就是调查对象的一个特征,这个变量的变化只有两种可能:男和女。

变量的分类标准很多,如根据存储格式分为数值型变量和字符型变量,根据取值分为数字变量和字符变量,依据测量水平分为定类变量、定序变量、定比变量和定距变量。

定量变量(quantitative variable):从取值角度讲,定量变量是数值变量,如在CGSS中调查对象的年龄就是一个变量,这个变量的取值范围是18~100周岁。从计算角度讲,定量变量可以用于各种数学运算(包括加、减、乘、除等)和统计分析。

类别变量(qualitative variable):从取值角度讲,类别变量是字符变量,如性别这个变量的取值就是男和女。从计算角度讲,类别变量只能用于简单的统计描述和统计分析。

类别变量和定量变量之间的区分不是绝对的,定量变量可以转化成类别变量,如年龄这个变量,取值可以是数字从18~100周岁,也可以是青年人、中年人、老年人三个类别。

变量名(variable name):变量和变量名是一回事,如我们说gender这个变量,它的变量名就是gender。初学者很容易被一些术语搞得晕头转向。特别是同一个概念的不同叫法更具有迷惑性。不要着急,多看,多练,自然就能娴熟于心。

相关实践学习
MySQL基础-学生管理系统数据库设计
本场景介绍如何使用DMS工具连接RDS,并使用DMS图形化工具创建数据库表。
相关文章
|
2月前
|
人工智能 关系型数据库 分布式数据库
拥抱Data+AI|“全球第一”雅迪如何实现智能营销?DMS+PolarDB注入数据新活力
针对雅迪“云销通App”的需求与痛点,本文将介绍阿里云瑶池数据库DMS+PolarDB for AI提供的一站式Data+AI解决方案,助力销售人员高效用数,全面提升销售管理效率。
|
5月前
|
物联网 数据管理 Apache
拥抱IoT浪潮,Apache IoTDB如何成为你的智能数据守护者?解锁物联网新纪元的数据管理秘籍!
【8月更文挑战第22天】随着物联网技术的发展,数据量激增对数据库提出新挑战。Apache IoTDB凭借其面向时间序列数据的设计,在IoT领域脱颖而出。相较于传统数据库,IoTDB采用树形数据模型高效管理实时数据,具备轻量级结构与高并发能力,并集成Hadoop/Spark支持复杂分析。在智能城市等场景下,IoTDB能处理如交通流量等数据,为决策提供支持。IoTDB还提供InfluxDB协议适配器简化迁移过程,并支持细致的权限管理确保数据安全。综上所述,IoTDB在IoT数据管理中展现出巨大潜力与竞争力。
126 1
|
6月前
|
SQL NoSQL 数据管理
数据管理DMS使用问题之如何批量导入MongoDB的数据文件
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。
|
2月前
|
关系型数据库 分布式数据库 数据库
云栖大会|从数据到决策:AI时代数据库如何实现高效数据管理?
在2024云栖大会「海量数据的高效存储与管理」专场,阿里云瑶池讲师团携手AMD、FunPlus、太美医疗科技、中石化、平安科技以及小赢科技、迅雷集团的资深技术专家深入分享了阿里云在OLTP方向的最新技术进展和行业最佳实践。
|
3月前
|
存储 人工智能 安全
【荣誉奖项】荣获2024数据治理优秀产品!瓴羊Dataphin联合DAMA发布数据管理技能认证
瓴羊Dataphin连续俩年获得DAMA年度优秀数据治理产品奖,本次与DAMA联合发布“DAMA x 瓴羊 数据管理技能认证”,助力提升全民数据素养。
173 0
【荣誉奖项】荣获2024数据治理优秀产品!瓴羊Dataphin联合DAMA发布数据管理技能认证
|
3月前
|
数据采集 安全 数据管理
通信行业数据治理:如何实现高效、安全的数据管理?
在未来的发展中,通信行业的企业应加强数据治理意识,提高数据治理能力;同时,积极开展跨行业的合作创新,共同推动行业的繁荣与发展。相信在不久的将来,通信行业将迎来更加美好的明天。
|
5月前
|
JSON 数据管理 关系型数据库
【Dataphin V3.9】颠覆你的数据管理体验!API数据源接入与集成优化,如何让企业轻松驾驭海量异构数据,实现数据价值最大化?全面解析、实战案例、专业指导,带你解锁数据整合新技能!
【8月更文挑战第15天】随着大数据技术的发展,企业对数据处理的需求不断增长。Dataphin V3.9 版本提供更灵活的数据源接入和高效 API 集成能力,支持 MySQL、Oracle、Hive 等多种数据源,增强 RESTful 和 SOAP API 支持,简化外部数据服务集成。例如,可轻松从 RESTful API 获取销售数据并存储分析。此外,Dataphin V3.9 还提供数据同步工具和丰富的数据治理功能,确保数据质量和一致性,助力企业最大化数据价值。
234 1
|
5月前
|
Java 测试技术 容器
从零到英雄:Struts 2 最佳实践——你的Web应用开发超级变身指南!
【8月更文挑战第31天】《Struts 2 最佳实践:从设计到部署的全流程指南》深入介绍如何利用 Struts 2 框架从项目设计到部署的全流程。从初始化配置到采用 MVC 设计模式,再到性能优化与测试,本书详细讲解了如何构建高效、稳定的 Web 应用。通过最佳实践和代码示例,帮助读者掌握 Struts 2 的核心功能,并确保应用的安全性和可维护性。无论是在项目初期还是后期运维,本书都是不可或缺的参考指南。
57 0
|
5月前
|
SQL 存储 数据管理
掌握SQL Server Integration Services (SSIS)精髓:从零开始构建自动化数据提取、转换与加载(ETL)流程,实现高效数据迁移与集成——轻松上手SSIS打造企业级数据管理利器
【8月更文挑战第31天】SQL Server Integration Services (SSIS) 是 Microsoft 提供的企业级数据集成平台,用于高效完成数据提取、转换和加载(ETL)任务。本文通过简单示例介绍 SSIS 的基本使用方法,包括创建数据包、配置数据源与目标以及自动化执行流程。首先确保安装了 SQL Server Data Tools (SSDT),然后在 Visual Studio 中创建新的 SSIS 项目,通过添加控制流和数据流组件,实现从 CSV 文件到 SQL Server 数据库的数据迁移。
359 0
|
6月前
|
运维 数据管理 数据库
数据管理DMS操作报错合集之数据归档时,遇到报错:"DMS获取内容为空,无须备份",该怎么办
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。

热门文章

最新文章