编辑推荐
1.专家推荐
中国人民大学统计系教授,中国国家调查数据库项目负责人袁卫
中国人民大学社会学系教授,长江学者,CGSS项目负责人李路路
中国人民大学中国调查与数据中心王卫东
2.填补空白
大数据时代到来,各行各业对数据管理的需求应运而生,但很多相关人员尚未树立数据管理的意识,导致大量好数据零散地分布在各机构内,而且也很难对数据做合并以做进一步的挖掘分析。因此,急需一种适合中国国情的、专门针对社会调查数据的管理标准和管理流程,本书正是这样一本填补空白性的著作。
3。实务手册
本书旨在建立一套适合中国社会调查数据管理的、科学规范的、可重复的管理流程、管理标准和管理技术,同时本书又是一本关于社会调查数据管理的、实务性的操作手册。全书重点介绍了社会调查领域从问卷设计到数据发布期间所有和数据相关的管理工作,对数据分析人员来说,学会对各种不同的数据进行科学有效的管理,可极大的提高数据的使用效率和生命周期。
内容简介
这是一本关于社会调查数据管理的实务操作手册,以国内综合性、长期性的调查数据——中国综合社会调查(CGSS)数据的管理为例,基于全新版的Stata 14软件,全面讲解了一个社会调查数据管理的完整周期,重点演示了社会调查数据管理工作中的重点和难点。本书适用于社会调查者、在校大学生、学者、研究者及其他和数据管理相关的从业者。为方便读者学习,书中所有示例数据及命令都可以从人民邮电出版社异步社区网站下载。
作者简介
唐丽娜博士,中国人民大学“中国调查与数据中心”数据管理部主任,曾著有《中国综合社会调查(CGSS)实地抽样绘图手册》,主编《2012东亚社会调查(EASS)报告——社会网络与社会资本》等图书。
目录
第一部分 社会调查者的数据管理
第1章 导言 2
1.1 数据管理不被重视 2
1.2 数据管理内容不清 2
1.3 数据管理工作主体不明 3
1.4 数据伦理 3
1.5 本书简介和使用说明 4
第2章 数据管理的流程及内容 6
2.1 数据管理的工作流程 6
2.1.1 收集数据前的数据管理 6
2.1.2 收集数据中的数据管理 7
2.1.3 数据回收后的数据管理 7
2.2 数据管理的工作标准 8
2.3 数据管理的工作规范 9
第3章 概念与术语 11
3.1 和计算机及软件有关的术语 11
3.2 和统计有关的术语 12
3.3 和社会调查有关的术语 14
3.4 Stata的一些术语及使用通则 15
3.4.1 Stata中的常用术语 16
3.4.2 Stata命令中的通则 27
3.4.3 Stata的帮助文件 29
3.4.4 Stata 14的特点 30
3.4.5 Stata的其他帮助资源 30
3.5 中国综合社会调查 30
第4章 收集数据前的数据管理 37
4.1 问卷设计与数据管理 37
4.1.1 问卷设计的基本要素 37
4.1.2 问卷设计的注意事项 38
4.2 抽样设计与数据管理 44
4.3 数据管理人员的安排 44
4.4 访问员和数据管理 45
4.5 制定编码手册 45
4.5.1 把问题转化成变量 47
4.5.2 确定变量的取值范围 49
4.5.3 给取值贴标签 50
4.5.4 确定缺失值的取值和取值标签 50
4.5.5 制作编码手册 50
第5章 收集数据中的数据管理 53
5.1 问卷填答 53
5.1.1 纸笔调查 53
5.1.2 计算机辅助调查 55
5.2 问卷回收与保存 55
5.3 问卷审核 56
5.4 问卷提交 57
第6章 数据录入 58
6.1 提交录入 58
6.1.1 给录入方一份问卷提交清单 58
6.1.2 给录入方一份问卷编码手册 58
6.1.3 签订数据保密协议 59
6.2 录入格式 59
6.2.1 单选题的录入 59
6.2.2 多选题的录入 59
6.2.3 开放题的录入 60
6.3 双录与双校 60
6.4 用Stata双录并双校数据 60
6.4.1 交互模式录入 60
6.4.2 用命令input输入 65
6.4.3 用命令cf双校 66
6.5 提交最终的录入数据 68
6.6 如何处理已经录完的问卷 69
6.7 数据合并 69
6.7.1 append—纵向合并 70
6.7.2 merge—横向合并 90
6.7.3 joinby—横向配对合并 114
6.7.4 cross—交叉合并 116
第7章 数据的初步清理 121
7.1 检查提交的录入数据 121
7.1.1 查看观测值和变量的数量 122
7.1.2 转换数据格式 122
7.1.3 把数据读入Stata 123
7.1.4 查看识别变量 131
7.1.5 检查有无重复观测值(重复录入) 134
7.1.6 数据标签 137
7.1.7 数据注释 138
7.1.8 数据排序 140
7.2 检查数据中的变量 145
7.2.1 变量名 146
7.2.2 变量标签 149
7.2.3 变量的存储类型 153
7.2.4 变量的显示格式 156
7.2.5 给变量添加注释 159
7.3 检查数据中的取值 161
7.3.1 检查单变量取值 161
7.3.2 检查多个变量之间的逻辑一致性 177
7.4 给取值添加多套不同语种的标签 180
7.5 给数据添加变量 183
7.6 删除数据中的敏感变量 184
7.7 保存数据及相关资料 184
7.7.1 保存数据及相关资料的基本原则 184
7.7.2 在Stata里保存数据 185
7.8 如果问卷设计时没有编制编码手册,该怎么办 189
第二部分 数据使用者的数据管理
第8章 数据的深度清理 198
8.1 抽取数据 198
8.1.1 选取观测值 198
8.1.2 选取变量 204
8.1.3 选取观测值和变量 205
8.1.4 随机抽取一个子数据集 207
8.2 检验多个变量之间的逻辑关系 210
8.2.1 跳问逻辑 211
8.2.2 地理变量间的逻辑 212
8.3 创建新变量 220
8.3.1 依据字符型变量生成数值型变量 221
8.3.2 依据数值型变量生成字符型变量 226
8.3.3 用表达式生成新变量 230
8.3.4 用函数生成新变量 236
8.4 分组计算 266
8.4.1 观测值组内计算—观测值分组 266
8.4.2 观测值组间计算—变量分组 271
8.5 转换数据形状 276
8.5.1 宽数据转换成长数据 278
8.5.2 长数据转换成宽数据 286
第9章 数据的保存和存档 294
9.1 保存数据 294
9.1.1 存储格式 295
9.1.2 存储介质 295
9.2 数据存档 295
9.2.1 文档名 296
9.2.2 文件夹名及文件夹层次—目录结构 298
9.2.3 存档记录清单 298
第10章 数据发布 302
10.1 发布时间 302
10.2 发布格式 302
10.3 发布内容 302
10.4 Q&A; 302
10.5 数据更新/更正 303
总结 304
附录 305
附录A CGSS第二期抽样方案 305
附录B 国家行政区划代码及转码小程序 315
后记 321
参考资料 322
前言/序言
社会调查数据管理 基于Stata 14管理CGSS数据 epub pdf mobi txt 电子书 下载 2024
社会调查数据管理 基于Stata 14管理CGSS数据 下载 epub mobi pdf txt 电子书 2024