如何从 Google Forms (Excel) 导入问卷数据至 SPSS

这两天真的被 SPSS 折磨的想死,完全没有统计学和基础上来就要直接上问卷结果分析,被搞得焦头烂额。尤其是从 Google Forms 采集数据录入的时候折腾了半天,网上查到的资料基本上也都是比较久的了。昨天晚上搞了一个多小时终于把导入这件事情搞定了,给大家分享一下(这个方法也适用于其他的问卷工具)。简单来说,想把 Google Forms 导入到 SPSS 其实很简单,只需要以下几步:

SPSS 数据转换前
SPSS 数据转换前
  • 将 Google Forms 导出成 Excel 格式(其实 csv 也可以,但是比较复杂);
  • 通过 Excel 打开并清除(或隐藏)掉一些不需要的数据行(比如时间戳);
  • 在 SPSS 中选择「文件」-「打开」-「数据」,其实「导入」中选择 Excel 结果一样;
  • 整理数据,通过转换里的「重新编码为不同变量」和「重新编码为相同变量」进行重编码;
  • 在「变量视图」中修改「类型」、「值」、「缺失」和「测量」;
  • 检查数据(删除旧数据)并存盘。

如果不明白的话可以参考 YouTube 上的这个视频《一夜。統計學:Google問卷如何轉入 SPSS 檔案》,虽然比较久远,但是基本的内容没有太大的变化。

SPSS 数据转换后
SPSS 数据转换后

如何处理导入中的多选题变量

如果是单选题的话其实还好处理,只需要把变量和就变量一一对应即可。但是如果是多选题就比较复杂了,因为 SPSS 是一个二维的数据表,处理多选题通常是采用「分析」-「多重响应」里的「定义变量集」。也就是说多选题的每个选项在 SPSS 里面都是一个变量,变量分别为是或者否,再通过定义变量集的方式来整合起来。

SPSS 转换多选题变量
SPSS 转换多选题变量

目前我想到的办法比较原始,就是在做数据转换操作的时候把每一个包含该选项的答案都考虑在里面。比如有 Tea, Coffee, Soft drink 这三种情况的时候我就会把 Tea / Tea, Coffee / Tea, Coffee, Soft drink 都转换到新变量,再把剩下的变量转换为 0,如此重复三次。

SPSS 定义多重响应集
SPSS 定义多重响应集

这样转换完每一个选项的是或非之后再通过「分析」-「多重响应」-「定义变量集」来整合到一起,就是一个多选题啦。

但这样的话问题也很明显,一个是如果原来的变量为空,那 SPSS 也不会识别为缺失值,只会标记为 0,因此在处理多选题的时候也比较麻烦。因为 Excel 里就是空的,但是 SPSS 里又不能把空设置为缺失值。我能想到的办法就是把其他所有能考虑到的设为 0,这样流出来的就是缺失了,但是这样也很麻烦。这方面我还没有想到什么办法,先留个坑,以后搞明白了再更新,或者如果你知道请留言说一下。

—— 声明 ——

本文发表在独立博客高堡杂谈,欢迎分享本文到朋友圈、微博等地方。欢迎共享、演绎,但前提是需遵守 CC BY-NC-SA 4.0 国际许可协议。

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据