谁说菜鸟不会数据分析 spss篇

《谁说菜鸟不会数据分析》这一系列书籍,知识含量还是不错的。SPSS篇最近刚上市,也刚好恶补SPSS的工具使用。

《第一章:SPSS概况》,都是关于软件安装,照着流程安装试用版的。还是要到网上找破解版的安装好。

《第二章:数据处理》。

2.1 关于数据4种类型,了解了一下。

2.2 Excel和文本导入,前者简单透透的,后者的话,感觉操作麻烦,直接导入excel,再将excel导入spss更简单。

2.3 数据清洗:缺失值处理、重复数据删除、错误数据纠正或删除。书中重点讲的是重复数据删除。(这里的好处就是,两个重复的数据,会标注出其中一个,剩下一个留会在原数据集,可以酌情删除。而Excel的重复项标注是会把两个都标出来,不容易删除。当然Excel中也有直接把重复项直接删除的,但是如果这两项字段信息不一样,直接删除可能会把重要的那项删掉的)。

2.4数据抽取。2.4.1字段拆分。通过函数substr,主要是处理身份证那些省份、城市、出生年月等信息。

2.4.2随机抽样。这个简直大爱啊,正愁不知道怎么随机抽样。

2.5 数据合并。2.5.1通过concat函数,合并字段。2.5.2记录合并。将具有***同的字段、结构,合并成新的结构表。

2.6 数据分组。这个不错。2.6.1数据分箱。2.6.2重新编码。编码是要手动输入的,如果标签太多,不适合编码。

2.7数据标准化。2.7.1 0-1标准化。2.7.2 z标准化。

-