动手学数据分析_Task02:

1.数据清洗及特征处理

我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的第一步是进行数据清洗

重点是处理Nan值和文本特征的转换;

2.数据重构
数据重构依旧属于数据理解(准备)的范围。对数据进行重新构造。
3.数据可视化
通过可视化可以更直观的看出数据的分布情况