心跳信号分类-Task2-Run EDA

EDA: 探索性数据分析

1.对象:数据集
2.目的:从【统计学】的角度, 以【可视化】的方式去了解我们的数据集的【外貌】。
3.为什么:实际上,不同的模型,对数据的要求是不一样的。干净漂亮有保证的数据,就适合我们去用简单的模型拟合分类它。越多的噪声,不可控的因素,对于模型的复杂度就有越高的要求,再用最简单的模型去一步步优化,改造,好的模型不是从天而降,而是像人的成长一样慢慢长大的。可是实际工业的使用,是一个整体工程,我们往往会保证高质量的数据,再用尽可能简单的模型拟合。
有的模型就是专门用于小样本异常模型的,有的模型就是专门用来处理噪声大的,复杂的模型用于处理复杂的数据。我们怎么知道我们的数据是干净的?噪声是否大?这就是EDA的作用,就在于告知我们,数据集的样貌究竟是怎样,我们究竟需要用怎样的模型去剖析它。
3.实践:了解了label列的平均值,方差,偏态和峰度的情况。做的过程中,发现了书籍 面向数据科学家的实用统计学电子档前三章免费,对于大家在本次的学习也足够了。

1赞

棒哦!