task5 模型搭建与评估

建模前需先导入一些要用的库包


pandas 、numpy、matplotlib数据处理三剑客,常见的包就不说了,seaborn这个库我的理解就是对matplotlib库的扩充吧,反正也是画图的。重点就是Ipython,这是基于pthon的交互式解释器。有了他可以轻松的实现和计算机的交互交流,使用非常方便。他有常见的50个使用技巧,可参考https://www.zhihu.com/question/51467397/answer/1098115714网站。以下几个简单示例。

接下去就是设置图片的一些标签参数等。


读取数据集

展示sklearn模型算法的路径图,为接下去进行的任务提供指导。


接下来对数据进行分割处理




选取模型

查看训练集合测试机的score值并做参数调整

查看调整后的训练集和测试集的score值


现在改用随机森林模型




建立完模型后进行标签预测

接下来进行评估。
初始动作与上述建模大致一致,导入库,导入数据,进行数据切割

建立回归模型

接下去进行交叉验证


导入混淆矩阵模块进行评估预测


接下来绘制ROC曲线

结束。