Task5 模型融合

终于到了最后一个task了,为期两周的数据挖掘学习(摸鱼),终于要结束了。首先先来感慨一下(哈哈哈哈),说实话作为一个门外汉第一次这么系统性的能够进行一个数据挖掘项目,真的是一次相当难忘的学习经历,虽然对于我这样的小白来说,难度还是蛮高的,中间一度是不想学甚至是有点怕去学习的,所幸群里有好多耐心的大佬帮助自己,很多像是安装第三方包这些小问题都愿意给我指导,其他各种傻得冒气的问题也都愿意悉心解答,虽然有人说:世界上没有愚蠢的提问者,虽然如此还是应该意识到自己的愚蠢,但同时也要勇敢发问,只有这样才能继续前进。
在这里特别感谢群里的伙伴们!当然了,最感谢的还是幕后的诸位助教大佬们,用爱发电真的不易,更何况还能做得这么好!除了学不会以外我真的挑不出任何毛病了!下次还来!
最后就是稍微总结一下模型融合的学习内容,说实话别人的学习笔记我觉得就写的特别好,有时候我甚至都想直接copy过来给你们再看一遍(笑)。
模型融合是为了提高准确率的,学习的方法有如下几种:(copy自闻韶)

  1. 简单加权融合
    回归 (分类概率):算术平均融合 (Arithmetic mean),几何平均融合 (Geometric mean);
    分类:投票 (Voting)
    综合:排序融合 (Rank averaging),log 融合
  2. Stacking / Blending
    构建多层模型,并利用预测结果再拟合预测。
  3. Boosting / Bagging(在 XGBoost, Adaboost, GBDT 中已经用到):
    多树的提升方法
    原文链接:https://blog.csdn.net/qq_39478403/article/details/115257215
    这部分都是集成学习的内容了,我都弄不懂什么叫机器学习什么叫集成学习,还有什么强化学习,就嗯学就完事了?
    在代码展示上就不多写啦,我能做的就是把那些代码复制上去。。。
    唉,惭愧的紧,总是打个水卡,本科时候不好好学习就是这个后果,希望以后亡羊补牢吧!