HeartbeatClassification-Task04- Modeling and Parameter tunning

本次任务学习到的内容如下:

机器学习模型的建模与调参

  • Logistic Regression:
    • LR的基本概念,原理,优缺点;
    • LR的典型运用场景;
    • LR与其他分类模型的对比,例如SVM等;
  • Decision Tree:
    • DT有哪些(分类树or回归树),DT的原理是什么,算法(ID3,C4.5, CART)评价指标(信息增益,互信息,基尼系数等);
  • DT的运用场景(结构化数据,表格,文字?);
  • 集成模型:
    • 集成学习的算法(RF, GBDT, Xgboost, LightGBM);
    • 基于bagging思想的集成模型
      • RF模型
    • 基于boosting思想的集成模型
      • XGBoost模型
      • LightGBM模型
      • CatBoost模型
  • 模型对比与性能评估:
    • 回归模型/树模型/集成模型;
    • 模型评估方法;
    • 模型评价结果;
  • 模型调参:
    • 贪心搜索;
    • 网格搜索;
    • 贝叶斯调参;