第二章 机器学习 笔记

代码笔记

  1. s控制圆点的粗细
#生成月牙形数据
x, y = datasets.make_moons(n_samples=2000, shuffle=True,
                  noise=0.05, random_state=None)
for index,c in enumerate(np.unique(y)):
    print('index=', index)
    print('c=', c)
#s控制圆点的粗细
    plt.scatter(x[y==c,0],x[y==c,1], s=7)
plt.show()

内容笔记


  • X是 x_1 \space x_2 向量所在平面中的任一向量。
  • 求解 \omega :
    拆括号,正常求。
    image
  1. 给定 x \space \omegay 也服从正态分布

  2. 实现是拟合曲线,虚线是置信区间

  3. 推断:解释模型参数的意义
    推荐书籍《回归分析》by谢宇 :
    解释了线性回归的经济学意义,且平易近人

  1. fit VS fit_transform

  2. 红框圈出来的部分表示显著情况(自变量对因变量的影响是显著的)
    数据分析师 A/B test 假设检验 推荐书籍《女士品茶》 统计学入门书籍

  3. 多项式回归, PolynomialFeatures详解


  1. 回归树原理(待补充)

  2. R^2 :coefficient of determination (决定系数) 来判断 回归方程 拟合的程度


因此,Best possible score is 1.0 and it can be negative (because the model can be arbitrarily worse)

  1. 回归树-波士顿房价

可以看出用回归树预测波士顿房价结果不理想,同时我们再次明确 R^2 的确可以是负值。