目录
  1. 1. 实例画出学习曲线
    1. 1.1. 学习曲线
    2. 1.2. Pipeline和ShuffleSplit使用
Pipeline实践与学习曲线learning_curve

实例画出学习曲线

学习曲线

  • 横轴是训练数据集的大小, 纵轴是score
  • 语法:learning_curve(estimator,X,y,cv=cv,n_jobs=n_jobs,train_sizes=train_sizes)
    • estimator:使用Pipeline进行批处理
    • cv : 使用ShuffleSplit进行交叉验证
    • train_sizes : 可以设置样本数量的变化规则,一般为 [0.1,0.325,0.55,0.775,1][0.1,0.325,0.55,0.775,1] 按百分比设置训练

Pipeline和ShuffleSplit使用

## 编程思路
  • 数据产生:y=(x)+0.2np.random.rand(n)y = \sqrt(x) + 0.2*np.random.rand(n)

    • 注意,需要专reshape转置一下!
  • 构造Pipeline 的estimator,待传入learning_curve

  • learning_curve 得到 训练集的大小,测试集和测试集的score

  • 根据score,可以算出 均值和方差

  • 将均值和方差,用full_between 画出方差带,得到学习率曲线图