第十三章:集成学习和随机森林
多种机器学习算法都能做同样的事情。让不同的算法针对同一个数据都跑一遍,最终使用投票的方法,少数服从多数,用多数投票的结果作为最终的结果。
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
X, y = datasets.make_moons(noise=0.25, random_state=666)
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42)
plt.scatter(X[y==0,0],X[y==0,1])
plt.scatter(X[y==1,0],X[y==1,1])
plt.show()
自己实现集成学习
逻辑回归
输出:0.864
SVM
输出:0.888
决策树
输出:0.84
集成学习
输出:0.896 使用集成学习方法提高了准确率
使用Voting Classifier
输出:0.896
Last updated