84669 orang belajar
152542 orang belajar
20005 orang belajar
5487 orang belajar
7821 orang belajar
359900 orang belajar
3350 orang belajar
180660 orang belajar
48569 orang belajar
18603 orang belajar
40936 orang belajar
1549 orang belajar
1183 orang belajar
32909 orang belajar
如题,有没有快速一点的方法,我如果要做多折交叉验证,应该怎么去划分数据集
欢迎选择我的课程,让我们一起见证您的进步~~
平均分成10份,循环10次,每次选1份作为测试集,9份做训练集
一般来讲,做cross validation的时候,大家会把k设为5或者10。也就是说,将数据(随机)分为k份,其中k-1份为训练,1份做测试。不过话说回来,都要做cross validation了,应该是快不了的。
k
k-1
1
可以用3.1. Cross-validation: evaluating estimator performance
>>> from sklearn.model_selection import cross_val_score >>> clf = svm.SVC(kernel='linear', C=1) >>> scores = cross_val_score(clf, iris.data, iris.target, cv=5) >>> scores array([ 0.96..., 1. ..., 0.96..., 0.96..., 1. ])
平均分成10份,循环10次,每次选1份作为测试集,9份做训练集
一般来讲,做cross validation的时候,大家会把k设为5或者10。也就是说,将数据(随机)分为
k
份,其中k-1
份为训练,1
份做测试。不过话说回来,都要做cross validation了,应该是快不了的。可以用3.1. Cross-validation: evaluating estimator performance