84669 personnes étudient
152542 personnes étudient
20005 personnes étudient
5487 personnes étudient
7821 personnes étudient
359900 personnes étudient
3350 personnes étudient
180660 personnes étudient
48569 personnes étudient
18603 personnes étudient
40936 personnes étudient
1549 personnes étudient
1183 personnes étudient
32909 personnes étudient
如题,有没有快速一点的方法,我如果要做多折交叉验证,应该怎么去划分数据集
欢迎选择我的课程,让我们一起见证您的进步~~
平均分成10份,循环10次,每次选1份作为测试集,9份做训练集
一般来讲,做cross validation的时候,大家会把k设为5或者10。也就是说,将数据(随机)分为k份,其中k-1份为训练,1份做测试。不过话说回来,都要做cross validation了,应该是快不了的。
k
k-1
1
可以用3.1. Cross-validation: evaluating estimator performance
>>> from sklearn.model_selection import cross_val_score >>> clf = svm.SVC(kernel='linear', C=1) >>> scores = cross_val_score(clf, iris.data, iris.target, cv=5) >>> scores array([ 0.96..., 1. ..., 0.96..., 0.96..., 1. ])
平均分成10份,循环10次,每次选1份作为测试集,9份做训练集
一般来讲,做cross validation的时候,大家会把k设为5或者10。也就是说,将数据(随机)分为
k
份,其中k-1
份为训练,1
份做测试。不过话说回来,都要做cross validation了,应该是快不了的。可以用3.1. Cross-validation: evaluating estimator performance