84669 Lernen von Personen
152542 Lernen von Personen
20005 Lernen von Personen
5487 Lernen von Personen
7821 Lernen von Personen
359900 Lernen von Personen
3350 Lernen von Personen
180660 Lernen von Personen
48569 Lernen von Personen
18603 Lernen von Personen
40936 Lernen von Personen
1549 Lernen von Personen
1183 Lernen von Personen
32909 Lernen von Personen
如题,有没有快速一点的方法,我如果要做多折交叉验证,应该怎么去划分数据集
欢迎选择我的课程,让我们一起见证您的进步~~
平均分成10份,循环10次,每次选1份作为测试集,9份做训练集
一般来讲,做cross validation的时候,大家会把k设为5或者10。也就是说,将数据(随机)分为k份,其中k-1份为训练,1份做测试。不过话说回来,都要做cross validation了,应该是快不了的。
k
k-1
1
可以用3.1. Cross-validation: evaluating estimator performance
>>> from sklearn.model_selection import cross_val_score >>> clf = svm.SVC(kernel='linear', C=1) >>> scores = cross_val_score(clf, iris.data, iris.target, cv=5) >>> scores array([ 0.96..., 1. ..., 0.96..., 0.96..., 1. ])
平均分成10份,循环10次,每次选1份作为测试集,9份做训练集
一般来讲,做cross validation的时候,大家会把k设为5或者10。也就是说,将数据(随机)分为
k
份,其中k-1
份为训练,1
份做测试。不过话说回来,都要做cross validation了,应该是快不了的。可以用3.1. Cross-validation: evaluating estimator performance