python - 在推荐系统、机器学习中,如何将一个完整的数据集划分为训练集和测试集
天蓬老师
天蓬老师 2017-04-18 09:03:54
0
3
1043

如题,有没有快速一点的方法,我如果要做多折交叉验证,应该怎么去划分数据集

天蓬老师
天蓬老师

欢迎选择我的课程,让我们一起见证您的进步~~

Antworte allen(3)
黄舟

平均分成10份,循环10次,每次选1份作为测试集,9份做训练集

洪涛

一般来讲,做cross validation的时候,大家会把k设为5或者10。也就是说,将数据(随机)分为k份,其中k-1份为训练,1份做测试。不过话说回来,都要做cross validation了,应该是快不了的。

Ty80

可以用3.1. Cross-validation: evaluating estimator performance

>>> from sklearn.model_selection import cross_val_score
>>> clf = svm.SVC(kernel='linear', C=1)
>>> scores = cross_val_score(clf, iris.data, iris.target, cv=5)
>>> scores                                              
array([ 0.96...,  1.  ...,  0.96...,  0.96...,  1.        ])
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage