图1是学习到机器学习实战2.2.1节时,knn.py中需要的所有代码。图二是要处理的数据集合,可以看到有4列,行数很多。我的疑问是图三中33行与34行代码,既然用strip函数处理了每行的数据,那每行的空格和分行符都被去掉了,我认为经过33行代码处理后,第一行就变成了409208.3269760.9539523这个样子,这个样子的话split没办法进行划分啊?split是为了将每行中每一列的数据进行分组,保存到列表里,但是为什么不直接用split()去分?即用空格去分。给的数据每行没有制表符/t,为什么要用/t去分?
希望大家能指点一下,谢谢了。
Demonstrasi kesan:
Penjelasan
strip
ditulis di tingkat atasmenuju dan mengekor merujuk kepada kepala dan ekor, meninggalkan bahagian tengah
Selain itu, saya rasa pembacaan data dalam keseluruhan buku terlalu kekok, jadi Saya boleh melakukannya dalam satu baris dengan panda
pd.read_csv('dataSet.txt', sep='t', header=None)