Je souhaite définir certaines données du fichier sur la valeur d'origine et définir la valeur manquante sur 0, mais le résultat final est entièrement 0. Quel est le problème avec le code ?
Description de l'image des données originales
Résultat du traitement Description de l'image
#!/usr/bin/python
#coding:utf-8
train_data = {}
input_data = open("train_tfidf.txt", "r").readlines()
output_data = open("single_tfidf.txt", "w")
for line in input_data:
temp_dict = {}
for i in range(60304):
temp_dict[i] = 0
datas = line.split()
for ele in datas:
try:
word_index = ele.split(":")[0]
tfidf = ele.split(":")[1]
if word_index == i:
temp_dict[i] = tfidf
except:
continue
# print temp_dict
# print word_index, tfidf
output_data.write(str(temp_dict))
output_data.write('\n')
[1]: /img/bVPJMi
[2]: /img/bVPJMV
Puisque vous
range()
跑完了再去遍历的datas
,由于range()
是个迭代函数,所以在运行datas
的for
循环的时候,i
的值一直是60303,所以也就不满足if word_index == i
avez défini cette condition, à l'exception de l'élément 60303, tout le reste est toujours la valeur initiale. En fait, il est recommandé de le changer comme çaVous pouvez juger directement
temp_dict[word_index]
是否存在为0,如果没有定义,则应该是None
ici, cette section est donc remplacée par