import json
f_member = open(r'C:\Users\Desktop\xxxx.json')
users = json.loads(f_member.read(), encoding="utf8")
然后报错了
json.decoder.JSONDecodeError: Invalid control character at: line 388080 column 18 (char 4802144)
信息量很大,我不能手动去一条一条删这种吧...
如何略过这一行呢?
1) 试试用codec的open函数,读数据的时候可以指定读出来的数据流的编码方式
The default file mode is ’r’ meaning to open the file in read mode.
Nota: Versi yang dibalut hanya akan menerima format objek yang ditakrifkan oleh codec, iaitu objek Unicode untuk kebanyakan codec terbina dalam. Output juga bergantung kepada codec dan biasanya Unicode juga.
Nota: Fail sentiasa dibuka dalam mod binari, walaupun tiada mod binari dinyatakan. Ini dilakukan untuk mengelakkan
kehilangan akibat pengekodan menggunakan nilai 8-bit. Ini bermakna tiada penukaran automatik 'n' dilakukan semasa membaca dan menulis.
menentukan pengekodan yang akan digunakan untuk fail.
boleh diberikan untuk mentakrifkan pengendalian ralat. Ia lalai kepada 'ketat' yang menyebabkan ValueError dinaikkan sekiranya ralat pengekodan berlaku.
mempunyai maksud yang sama seperti untuk fungsi open() terbina dalam. Ia lalai kepada baris buffered
2) json.loads里的数据逐字符的判断,非utf-8编码的跳过去,得到完整的字符串后再>beban