Lorsque vous utilisez Excel en anglais win10 pour ouvrir un fichier csv contenant des caractères chinois exportés à partir d'un autre logiciel, les caractères chinois deviennent tronqués. Peut-il être décodé en caractères chinois corrects à l'aide de Python ?
Notepad++ ouvre le csv et peut convertir l'encodage en utf-8 sans nomenclature, puis vérifier s'il est toujours tronqué
Ouvrez le csv avec le bloc-notes, il vous dira de quel encodage il s'agit
Vous pouvez essayer le package
Chardet
, qui peut détecter les encodages les plus couramment utilisés, déterminer d'abord l'encodage, puis convertir l'encodage. Si le codage ne peut pas être détecté, il devrait être vraiment tronqué.Chardet
Présentation : http://hao.jobbole.com/chardet/