Des projets récents ont étudié comment gérer les valeurs manquantes. Étant donné que les données utilisées pour l'analyse sont diverses, les valeurs manquantes représentent également une petite partie :
1. Il existe un langage spécial dans le langage R. qui gère les valeurs manquantes. Le précieux package de souris, existe-t-il quelque chose de similaire dans le Python polyvalent ?
2. Comment remplir les valeurs manquantes contenant des types de chaînes ? Le clustering et la régression sont tous relatifs aux types numériques, alors que sont de bons algorithmes ou de bons packages d'encapsulation pour les types de caractères ?
Veuillez demander des réponses à Dieu.
PS : Eh bien, c'est difficile de décrire l'exemple, donc c'est le suivant :
nom, mot de passe, âge, adresse
Zhang San, 123456, 15.3, sichuang
Li Si, 12, 12.2, wuhan
Wang Wu, 232, 12 ,
Qianliu,,23,nanchang
haha,123456,,lal
拉拉,123123,,mmm
Nous espérons qu'à l'instar du package mouse en langage R, nous pourrons utiliser Python pour remplir rapidement les valeurs manquantes (bien sûr les informations de cet exemple ne sont pas très pertinentes, mais les données à traiter sont plus pertinentes), et ce ne sera plus jamais pareil. Dans l'exemple, renseigner l'adresse appartenant au type chaîne via d'autres attributs est le deuxième problème.
PyMICE est une bibliothèque Python® pour l'analyse des données comportementales des souris. Pouvez-vous voir si c'est ce que vous voulez ?
https://neuroinflab.wordpress...
http://neuroinflab.github.io/...