Aktuelle Projekte haben den Umgang mit fehlenden Werten untersucht. Da die für die Analyse verwendeten Daten unterschiedlich sind, gibt es auch zwei Probleme:
1 Gibt es im Allzweck-Python etwas Ähnliches, das fehlende Werte behandelt?
2. Wie fülle ich fehlende Werte mit Zeichenfolgentypen aus? Clustering und Regression beziehen sich alle auf numerische Typen. Was sind also gute Algorithmen oder gute Kapselungspakete für Zeichentypen?
Bitte bitte Gott um Antworten.
PS: Nun, es ist schwer, das Beispiel zu beschreiben, daher lautet es wie folgt:
Name, Passwort, Alter, Adresse
Zhang San, 123456, 15.3, Sichuang
Li Si, 12, 12.2, Wuhan
Wang Wu, 232, 12 ,
Qianliu,,23,nanchang
haha,123456,,lal
拉拉,123123,,mmm
Wir hoffen, dass wir wie beim Mäusepaket in der R-Sprache Python verwenden können, um die fehlenden Werte schnell auszufüllen (natürlich sind die Informationen in diesem Beispiel nicht sehr relevant, aber die zu verarbeitenden Daten sind relevanter) und Es wird nie wieder dasselbe sein. Im Beispiel ist das Ausfüllen der zum String-Typ gehörenden Adresse über andere Attribute das zweite Problem.
PyMICE is a Python® library for mice behavioural data analysis.你可以看看是不是你要的?
https://neuroinflab.wordpress...
http://neuroinflab.github.io/...