最近のプロジェクトでは、欠損値への対処方法が研究されています。分析に使用されるデータが多様であるため、欠損値もごく一部に含まれます。頭の痛い問題が 2 つあります:
1. マウス パッケージがあります。欠損値の処理に特化したものですが、汎用の Python にも同様のものはありますか?
2. 文字列型を含む欠損値を埋めるにはどうすればよいですか?クラスタリングと回帰はすべて数値型に関連しています。では、文字型に適したアルゴリズムやカプセル化パッケージは何でしょうか?
神に答えを求めてください。
PS: 例については、説明するのが難しいので次のようになります:
名前,パスワード,年齢,住所
Zhang San,123456,15.3,sichuang
李思,12 ,12.2, 武漢
王五,232,12,
钱六,,23,南昌
haha,123456,,lal
拉拉,123123,,mmm
R 言語のマウス パッケージのように、Python を使用して欠落している値をすばやく埋めることができることを願っています (もちろん、この例の情報はあまり関連性がありませんが、処理されるデータはより多くの値を必要とします)例のように、他の属性を使用して文字列型に属するアドレスを埋めることが 2 番目の問題です。
リーリー リーリー
PyMICE は、マウスの行動データ分析用の Python® ライブラリです。お望みのものかどうかわかりますか?
https://neuroinflab.wordpress...
http://neuroinflab.github.io/...