최근 프로젝트에서는 분석에 사용되는 데이터가 다양하기 때문에 두 가지 골치 아픈 부분이 있습니다.
1. 누락된 값을 처리하는 귀중한 마우스 패키지입니다. 다목적 Python에도 비슷한 것이 있나요?
2. 문자열 유형이 포함된 결측값을 채우는 방법은 무엇인가요? 클러스터링과 회귀는 모두 숫자 유형에 상대적입니다. 그렇다면 문자 유형에 대한 좋은 알고리즘이나 좋은 캡슐화 패키지는 무엇입니까?
하나님께 답을 구해보세요.
PS: 예를 설명하기 어렵기 때문에 다음과 같습니다.
이름, 비밀번호, 나이, 주소
Zhang San, 123456, 15.3, sichuang
Li Si, 12, 12.2, wuhan
Wang Wu, 232, 12 ,
Qianliu,,23,nanchang
하하,123456,,lal
拉拉,123123,,mmm
우리는 R 언어의 마우스 패키지처럼 Python을 사용하여 누락된 값을 빠르게 채울 수 있기를 바랍니다(물론 이 예의 정보는 그다지 관련성이 없지만 처리할 데이터는 더 관련성이 높습니다). 이 예에서는 문자열 유형에 속하는 주소를 완전히 채우기 위해 다른 속성을 사용하는 것이 두 번째 문제입니다.
으아악 으아악
PyMICE는 쥐 행동 데이터 분석을 위한 Python® 라이브러리입니다. 원하는 대로 작동하는지 확인할 수 있나요?
https://neuroinflab.wordpress...
http://neuroinflab.github.io/...