이 글은 Python의 pandas에서 일반적으로 사용되는 기능을 요약한 것입니다. 도움이 필요한 친구들이 참고할 수 있기를 바랍니다.
pandas는 Python의 데이터 처리 라이브러리로, 사용 시 먼저 import pandas as pd
를 입력해야 소개가 됩니다.
1.df = pd.read_csv("파일 경로"): csv 파일을 읽는 방법입니다. 엑셀이나 다른 문서를 읽으려면 해당 읽기 기능이 있습니다.
2.df.dtypes: 파일에 문자 데이터가 있으면 객체가 반환됩니다.
3.df.head(n): 데이터의 처음 n개 행을 표시합니다. 매개변수가 전달되지 않으면 데이터의 처음 5개 행이 표시됩니다.
4.df.tail(n): 마지막 n개 행의 데이터를 표시합니다. 매개변수가 전달되지 않으면 마지막 5개 행의 데이터가 표시됩니다.
5.df.columns: 데이터 테이블의 컬럼명을 리스트 형태로 출력한다.
6.df.shape: 테이블의 데이터 행과 열 수를 튜플 형식으로 표시합니다.
7.df.loc[n]: 인덱스 값 n이 있는 행을 반환합니다.
8.df.loc[m][n]: 인덱스 값이 m행, n열인 데이터를 반환합니다.
9.df.loc[m:n]: 인덱스 값이 m부터 n까지인 행을 반환합니다.
10.df.loc[[m,n,k]]: 인덱스 값이 각각 m,n,k인 행을 반환합니다.
11.df["str"]: str이라는 열을 반환합니다.
12.df.columns.tolist(): 열 이름을 목록으로 만듭니다.
13.df["str"]*df["str"]: 두 열의 크기가 동일한 경우 두 열의 해당 위치가 곱해집니다.
14.df.sort_values("str",inplace=True,ascending=False): str 열을 내림차순으로 정렬하고, 원본 데이터를 얻은 데이터로 바꿉니다. inplace는 원본 데이터를 정렬된 데이터로 대체할지 여부를 나타냅니다. 기본값은 대체가 없음을 의미하는 False입니다. 오름차순은 정렬 순서를 나타내며 기본값은 True입니다. 즉, 오름차순으로 정렬됩니다.
15.judge = pd.isnull(df["str"]): str 열의 데이터가 null 값인 경우 null이 아닌 경우 True를 반환합니다. 값이면 False를 반환합니다.
16.a["judge"]: 누락된 데이터인 Judge를 True로 반환합니다. 이때 누락된 데이터의 개수를 찾으려면 len() 함수를 호출합니다.
17.df.pivot_table(index="a",values="b",aggfunc=np.mean): 이것은 매우 중요한 함수인 평균 b 에 따라 분류됩니다. a의 범주에서 세 번째 매개변수의 기본값은 평균입니다.
18.df.loc[n,"str"]: 행 n, 열 이름 str에서 데이터를 찾습니다.
19.sort_res.reset_index(drop=True): 정렬된 데이터의 개수를 재배열합니다. Drop은 원본 데이터를 삭제할지 여부를 나타냅니다. 실행 결과를 그림 14와 비교하면 숫자가 재배열된 것을 확인할 수 있습니다.
20.df.apply(): 팬더에서 사용자 정의 함수를 사용하는 방법입니다. 함수 이름.
위 내용은 Python의 pandas에서 일반적으로 사용되는 함수 요약의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!