시나리오:
Pandas DataFrame 내의 데이터는 다양한 형식으로 존재하는 경우가 많습니다. 문자열을 포함합니다. 시간 데이터로 작업할 때 타임스탬프는 처음에 문자열로 나타날 수 있지만 정확한 분석을 위해 날짜/시간 형식으로 변환해야 합니다.
날짜 기반 변환 및 필터링
Pandas에서 문자열 열을 datetime으로 변환하려면 to_datetime 함수를 활용하세요. 이 함수는 문자열 열의 예상 형식을 지정하는 형식 인수를 사용합니다.
예:
문자열을 포함하는 열(Mycol)이 있는 다음 DataFrame을 생각해 보세요. 사용자 정의 형식:
import pandas as pd raw_data = pd.DataFrame({'Mycol': ['05SEP2014:00:00:00.000']})
이 열을 날짜/시간으로 변환하려면 다음을 사용하십시오. 코드:
df['Mycol'] = pd.to_datetime(df['Mycol'], format='%d%b%Y:%H:%M:%S.%f')
지정된 형식 인수가 지정된 문자열 형식과 일치합니다. 변환 후 Mycol 열에는 이제 날짜/시간 개체가 포함됩니다.
날짜 기반 필터링
열이 날짜/시간으로 변환되면 날짜 기반 필터링 작업을 수행할 수 있습니다. . 예를 들어, 날짜가 특정 범위에 속하는 행을 선택하려면:
start_date = '01SEP2014' end_date = '30SEP2014' filtered_df = df[(df['Mycol'] >= pd.to_datetime(start_date)) & (df['Mycol'] <= pd.to_datetime(end_date))]
결과 Filter_df에는 Mycol 열 값이 지정된 날짜 사이에 있는 행만 포함됩니다.
위 내용은 Pandas DataFrame 열을 DateTime 형식으로 변환하고 날짜별로 필터링하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!