astype() 함수는 DataFrame 또는 Series의 열이나 데이터세트를 특정 데이터 유형으로 변환하기 위해 pandas 라이브러리에서 주로 사용되는 Python의 강력한 메서드입니다. 배열 요소를 다른 유형으로 변환하기 위해 NumPy에서도 사용할 수 있습니다.
astype() 함수는 Pandas 객체(예: Series 또는 DataFrame) 또는 NumPy 배열의 데이터 유형을 다른 유형으로 변환하는 데 사용됩니다.
DataFrame.astype(dtype, copy=True, errors='raise')
ndarray.astype(dtype, order='K', casting='unsafe', subok=True, copy=True)
데이터를 변환하려는 대상 데이터 유형입니다. 이는 다음을 사용하여 지정할 수 있습니다.
import pandas as pd # Example DataFrame df = pd.DataFrame({'A': ['1', '2', '3'], 'B': [1.5, 2.5, 3.5]}) # Convert column 'A' to integer df['A'] = df['A'].astype(int) print(df.dtypes)
출력:
A int64 B float64 dtype: object
# Convert multiple columns df = df.astype({'A': float, 'B': int}) print(df.dtypes)
출력:
DataFrame.astype(dtype, copy=True, errors='raise')
ndarray.astype(dtype, order='K', casting='unsafe', subok=True, copy=True)
출력:
import pandas as pd # Example DataFrame df = pd.DataFrame({'A': ['1', '2', '3'], 'B': [1.5, 2.5, 3.5]}) # Convert column 'A' to integer df['A'] = df['A'].astype(int) print(df.dtypes)
A int64 B float64 dtype: object
출력:
# Convert multiple columns df = df.astype({'A': float, 'B': int}) print(df.dtypes)
A float64 B int64 dtype: object
출력:
df = pd.DataFrame({'A': ['1', 'two', '3'], 'B': [1.5, 2.5, 3.5]}) # Attempt conversion with errors='ignore' df['A'] = df['A'].astype(int, errors='ignore') print(df)
A B 0 1 1.5 1 two 2.5 2 3 3.5
출력:
import numpy as np # Example array arr = np.array([1.1, 2.2, 3.3]) # Convert to integer arr_int = arr.astype(int) print(arr_int)
[1 2 3]
최적화 전(원래 메모리 사용량):
arr = np.array([1.1, 2.2, 3.3]) # Attempt an unsafe conversion try: arr_str = arr.astype(str, casting='safe') except TypeError as e: print(e)
최적화 후(최적화된 메모리 사용량):
Cannot cast array data from dtype('float64') to dtype('<U32') according to the rule 'safe'
원래 메모리 사용량:
최적화된 메모리 사용량:
df = pd.DataFrame({'A': ['2022-01-01', '2023-01-01'], 'B': ['True', 'False']}) # Convert to datetime and boolean df['A'] = pd.to_datetime(df['A']) df['B'] = df['B'].astype(bool) print(df.dtypes)
오류='무시'가 포함된 자동 오류: 자동으로 변환에 실패할 수 있으므로 주의해서 사용하세요.
정밀도 손실: 정밀도가 높은 유형(예: float64)에서 정밀도가 낮은 유형(예: float32)으로 변환합니다.
A datetime64[ns] B bool dtype: object
출력:
import pandas as pd # Original DataFrame df = pd.DataFrame({'A': [1, 2, 3], 'B': [1.1, 2.2, 3.3]}) print("Original memory usage:") print(df.memory_usage()) # Downcast numerical types df['A'] = df['A'].astype('int8') df['B'] = df['B'].astype('float32') print("Optimized memory usage:") print(df.memory_usage())
Index 128 A 24 B 24 dtype: int64
출력:
DataFrame.astype(dtype, copy=True, errors='raise')
astype() 함수는 Pandas와 NumPy 모두에서 데이터 유형 변환을 위한 다목적 도구입니다. 이를 통해 캐스팅 동작, 메모리 최적화 및 오류 처리를 세밀하게 제어할 수 있습니다. Pandas의 오류 및 NumPy의 캐스팅과 같은 매개변수를 적절하게 사용하면 강력하고 효율적인 데이터 유형 변환이 보장됩니다.
위 내용은 Python의 astype() 함수는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!