Pandas는 Python 사용자를 위한 포괄적인 데이터 분석 도구 세트를 제공합니다. 일반적인 과제 중 하나는 다양한 소스에서 DataFrame으로 데이터를 가져오는 것입니다. 특히 문자열은 테스트나 기타 목적으로 표 형식 데이터를 저장하는 편리한 방법이 될 수 있습니다.
다음과 같이 세미콜론으로 구분된 데이터가 포함된 문자열이 있는 경우
TESTDATA="""col1;col2;col3 1;4.4;99 2;4.5;200 3;4.7;65 4;3.2;140 """
쉽게 다음을 수행할 수 있습니다. 문자열에 파일과 유사한 버퍼를 제공하는 StringIO를 활용하여 이를 Pandas DataFrame으로 변환합니다. 다음 코드는 이를 수행하는 방법을 보여줍니다.
import pandas as pd from io import StringIO TESTDATA = StringIO("""col1;col2;col3 1;4.4;99 2;4.5;200 3;4.7;65 4;3.2;140 """) df = pd.read_csv(TESTDATA, sep=";")
이 코드는 pd.read_csv() 함수를 사용하여 TESTDATA 문자열을 CSV 파일로 구문 분석하고 세미콜론을 구분 기호로 처리합니다. df라는 결과 DataFrame에는 문자열의 구조화된 데이터가 포함됩니다.
StringIO를 활용하면 문자열을 파일 객체인 것처럼 편리하게 작업할 수 있으므로 다양한 소스의 데이터를 Pandas로 쉽게 가져올 수 있습니다. 분석 및 조작을 위한 DataFrame.
위 내용은 Python의 세미콜론으로 구분된 문자열에서 Pandas DataFrame을 어떻게 만들 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!