Pandas DataFrames의 문자열이 변환 후에도 객체로 나타나는 이유는 무엇입니까?
DataFrame의 문자열이 객체로 저장되는 이유는 무엇입니까?
문자열이 포함된 DataFrame 열을 문자열 데이터 유형으로 명시적으로 변환했음에도 불구하고 Python의 Pandas 라이브러리 여전히 개체로 보고할 수 있습니다. 이러한 불일치는 NumPy의 기본 데이터 구조로 인해 발생합니다.
NumPy는 ndarray를 사용하여 데이터 배열을 저장하며, ndarray의 각 요소는 고정된 바이트 수를 갖습니다. 정수(int64) 및 부동 소수점 숫자(float64)의 경우 각 요소는 8바이트를 차지합니다. 그러나 문자열은 가변 길이를 가지므로 ndarray에 직접 저장하는 것은 비현실적입니다.
이를 수용하기 위해 Pandas는 객체 ndarray를 사용하여 객체에 대한 포인터를 저장합니다. 이러한 개체에는 실제 문자열 값이 포함되어 있습니다. 결과적으로 객체 ndarray는 불확실한 크기를 가지며 "객체" 데이터 유형으로 표시됩니다.
예:
4개의 64비트를 포함하는 int64 배열을 생각해 보세요. 정수 및 세 개의 문자열 객체에 대한 네 개의 포인터를 포함하는 객체 배열:
int64 array: | 1 | 2 | 3 | 4 | object array: | pointer to "hello" | pointer to "world" | pointer to "!" | Visualization: +---------+-----------+ | int64 | object | |---------+-----------| | 1 | hello | | 2 | world | | 3 | ! | | 4 | null | +---------+-----------+
이 표현에서 int64 배열은 고정된 공간을 차지하며 각 요소는 8바이트입니다. 반면, 객체 배열은 다양한 크기의 객체에 대한 포인터를 저장하므로 "객체" 데이터 유형이 됩니다.
위 내용은 Pandas DataFrames의 문자열이 변환 후에도 객체로 나타나는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











Tensorflow 또는 Pytorch로 딥 러닝을 수행하는 방법은 무엇입니까?
