내 요구 사항에는 여러 데이터베이스 간의 데이터 쿼리 및 상관 관계가 필요하므로 pandas를 사용하고 read_sql을 통해 데이터를 읽고 데이터 프레임으로 처리하여 대상 데이터를 직접 생성하기로 결정했습니다. 그러나 현재 문제가 발생했습니다. read_sql이 매우 느립니다. 예를 들어 37W 데이터 볼륨(22개 필드) 테이블을 Oracle 라이브러리의 데이터 프레임으로 읽는 데 4분 30초가 걸립니다. 코드는 다음과 같습니다:
으아악4분 32초 걸렸습니다
다른 간단하고 투박한 방법을 사용하더라도 read_sql보다 훨씬 빠릅니다. 코드는 다음과 같습니다:
으아악1분 31초 걸렸습니다
Pandas에서 read_sql의 속도를 최적화할 수 있는 방법이 있는지 여기 계신 분들께 여쭤보고 싶습니다. 정말 감사합니다~
으아악