私のニーズでは、データのクエリと複数のデータベース間の相関関係が必要なので、パンダを使用し、read_sql を通じてデータを読み取り、それをデータフレームに処理してターゲット データを直接生成することにしました。ただし、現在、read_sql が非常に遅いという問題が発生しています。たとえば、37W のデータ ボリューム (22 フィールド) のテーブルを Oracle ライブラリのデータフレームに読み取るには 4 分半かかります。コードは以下のように表示されます:
リーリー4分32秒かかりました
別の単純で大雑把な方法を使用したとしても、read_sql よりもはるかに高速になります。コードは以下のように表示されます:
リーリー1分31秒かかりました
パンダの read_sql を最適化し、速度を向上させる方法があるかどうか、ここにいる皆さんに尋ねたいと思います。ありがとうございました~
リーリー