使用python的pandas模块时，查找和修改dataFrame中的值速度非常慢，请问是什么原因，有什么好办法解决吗？

Question

最近在用pandas做一个机器学习的项目，训练集大概2G。我用的dataFrame来操作数据，对训练集做了一次groupby和mean的操作，速度还挺快的，但把得到的结果赋值给用户参数（也是一个dataframe表）的时候，速度缺特别...

阿神 · Answer

Panda mempunyai penjana df.iterrows() untuk menggelung melalui baris DataFrame, yang merupakan yang paling cekap.

Untuk butiran, sila lihat dokumentasi:
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.iterrows.html

ringa_lee · Answer

Saya tidak pernah melakukan apa-apa magnitud ini, tetapi pengalaman saya adalah yang terbaik untuk tidak mengendalikan df satu demi satu Ia pada dasarnya perlahan, dan keseluruhan operasi lajur adalah lebih pantas
1 (tambah)
Sebaik-baiknya tulis semua nilai baharu dalam df kosong, dan kemudian gabungkan
, tetapi kadangkala tidak dapat dielakkan untuk ditambahkan secara langsung
2. Ia lebih pantas untuk dipadamkan dan gunakan pernyataan del secara langsung
3 .Menukar
juga menerima pakai idea menggabungkan, menimpa nilai asal

高洛峰 · Answer

Saya tidak fikir tugasan itu lambat
self.user_params.loc[user,'bias'] adalah bersamaan dengan mengambil indeks peringkat kedua daripada indeks peringkat pertama, yang sepatutnya sangat perlahan
Bolehkah anda meletakkan item dan pengguna Bagaimana pula dengan membahagikannya kepada dua bingkai data?

PHP中文网 · Answer

loc adalah yang paling perlahan. Cuba gunakan ix sebaliknya. Lebih baik menggunakan iterrow untuk membina gelung.