NumPy singkatan kepada Numerical Python. Ciri NumPy yang paling berkuasa ialah tatasusunan n-dimensi. Pustaka ini juga mengandungi fungsi algebra linear asas, transformasi Fourier, keupayaan nombor rawak lanjutan dan alatan untuk penyepaduan dengan bahasa peringkat rendah lain seperti Fortran, C dan C
SciPy singkatan daripada Scientific Python. SciPy dibina pada NumPy. Ia merupakan salah satu perpustakaan yang paling berguna untuk pelbagai modul sains dan kejuruteraan peringkat tinggi seperti transformasi Fourier diskret, Algebra Linear, Pengoptimuman dan matriks Jarang.
Matplotlib untuk memplot pelbagai jenis graf, bermula daripada histogram ke plot garisan ke plot panas.. Anda boleh menggunakan ciri Pylab dalam buku nota ipython (buku nota ipython –pylab = sebaris) untuk menggunakan ciri pemplotan ini sebaris. Jika anda mengabaikan pilihan sebaris, maka pylab menukar persekitaran ipython kepada persekitaran, sangat serupa dengan Matlab. Anda juga boleh menggunakan arahan Lateks untuk menambah matematik pada plot anda.
Panda untuk operasi dan manipulasi data berstruktur. Ia digunakan secara meluas untuk data dan penyediaan. Panda telah ditambah baru-baru ini pada Python dan telah memainkan peranan penting dalam meningkatkan penggunaan Python dalam komuniti saintis data.
Scikit Learn untuk pembelajaran mesin. Dibina pada NumPy, SciPy dan matplotlib, pustaka ini mengandungi banyak alatan yang cekap untuk pembelajaran mesin dan pemodelan statistik termasuk pengelasan, regresi, pengelompokan dan pengurangan dimensi.
Statsmodels untuk pemodelan statistik. Statsmodels ialah modul Python yang membolehkan pengguna meneroka data, menganggar model statistik dan melakukan ujian statistik. Senarai luas statistik deskriptif, ujian statistik, fungsi plot dan statistik keputusan tersedia untuk jenis data yang berbeza dan setiap penganggar.
Seaborn untuk visualisasi data statistik. Seaborn ialah perpustakaan untuk membuat grafik statistik yang menarik dan bermaklumat dalam Python. Ia berdasarkan matplotlib. Seaborn bertujuan untuk menjadikan visualisasi sebagai bahagian penting dalam meneroka dan memahami data.
Bokeh untuk membuat plot interaktif, papan pemuka dan aplikasi data pada penyemak imbas web moden. Ia memberi kuasa kepada pengguna untuk menjana grafik yang elegan dan ringkas dalam gaya D3.js. Selain itu, ia mempunyai keupayaan interaktiviti berprestasi tinggi berbanding set data yang sangat besar atau penstriman.
Blaze untuk memperluaskan keupayaan Numpy dan Pandas kepada set data yang diedarkan dan menstrim. Ia boleh digunakan untuk mengakses data daripada pelbagai sumber termasuk Bcolz, MongoDB, SQLAlchemy, Apache Spark, PyTables, dll. Bersama-sama dengan Bokeh, Blaze boleh bertindak sebagai alat yang sangat berkuasa untuk mencipta visualisasi dan papan pemuka yang berkesan pada sebahagian besar data.
Scrapy untuk merangkak web. Ia adalah rangka kerja yang sangat berguna untuk mendapatkan corak data tertentu. Ia mempunyai keupayaan untuk bermula pada url rumah tapak web dan kemudian menggali halaman web dalam tapak web untuk mengumpul maklumat.
SymPy untuk pengiraan simbolik. Ia mempunyai keupayaan yang luas daripada aritmetik simbolik asas kepada kalkulus, algebra, matematik diskret dan fizik kuantum. Satu lagi ciri berguna ialah keupayaan memformatkan hasil pengiraan sebagai kod LaTeX.
Permintaan untuk mengakses web. Ia berfungsi serupa dengan perpustakaan python standard urllib2 tetapi lebih mudah untuk dikodkan. Anda akan mendapati perbezaan yang ketara dengan urllib2 tetapi untuk pemula, Permintaan mungkin lebih mudah.
Perpustakaan tambahan, anda mungkin memerlukan:
os untuk Sistem pengendalian dan operasi fail
networkx dan igraph untuk manipulasi data berasaskan graf
ungkapan biasa untuk mencari corak dalam data teks
BeautifulSoup untuk membuang web. Ia adalah lebih rendah daripada Scrapy kerana ia akan mengekstrak maklumat daripada hanya satu halaman web dalam larian.
Sumber Sains Data: https://t.me/DataScienceResourcesTP
Atas ialah kandungan terperinci Perpustakaan PYTHON yang Berguna untuk Sains Data. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!