Teknik persampelan berstrata dalam Python
Teknik persampelan berstrata dalam Python
Persampelan ialah kaedah pengumpulan data yang biasa digunakan dalam statistik Ia boleh memilih sebahagian daripada sampel daripada set data untuk dianalisis untuk membuat kesimpulan ciri-ciri keseluruhan set data. Dalam era data besar, jumlah data adalah besar, dan menggunakan keseluruhan sampel untuk analisis adalah memakan masa dan tidak praktikal dari segi ekonomi. Oleh itu, pemilihan kaedah persampelan yang sesuai dapat meningkatkan kecekapan analisis data. Artikel ini terutamanya memperkenalkan teknik persampelan berstrata dalam Python.
Apakah persampelan berstrata?
Dalam persampelan, persampelan berstrata ialah teknik yang biasa digunakan. Berbeza daripada persampelan rawak mudah, persampelan berstrata membahagikan data kepada beberapa lapisan dalam populasi, dan setiap lapisan mempunyai ciri atribut yang sama. Kemudian, sampel diperoleh daripada setiap lapisan mengikut kebarangkalian yang berbeza. Kaedah ini sesuai apabila terdapat ciri khas dalam populasi, terutamanya apabila ciri-ciri ini jelas Persampelan berstrata adalah kaedah persampelan statistik yang lebih berkesan.
Mengapa pensampelan berstrata?
Kelebihan pensampelan berstrata ialah ia boleh meningkatkan ketepatan pensampelan dan mengurangkan ralat pensampelan, seterusnya membina model dan inferens yang lebih baik. Dalam senario sebenar analisis data, terdapat pelbagai jenis pembolehubah dalam populasi Pemprosesan pembolehubah ini yang tidak betul akan menyebabkan penyelewengan atau ralat, menjadikan model yang telah ditetapkan tidak dapat mendekati situasi sebenar. Menggunakan teknologi persampelan berstrata, sampel yang dikumpul boleh dikawal supaya sampel yang terdiri daripada pembolehubah berbeza dapat menggambarkan dengan lebih tepat situasi sebenar populasi.
Bagaimana untuk melaksanakan pensampelan berstrata dalam Python?
Dalam Python, terdapat pelbagai pakej yang boleh melaksanakan pensampelan berstrata, yang lebih terkenal ialah perpustakaan numpy dan panda. Kedua-dua perpustakaan menyediakan banyak fungsi berguna yang boleh membantu kami melaksanakan teknik pensampelan berstrata.
Di bawah ini kami menggunakan contoh untuk menunjukkan cara menggunakan Python untuk melaksanakan pensampelan berstrata.
Dalam contoh ini, kami mengandaikan bahawa terdapat set data percubaan dengan 5 pembolehubah, termasuk jantina, umur, tinggi, berat dan sama ada untuk merokok. Set data ini sesuai dengan teknik persampelan berstrata.
Pertama, kita perlu membahagikan set data kepada lapisan yang berbeza. Kami memilih jantina sebagai pembolehubah stratifikasi dan membahagikan lelaki dan wanita kepada dua strata.
import pandas as pd # 生成测试数据 data = pd.DataFrame({ 'sex': ['M', 'M', 'M', 'F', 'F', 'F'], 'age': [18, 20, 22, 25, 27, 30], 'height': [170, 172, 175, 160, 165, 170], 'weight': [65, 70, 75, 55, 60, 65], 'smoke': [1, 1, 0, 0, 1, 0] }) # 分层抽样 male = data[data['sex'] == 'M'] female = data[data['sex'] == 'F']
Seterusnya, kita perlu menentukan saiz sampel untuk setiap tahap dan nisbah pensampelan yang sepadan. Dalam contoh ini, kami mengandaikan bahawa 10% daripada sampel diambil daripada wanita dan 20% diambil daripada lelaki.
# 分层抽样比例 sampling_prop = { 'M': 0.2, 'F': 0.1 } # 计算每个层级的样本大小 m_size = int(len(male) * sampling_prop['M']) f_size = int(len(female) * sampling_prop['F'])
Akhir sekali, kita boleh menggunakan fungsi random.choice dalam perpustakaan numpy untuk menarik sampel dari setiap peringkat. Dalam contoh ini, kami mengekstrak sampel stratum yang diperlukan daripada setiap stratum:
import numpy as np # 分层抽样 msample = male.sample(m_size) fsample = female.sample(f_size) # 整合分层样本 sample = pd.concat([msample, fsample])
Keputusan persampelan berstrata akan lebih tepat dan model yang ditubuhkan dengan sampel penuh akan lebih mudah digunakan secara meluas. Dalam amalan, menggunakan teknik persampelan berstrata boleh meningkatkan kecekapan dan ketepatan penyelidikan data, yang membawa kepada kesimpulan yang lebih tepat.
Atas ialah kandungan terperinci Teknik persampelan berstrata dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Perkongsian Petua Win11: Satu helah untuk melangkau log masuk akaun Microsoft Windows 11 ialah sistem pengendalian terkini yang dilancarkan oleh Microsoft, dengan gaya reka bentuk baharu dan banyak fungsi praktikal. Walau bagaimanapun, bagi sesetengah pengguna, perlu log masuk ke akaun Microsoft mereka setiap kali mereka boot sistem boleh menjadi agak menjengkelkan. Jika anda salah seorang daripada mereka, anda juga boleh mencuba petua berikut, yang akan membolehkan anda melangkau log masuk dengan akaun Microsoft dan memasuki antara muka desktop secara langsung. Pertama, kita perlu mencipta akaun tempatan dalam sistem untuk log masuk dan bukannya akaun Microsoft. Kelebihan melakukan ini ialah

Dalam bahasa C, ia mewakili penunjuk, yang menyimpan alamat pembolehubah lain & mewakili pengendali alamat, yang mengembalikan alamat memori pembolehubah. Petua untuk menggunakan penunjuk termasuk mentakrifkan penunjuk, membatalkan rujukan dan memastikan bahawa penunjuk menunjuk ke alamat yang sah & termasuk mendapatkan alamat pembolehubah, dan mengembalikan alamat elemen pertama tatasusunan apabila mendapatkan alamat elemen tatasusunan; . Contoh praktikal yang menggambarkan penggunaan penunjuk dan pengendali alamat untuk membalikkan rentetan.

Kami sering membuat dan mengedit jadual dalam excel, tetapi sebagai orang baru yang baru bersentuhan dengan perisian, cara menggunakan excel untuk mencipta jadual bukanlah semudah bagi kami. Di bawah, kami akan menjalankan beberapa latihan mengenai beberapa langkah penciptaan meja yang perlu dikuasai oleh pemula, iaitu pemula, Kami berharap ia akan membantu mereka yang memerlukan. Contoh borang untuk pemula ditunjukkan di bawah: Mari lihat cara melengkapkannya! 1. Terdapat dua kaedah untuk mencipta dokumen excel baharu. Anda boleh klik kanan tetikus pada lokasi kosong pada fail [Desktop] - [Baru] - [xls]. Anda juga boleh [Mula]-[Semua Program]-[Microsoft Office]-[Microsoft Excel 20**] 2. Dwiklik bekas baharu kami

VSCode (Visual Studio Code) ialah editor kod sumber terbuka yang dibangunkan oleh Microsoft Ia mempunyai fungsi yang berkuasa dan sokongan pemalam yang kaya, menjadikannya salah satu alat pilihan untuk pembangun. Artikel ini akan menyediakan panduan pengenalan untuk pemula untuk membantu mereka menguasai kemahiran menggunakan VSCode dengan cepat. Dalam artikel ini, kami akan memperkenalkan cara memasang VSCode, operasi penyuntingan asas, kekunci pintasan, pemasangan pemalam, dsb., dan menyediakan contoh kod khusus kepada pembaca. 1. Pasang VSCode dahulu, kita perlu

Kemahiran pertanyaan pangkalan data Oracle: Untuk mendapatkan hanya satu keping data pendua, contoh kod khusus diperlukan Dalam pertanyaan pangkalan data sebenar, kita sering menghadapi situasi di mana kita perlu mendapatkan satu-satunya data daripada data pendua. Artikel ini akan memperkenalkan cara menggunakan teknik pangkalan data Oracle untuk mendapatkan hanya satu rekod dalam data pendua, dan menyediakan contoh kod khusus. Penerangan Senario Katakan kita mempunyai jadual bernama pekerja, yang mengandungi maklumat pekerja mungkin terdapat pendua maklumat pekerja. Kita perlu mencari semua pendua

Helah Win11 didedahkan: Cara memintas log masuk akaun Microsoft Baru-baru ini, Microsoft melancarkan sistem pengendalian baharu Windows11, yang telah menarik perhatian meluas. Berbanding dengan versi sebelumnya, Windows 11 telah membuat banyak pelarasan baharu dari segi reka bentuk antara muka dan penambahbaikan fungsi, tetapi ia juga telah menyebabkan beberapa kontroversi Perkara yang paling menarik perhatian ialah ia memaksa pengguna untuk log masuk ke sistem dengan akaun Microsoft . Bagi sesetengah pengguna, mereka mungkin lebih terbiasa log masuk dengan akaun tempatan dan tidak bersedia untuk mengikat maklumat peribadi mereka ke akaun Microsoft.

Tajuk: Petua Pengaturcaraan PHP: Cara Melompat ke Halaman Web dalam masa 3 Saat Dalam pembangunan web, kita sering menghadapi situasi di mana kita perlu melompat ke halaman lain secara automatik dalam tempoh masa tertentu. Artikel ini akan memperkenalkan cara menggunakan PHP untuk melaksanakan teknik pengaturcaraan untuk melompat ke halaman dalam masa 3 saat, dan memberikan contoh kod khusus. Pertama sekali, prinsip asas lompat halaman direalisasikan melalui medan Lokasi dalam pengepala respons HTTP. Dengan menetapkan medan ini, penyemak imbas secara automatik boleh melompat ke halaman yang ditentukan. Di bawah ialah contoh mudah yang menunjukkan cara menggunakan P

Borang adalah bahagian penting dalam menulis laman web atau aplikasi. Laravel, sebagai rangka kerja PHP yang popular, menyediakan kelas bentuk yang kaya dan berkuasa, menjadikan pemprosesan borang lebih mudah dan lebih cekap. Artikel ini akan memperkenalkan beberapa petua tentang menggunakan kelas borang Laravel untuk membantu anda meningkatkan kecekapan pembangunan. Yang berikut menerangkan secara terperinci melalui contoh kod tertentu. Mencipta borang Untuk mencipta borang dalam Laravel, anda perlu menulis borang HTML yang sepadan dalam paparan terlebih dahulu. Apabila bekerja dengan borang, anda boleh menggunakan Laravel
