Melangkau Baris Semasa Import CSV dengan Panda
Apabila mengimport data CSV menggunakan Panda, selalunya perlu melangkau baris yang anda tidak mahu untuk dimasukkan dalam analisis anda. Walau bagaimanapun, kekaburan yang menyelubungi hujah skiprows boleh mengelirukan.
Sintaks untuk skiprows adalah seperti berikut:
skiprows : list-like or integer Row numbers to skip (0-indexed) or number of rows to skip (int) at the start of the file.
Persoalannya timbul: Bagaimana Panda tahu sama ada untuk melangkau baris pertama atau baris dengan indeks 1 apabila skiprows=1 ditentukan?
Untuk membongkar perkara ini, mari kita lakukan percubaan menggunakan sampel fail CSV dengan tiga baris:
1, 2 3, 4 5, 6
Melangkau Baris dengan Indeks 1
Jika anda ingin melangkau baris dengan indeks 1, lulus skiprows sebagai senarai:
<code class="python">import pandas as pd from io import StringIO s = """1, 2 ... 3, 4 ... 5, 6""" df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skip row with index 1 print(df)</code>
Output:
0 1 0 1 2 1 5 6
Melangkau Bilangan Baris
Untuk melangkau bilangan baris tertentu (dalam kes ini, 1), lulus skiprows sebagai integer:
<code class="python">df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Skip the first row print(df)</code>
Output:
0 1 0 3 4 1 5 6
Oleh itu, jelas bahawa hujah skiprows berkelakuan berbeza bergantung pada sama ada anda memberikan senarai atau integer. Jika anda ingin melangkau baris mengikut indeksnya, gunakan senarai. Jika tidak, gunakan integer untuk melangkau bilangan baris tertentu dari permulaan fail.
Atas ialah kandungan terperinci Bagaimanakah `skiprows` dalam Panda tahu jika anda ingin melangkau baris pertama atau baris dengan indeks 1?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!