ビッグデータ時代の到来により、CSV ファイルは非常に重要なデータ交換形式になりました。日常のデータ処理では、一部のデータをフィルターで除外したり、一部のキーワードを置き換えたりするなど、CSV ファイルに対してカスタマイズされた処理を実行する必要があることがよくあります。 Python では、正規表現を使用してこれらのタスクを非常に簡単に実行できます。この記事では、Python 正規表現を使用して CSV ファイルを処理する方法を紹介します。
まず、CSV ファイルを読み取る必要があります。 Python では、csv モジュールを使用して CSV ファイルを簡単に読み取ることができます。
import csv
with open('data.csv', newline='') as csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: print(', '.join(row))
上記のコードは、data.csv ファイルという名前の CSV を読み取ります。そしてその内容を一行ずつ出力します。パラメータ delimiter は区切り文字を指定し、quotechar は引用符を指定します。
次に、正規表現を使用して CSV ファイル内のデータをフィルタリングできます。たとえば、最初の列に数字が含まれる行のみを選択できます。
import csv
import re
with open('data.csv', newline='') as csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: if re.match(r'[0-9]+', row[0]): print(', '.join(row))
上記のコードは re モジュールを使用していますmatch 関数は、最初の列が数値であるすべての行を出力します。
データのフィルタリングに加えて、正規表現を使用して CSV ファイル内のキーワードを置換することもできます。たとえば、apple で始まるすべての単語を orange に置き換えることができます。
import csv
import re
with open('data.csv', newline='') as csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: row[0] = re.sub(r'^apple', 'orange', row[0]) print(', '.join(row))
上記のコードは re モジュールを使用していますサブ関数は、apple で始まるすべての単語を orange に置き換えます。
最後に、処理したデータを CSV ファイルに書き込む必要があります。 Python では、csv モジュールを使用して CSV ファイルを記述することもできます。
import csv
data = [
['apple', 'banana', 'cherry'], ['dog', 'cat', 'mouse'], ['sun', 'moon', 'star']
]
with open('output.csv', 'w', newline='') as csvfile:
writer = csv.writer(csvfile, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL) for row in data: writer.writerow(row)
上記のコードは、output.csv という名前の CSV ファイルにデータ リストを書き込みます。パラメーター delimiter と quotechar は CSV ファイルを読み取るためのパラメーターに相当し、quoting パラメーターは CSV ファイルの処理方法を指定します引用符。
要約すると、Python 正規表現を使用して CSV ファイルを処理するのは非常に簡単で便利です。正規表現を適切に使用することで、複雑な CSV ファイル処理タスクを簡単に実装できます。
以上がCSV ファイル処理に Python 正規表現を使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。