この記事では主に、大きな CSV ファイルを 1 行ずつ読み込むための PHP 用のパッケージ クラスを紹介します。このクラスは、必要な他の大きなテキスト ファイルにも適しています。
大きな CSV ファイルの読み取りについては以前に説明しました (PHP で大きな CSV ファイルを 1 行ずつ読み取り、処理するコード例) が、大きなファイルを迅速かつ完全に操作する方法にはまだいくつかの問題があります。
1. 大きな CSV ファイルの合計行数をすばやく取得するにはどうすればよいですか?
方法 1: ファイルの内容を直接取得し、改行文字を使用して分割して合計行数を取得します。この方法は、小さなファイルには実行可能ですが、大きなファイルを処理する場合には実行できません。
方法 2: fgets を使用して行ごとに走査し、合計行数を取得します。この方法は方法 1 よりも優れていますが、サイズの大きいファイルではタイムアウトが発生する可能性があります。
方法 3: SplFileObject クラスを使用してポインターをファイルの末尾に直接配置し、SplFileObject::key メソッドを通じて総行数を取得します。この方法は実現可能で効率的です。
具体的な実装方法:
コードは次のとおりです:
$csv_file = 'パス/bigfile.csv';
$spl_object = 新しい SplFileObject($csv_file, 'rb');
$spl_object->seek(filesize($csv_file));
echo $spl_object->key();
2. 大きな CSV ファイルからデータをすばやく取得するにはどうすればよいですか?
引き続き PHP の SplFileObject クラスを使用して、seek メソッドによる迅速な位置決めを実現します。
コードは次のとおりです:
$csv_file = 'パス/bigfile.csv';
$start = 100000; // 100000行目から読み込みを開始します
$num = 100; // 100 行を読み取ります
$data = 配列();
$spl_object = 新しい SplFileObject($csv_file, 'rb');
$spl_object->seek($start);
while ($num-- && !$spl_object->eof()) {
$data[] = $spl_object->fgetcsv();
$spl_object->next();
}
print_r($data);
3. 上記の2点を踏まえて、csvファイルを読み込むためのクラスに整理します。
コードは次のとおりです:
クラス CsvReader {
プライベート $csv_file;
プライベート $spl_object = null;
プライベート $error;
パブリック関数 __construct($csv_file = '') {
if($csv_file && file_exists($csv_file)) {
$this->csv_file = $csv_file;
}
}
パブリック関数 set_csv_file($csv_file) {
if(!$csv_file || !file_exists($csv_file)) {
$this->error = 'ファイルが無効です';
false を返す;
}
$this->csv_file = $csv_file;
$this->spl_object = null;
}
パブリック関数 get_csv_file() {
$this->csv_file を返す;
}
プライベート関数 _file_valid($file = '') {
$file = $file ? $file : $this->csv_file;
if(!$file || !file_exists($file)) {
false を返す;
}
if(!is_readable($file)) {
false を返す;
}
true を返す;
}
プライベート関数 _open_file() {
if(!$this->_file_valid()) {
$this->error = 'ファイルが無効です';
false を返す;
}
if($this->spl_object == null) {
$this->spl_object = 新しい SplFileObject($this->csv_file, 'rb');
}
true を返す;
}
パブリック関数 get_data($length = 0, $start = 0) {
if(!$this->_open_file()) {
false を返す;
}
$length = $length ? $this->get_lines();
$start = $start - 1;
$start = ($start
$data = array();
$this->spl_object->seek($start);
while ($length-- && !$this->spl_object->eof()) {
$data[] = $this->spl_object->fgetcsv();
$this->spl_object->next();
}
$data を返す;
}
パブリック関数 get_lines() {
if(!$this->_open_file()) {
false を返す;
}
$this->spl_object->seek(filesize($this->csv_file));
$this->spl_object->key();
を返す}
パブリック関数 get_error() {
$this->エラーを返す;
}
}
呼び出し方法は以下の通りです:
コードは次のとおりです:
include('CsvReader.class.php');
$csv_file = 'パス/bigfile.csv';
$csvreader = 新しい CsvReader($csv_file);
$line_number = $csvreader->get_lines();
$data = $csvreader->get_data(10);
エコー $line_number, chr(10);
print_r($data);
実際、上記の CsvReader クラスは CSV の大きなファイルだけでなく、クラス内の fgetcsv メソッドを現在のものに少し変更すれば、大きなファイルや他のテキスト タイプの非常に大きなファイルにも使用できます。