Der Inhalt dieses Artikels befasst sich mit der Verwendung von PHPSpreadsheet zum Lesen von Excel- und CSV-Dateien (mit Beispielen). Ich hoffe, dass er Ihnen weiterhilft hat geholfen.
Es gibt viele Bibliotheken für PHP zum Lesen von Excel- und CSV-Dateien, aber die am häufigsten verwendeten sind: PHPOffice/PHPExcel, PHPOffice/PhpSpreadsheet. Die neueste Version wird nicht mehr gepflegt 1. Die erste Einreichung erfolgte am 25. Dezember 2017. Es wird empfohlen, PHPSpreadsheet direkt zu verwenden, und die beiden Projekte werden von derselben Organisation verwaltet. In diesem Artikel wird die Verwendung von PHPSpreadsheet vorgestellt.
Einführung in PhpSpreadsheet
Die PhpSpreadsheet-Bibliothek ist in reinem PHP geschrieben, bietet eine sehr umfangreiche Klasse und Methode und unterstützt viele Dateiformate:
Umweltanforderungen
PHP >= 5.6
php_zip
Erweiterung einschalten
php_xml
Erweiterung einschalten
php_gd2
Erweiterung einschalten
Erste Schritte
Wir schreiben eine einfache Demo, um die Verwendung von PhpSpreadsheet zu erlernen. Es handelt sich wahrscheinlich um eine einfache Seite zum Hochladen von Dateien, zum Hochladen der Excel-Datei, die wir lesen möchten PHP empfängt es. Gehen Sie zu der Datei und rufen Sie PHPSpreadsheet auf, um den Inhalt in Excel zu lesen.
, konfigurieren Sie sie selbst
Meine aktuelle PHP-Version ist 7.2.13
mkdir demo cd demo
Verwenden Sie Composer zur Installation:
composer require phpoffice/phpspreadsheet
Die neueste stabile Version (1.5) ist standardmäßig installiert. Wenn Sie die Entwicklungsversion installieren möchten, können Sie diese ausführen den folgenden Befehl:
composer require phpoffice/phpspreadsheet:develop
Nach Abschluss der oben genannten Schritte sieht die Verzeichnisstruktur wie folgt aus:
vim index.html
index.html ist sehr einfach und lautet wie folgt:
Hier sollten Sie auf Folgendes achten: Es mussDies ist nur eine einfache Demo, nur ein Formular. Nach dem Ausführen wird es so aussehen:)enctype
multipart/form-data
4. Wie verwende ich PHPSpreadsheet? Bevor wir die vom Frontend übergebene Excel-Datei verarbeiten, stellen wir zunächst die Verwendung von PhpSpredsheet vor. 4.1 Dateien lesen Es gibt viele Möglichkeiten, Dateien in PHPSpreadsheet zu lesen. Es gibt verschiedene Lesemethoden für Dateien in verschiedenen Formaten, wie zum Beispiel:
Format, verwenden Sie xlsx
, PhpOfficePhpSpreadsheetReaderXlsx()
-Format, verwenden Sie csv
. Auf den ersten Blick scheinen so viele Klassen etwas kompliziert zu sein. Tatsächlich implementieren diese Klassen alle die Schnittstellen PhpOfficePhpSpreadsheetReaderCsv()
und PhpOfficePhpSpreadsheetReaderIReader
und geben den zu ladenden Dateityp an. Wir können die Factory-Klasse PhpOfficePhpSpreadsheetWriterIWriter
direkt verwenden: PhpOfficePhpSpreadsheetIOFactory
$spreadsheet = \PhpOffice\PhpSpreadsheet\IOFactory::load('demo.xlsx');
$reader = \PhpOffice\PhpSpreadsheet\IOFactory::createReaderForFile("demo.xlsx"); $reader->setReadDataOnly(true); $reader->load("demo.xlsx");
den folgenden Reader und Writer erzeugen kann: IOFactory
rrree
-Fabrik können Sie auch den Dateityp zum Lesen und Schreiben angeben und den entsprechenden Reader zurückgeben, wodurch die Identifizierung des Dateityps wie folgt entfällt: IOFactory
abstract class IOFactory { private static $readers = [ 'Xlsx' => Reader\Xlsx::class, 'Xls' => Reader\Xls::class, 'Xml' => Reader\Xml::class, 'Ods' => Reader\Ods::class, 'Slk' => Reader\Slk::class, 'Gnumeric' => Reader\Gnumeric::class, 'Html' => Reader\Html::class, 'Csv' => Reader\Csv::class, ]; private static $writers = [ 'Xls' => Writer\Xls::class, 'Xlsx' => Writer\Xlsx::class, 'Ods' => Writer\Ods::class, 'Csv' => Writer\Csv::class, 'Html' => Writer\Html::class, 'Tcpdf' => Writer\Pdf\Tcpdf::class, 'Dompdf' => Writer\Pdf\Dompdf::class, 'Mpdf' => Writer\Pdf\Mpdf::class, ]; ...
Wenn wir den Lesertyp nicht angeben, IOFactory
Code ist eine Operation zum Identifizieren des Formats: load
$reader = \PhpOffice\PhpSpreadsheet\IOFactory::createReader("Xlsx"); // 指定为xlsx格式 $spreadsheet = $reader->load("demo.xlsx");
// 源码解析 // 不指定reader,直接获取上传的文件创建 $reader = \PhpOffice\PhpSpreadsheet\IOFactory::load($_FILES['file']['tmp_name']); // IOFactory::load() public static function load($pFilename) { // 这步棋室就是创建reader,免去了你手动创建 $reader = self::createReaderForFile($pFilename); return $reader->load($pFilename); } // IOFactory::createReaderForFile() // 这步就是返回一个reader,具体返回什么reader,是根据文件名来的 public static function createReaderForFile($filename) { // 判断文件是否存在并且可读,会抛出InvalidArgumentException File::assertFile($filename); // 根据文件后缀猜测类型 $guessedReader = self::getReaderTypeFromExtension($filename); if ($guessedReader !== null) { $reader = self::createReader($guessedReader); // Let's see if we are lucky if (isset($reader) && $reader->canRead($filename)) { return $reader; } } // 如果没有检测到类型,就会遍历默认的reader数组,直到找到可以使用的那个reader foreach (self::$readers as $type => $class) { if ($type !== $guessedReader) { $reader = self::createReader($type); if ($reader->canRead($filename)) { return $reader; } } } throw new Reader\Exception('Unable to identify a reader for this file'); }
让我们接着继续上面的index.html,我们需要编写一个PHP文件来处理请求:
require 'vendor/autoload.php'; $reader = new \PhpOffice\PhpSpreadsheet\Reader\Xlsx(); try { $spreadsheet = $reader->load($_FILES['file']['tmp_name']); } catch (\PhpOffice\PhpSpreadsheet\Reader\Exception $e) { die($e->getMessage()); } $sheet = $spreadsheet->getActiveSheet(); $res = array(); foreach ($sheet->getRowIterator(2) as $row) { $tmp = array(); foreach ($row->getCellIterator() as $cell) { $tmp[] = $cell->getFormattedValue(); } $res[$row->getRowIndex()] = $tmp; } echo json_encode($res);
我们先引入autoload
,接着创建了一个Xlsx
的reader,然后load我们上传的文件,因为在excel中,内容都是按sheet区分的,每一个sheet中都由行和列组成,我们获取到当前使用的sheet,通过sheet获取到行的迭代对象,再针对每一行得到每一列对象,在PhpSpreadsheet中,cell是一个最小的单元,对应着第几行第几列,数据都是存在cell中,得到cell对象我们就能获取到数据。
当我们上传如下内容后:
返回结果如下:
因为我们在读取时,是从第二行开始的,所以第一行的内容就不显示了。
这里说一下,在Excel中第三列是一个时间,PhpSpreadsheet对时间的处理有点特殊。在PhpSpreadsheet中date和time在存储时都是作为数字类型,当要区分数字是时间格式时,需要用到format mask
,默认情况下,format mask
是开启了的,但如果设置setReadDataOnly
等于true
的话,就不能使用format mask
,从而就区分不了数字和时间格式,PhpSpreatsheet将会全部作为数字处理。
此时,我们开启只读模式看一下,
$reader = new \PhpOffice\PhpSpreadsheet\Reader\Xlsx(); $reader->setReadDataOnly(true);
输出结果如下:
第三列就变成了奇怪的数字,当初这个问题还困扰了我半天。
如果一个Excel中有多个sheet,只想操作其中的某几个sheet,可以设置setLoadSheetsOnly
$reader = new \PhpOffice\PhpSpreadsheet\Reader\Xlsx(); // 参数支持字符串或一个数组 $reader->setLoadSheetsOnly(['sheet1','sheet3']);
读取指定行和列的数据
class MyReadFilter implements \PhpOffice\PhpSpreadsheet\Reader\IReadFilter { public function readCell($column, $row, $worksheetName = '') { // 只读取A1:E7的数据 if ($row >= 1 && $row setReadFilter($filterSubset); $spreadsheet = $reader->load('demo.xlsx');
上面的例子不够通用,可以修改下使之更为通用:
class MyReadFilter implements \PhpOffice\PhpSpreadsheet\Reader\IReadFilter { private $startRow = 0; private $endRow = 0; private $columns = []; public function __construct($startRow, $endRow, $columns) { $this->startRow = $startRow; $this->endRow = $endRow; $this->columns = $columns; } public function readCell($column, $row, $worksheetName = '') { if ($row >= $this->startRow && $row endRow) { if (in_array($column,$this->columns)) { return true; } } return false; } } $myFilter = new MyReadFilter(9,15,['A', 'B', 'D']);
列出Excel中所有sheet的名字
$reader->listWorksheetNames('demo.xlsx');
列出一个sheet的信息,包括多少列、多少行
$reader->listWorksheetInfo('demo.xlsx');
PhpSpreadsheet的学习与使用就到这,真的很强大,几乎满足了日常的所有需求,是读取Excel、CSV文件的利器。
Das obige ist der detaillierte Inhalt vonSo verwenden Sie PhpSpreadsheet in PHP zum Lesen von Excel- und CSV-Dateien (mit Beispielen). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!