Lösung für das Lesen chinesischer verstümmelter Zeichen in Word: 1. Überprüfen Sie die PHP-Version. 2. Ändern Sie php.ini und starten Sie den Server neu. 3. Lösen Sie das Problem mit „iconv(‘GB2312‘, ‚UTF-8‘, $test );" Das Problem verstümmelter Zeichen beim Lesen ist ausreichend.
Die Betriebsumgebung dieses Artikels: Windows 7-System, PHP-Version 7.4, Dell G3-Computer.
Wie kann das Problem verstümmelter chinesischer Zeichen gelöst werden, wenn PHP Wörter liest?
php liest beim Lesen von Word-Dateien verstümmelte Zeichen. Wie lässt sich das Problem lösen?
1. Bestätigen Sie zunächst die PHP -Version, vorzugsweise höher als 5,6
. 2. Aktivieren Sie die PHP COM -Erweiterung
// 将以下两行代码放入php.ini中, 并且重启服务器 // 开启扩展 extension=php_com_dotnet.dll // COM扩展里自带的,只需将前面的;去掉就可以了 com.allow_dcom = true
3. Der Code lautet wie folgt:
public function readWord($url) { $word = new COM("word.application") or die("Unable to instantiate Word"); // 打开路径为URL的word,doc或docx都可以 $word->Documents->OPen($url); // 读取内容 $test= $word->ActiveDocument->content->Text; // 统计字数 // $num = strlen($test); // 解决读取过程中乱码问题 $content= iconv('GB2312', 'UTF-8', $test); // 查看版本 // $word_wersion = $word->Version; // 是否要打开文件,0代表否,1代表是 $word->Visible = 0; // 关闭word句柄 $word->Quit(); // 释放对象 $word = null; return [ // 'num' => $num / 2, // 'word_wersion' => $wordWersion, 'content' => $content ]; }
Hinweis:
Frage 1 :
Eine Sache, auf die Sie bei der Datei-URL achten müssen, ist, dass die von Ihnen übergebene URL keine absolute Adresse sein darf, nicht D:WWW. Es muss sich um die Routing-Adresse Ihres eigenen Frameworks handeln, z. B. localhost/. .., andernfalls tritt ein Fehler auf, da das Lesen des Wortinhalts unter Verwendung einer absoluten Adresse nur einmal gelesen werden kann, und dann wird das Wort gesperrt und kann nicht gelesen werden.
Frage 2:
Obwohl diese Methode das Problem des Lesens verstümmelter Word-Inhalte löst, ist sie nur auf das Lesen von reinem Word-Text beschränkt, und zwar auf die Art ohne Stile. Wenn Sie den Inhalt eines Word-Dokuments einschließlich Stilen, Bildern, Schriftarten usw. benötigen, ist diese Methode nicht geeignet.
Die Art und Weise, wie wir damit umgehen, ist die Verwendung von Aspos. Ich habe mit Java einen Dienst auf unterster Ebene erstellt, um hochgeladene Word-Dokumente in das HTML-Format zu konvertieren. Wenn das Dokument Bilder enthält, werden die Bilder nach der Konvertierung in das Verzeichnis derselben Ebene extrahiert und das <img>
-Tag bleibt im generierten HTML Datei. Auf diese Weise werden die Schriftarten und Stile im Word-Dokument zu HTML-Codes, wobei der Stil des Originaldokuments weitestgehend erhalten bleibt.
Empfohlenes Lernen: „PHP-Video-Tutorial“
Das obige ist der detaillierte Inhalt vonSo lösen Sie das Problem verstümmelter chinesischer Zeichen beim Lesen von Wörtern in PHP. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!