PHP에서 .DOC 파일을 읽는 것은 바이너리 형식으로 인해 어려울 수 있습니다. 하지만 누군가가 제공한 코드를 사용하면 구문 분석할 수 있지만 잘못된 문자 해석이 발생할 수 있습니다.
이 문제를 해결하려면 다음과 같이 수정해야 합니다.
<code class="php">$line = @fread($fileHandle, filesize($userDoc)); $lines = explode(chr(0x0A),$line);</code>
이 변경 사항은 문자 chr(0x0D)를 chr(0x0A)로 대체합니다. Windows에서는 줄 바꿈을 rn(캐리지 리턴과 줄 바꿈)으로 저장하는 반면 UNIX 시스템은 n(줄 바꿈만)을 사용합니다. chr(0x0D)를 사용하면 DOS/Windows 개행 문자를 처리하지만 파일은 Unix 형식으로 저장됩니다.
또한 PHP에서 .docx 파일을 읽으려면 다음 코드를 고려하세요.
<code class="php">function read_file_docx($filename){ $striped_content = ''; $content = ''; if(!$filename || !file_exists($filename)) return false; $zip = zip_open($filename); if (!$zip || is_numeric($zip)) return false; while ($zip_entry = zip_read($zip)) { if (zip_entry_open($zip, $zip_entry) == FALSE) continue; if (zip_entry_name($zip_entry) != "word/document.xml") continue; $content .= zip_entry_read($zip_entry, zip_entry_filesize($zip_entry)); zip_entry_close($zip_entry); }// end while zip_close($zip); $content = str_replace('</w:r></w:p></w:tc><w:tc>', " ", $content); $content = str_replace('</w:r></w:p>', "\r\n", $content); $striped_content = strip_tags($content); return $striped_content; }</code>
이 코드:
위 내용은 PHP에서 .DOC 파일을 올바르게 구문 분석하고 문자 해석 오류를 방지하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!