
docx文件的读取
docx文件其实是由很多XML文件组成,其中内容就存在于word/document.xml里面。
我们找到一个docx文件,使用zip文件打开(或者把docx后缀名改为zip,然后解压)(推荐学习:PHP视频教程)
在word目录下有document.xml,docx文件的内容就存在于document.xml里面,我们读取这个文件就可以了.
代码如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 | function parseWord( $file ) {
$content = "" ;
$zip = new ZipArchive ( );
if ( $zip ->open ( $file ) === TRUE ) {
for ( $i = 0; $i < $zip ->numFiles; $i ++) {
$entry = $zip ->getNameIndex ( $i );
if ( pathinfo ( $entry ,PATHINFO_BASENAME) == "document.xml" ) {
$zip ->extractTo ( pathinfo ( $file , PATHINFO_DIRNAME ) . "/" . pathinfo ( $file , PATHINFO_FILENAME ), array (
$entry
) );
$filepath = pathinfo ( $file , PATHINFO_DIRNAME ) . "/" . pathinfo ( $file , PATHINFO_FILENAME ) . "/" . $entry ;
$content = strip_tags ( file_get_contents ( $filepath ) );
break ;
}
}
$zip ->close ();
return $content ;
} else {
echo 'no';
}
}
|
Salin selepas log masuk
值得注意的是:
第一 $file文件不能与当前代码在同一目录文件下,$file存放在单独的文件夹
Atas ialah kandungan terperinci PHP怎么获取docx里面内容. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!