如何在PHP 中從Word 和其他Office 文件中提取文字
從Microsoft Office 文件(包括Word(.doc 和. docx )、Excel (.xlsx) 和PowerPoint (.pptx),通常是文檔內搜尋等任務所必需的
閱讀Word 文件
對於.doc 文件,可以使用二進位檔案方法:
對於.docx 文件,它們本質上是包含XML 的zip 文件,您需要到:
讀取Excel 文件
這可以透過從Excel 檔案中的「xl/sharedStrings.xml」檔案中擷取文字來完成:
閱讀PowerPoint檔案
要從PowerPoint 簡報中提取文本,請開啟zip 容器中的每個幻燈片(.xml) 檔案:
用法
要使用此類進行檔案轉換,請使用檔案路徑實例化它並呼叫convertToText()方法:
以上是如何使用 PHP 從 Word、Excel 和 PowerPoint 文件中提取文字?的詳細內容。更多資訊請關注PHP中文網其他相關文章!