PHP에서 중국어 왜곡 문자를 읽는 방법: 1. PHP 버전을 확인합니다. 2. php.ini를 수정하고 서버를 다시 시작합니다. 3. "iconv('GB2312', 'UTF-8', $test) );" 읽는 동안 글자가 깨져 나오는 문제는 충분합니다.
이 문서의 운영 환경: Windows 7 시스템, PHP 버전 7.4, Dell G3 컴퓨터.
PHP가 단어를 읽을 때 중국어 문자가 깨지는 문제를 해결하는 방법은 무엇입니까?
php는 단어 파일을 읽을 때 잘못된 문자를 읽습니다. 이를 해결하는 방법은 무엇입니까?
1. 먼저 PHP 버전을 확인하세요. 가급적이면 5.6보다 높은 버전이 좋습니다.
2. PHP Com 확장 기능
// 将以下两行代码放入php.ini中, 并且重启服务器 // 开启扩展 extension=php_com_dotnet.dll // COM扩展里自带的,只需将前面的;去掉就可以了 com.allow_dcom = true
활성화 3. 코드는 다음과 같습니다.
public function readWord($url) { $word = new COM("word.application") or die("Unable to instantiate Word"); // 打开路径为URL的word,doc或docx都可以 $word->Documents->OPen($url); // 读取内容 $test= $word->ActiveDocument->content->Text; // 统计字数 // $num = strlen($test); // 解决读取过程中乱码问题 $content= iconv('GB2312', 'UTF-8', $test); // 查看版本 // $word_wersion = $word->Version; // 是否要打开文件,0代表否,1代表是 $word->Visible = 0; // 关闭word句柄 $word->Quit(); // 释放对象 $word = null; return [ // 'num' => $num / 2, // 'word_wersion' => $wordWersion, 'content' => $content ]; }
참고:
질문 1 :
파일 URL에서 주의해야 할 점은 전달하는 URL이 D:WWW가 아닌 절대 주소가 아니어야 한다는 것입니다. localhost/와 같은 자체 프레임워크의 라우팅 주소여야 합니다. .. 그렇지 않으면 오류가 발생합니다. 왜냐하면 절대 주소를 사용하여 단어 내용을 읽는 것은 한 번만 읽을 수 있고, 그 후에는 단어가 잠겨 읽을 수 없기 때문입니다.
질문 2:
이 방법을 사용하면 잘못된 Word 내용을 읽는 문제가 해결되지만 일반 텍스트 Word를 읽는 데에만 제한되며 스타일이 없는 종류입니다. 스타일, 그림, 글꼴 등을 포함하여 Word 문서의 내용을 가져와야 하는 경우 이 방법은 적합하지 않습니다.
저희가 처리하는 방법은 Aspos를 사용하는 것입니다. 업로드된 Word 문서를 HTML 형식으로 변환하기 위해 Java를 사용하여 하위 수준 서비스를 만들었습니다. 문서에 그림이 있으면 변환 후 그림이 동일한 수준 디렉터리로 추출되고 생성된 HTML에 <img>
태그가 남습니다. 파일. 이런 방식으로 Word 문서의 글꼴과 스타일은 HTML 코드가 되어 원본 문서의 스타일을 최대한 유지합니다.
추천 학습: "PHP 비디오 튜토리얼"
위 내용은 PHP에서 단어를 읽을 때 중국어 문자가 깨지는 문제를 해결하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!