关于curl抓取回来的网页中中文乱码的有关问题-php教程-PHP中文網

首頁

後端開發

php教程

关于curl抓取回来的网页中中文乱码的有关问题

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 13, 2016 am 10:48 AM

code encoding str

关于curl抓取回来的网页中中文乱码的问题！
目前使用这个函数进行转码：
function safeEncoding($str){
$code=mb_detect_encoding($str,array('ASCII','GB2312','GBK','UTF-8'));//检测字符串编码
if($code=="CP936"){
$result=$str;
}
else{
//$result=mb_convert_encoding($str,'UTF-8',$code);//将编码$code转换为utf-8编码
$result=iconv($code,"UTF-8",$str);
}
return $result;
}
可是还是有问题，遇到有些明明charset写着gb2312的抓回来还是乱码，请教高手，curl到底该怎么全面的进行转码呢？就是把gbk,gb2312等网页常用格式转成utf8的。

------解决方案--------------------
把你的文件编码转换下试试！
------解决方案--------------------
EUC-CN是GB 2312最常用的表示方法。浏览器编码表上的“GB2312”，通常都是指“EUC-CN”表示法。
这不是关键！
你需要的是把gbk,gb2312等网页常用格式转成utf8的
而你的代码正好没有这样做

if(! mb_check_encoding($str, 'utf-8')) {
$str = mb_convert_encoding($str,'UTF-8','gbk');
}

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7814

Java教學

1646

CakePHP 教程

1402

Laravel 教程

1300

PHP教程

1238

Related knowledge

在Visual Studio Code中編輯Unity項目，您現在可以開始了 Aug 08, 2023 am 10:21 AM

Microsoft發布了VisualStudioCode的Unity擴充預覽版。這個新的Unity擴充將允許您編寫和調試Unity遊戲。這個新的Unity擴充帶來了VisualStudio和VisualStudioToolsforUnity上已經提供的一些流行功能，讓VisualStudioCode中的C#更能進行Unity開發。目前，適用於VSCode的Unity擴充功能提供以下內容：一個Unity調試器，用於調試您的Unity編輯器和Unity播放器。特定於Unity的C#分析器和重構。 Uni

Java中的UnsupportedEncodingException異常該如何處理？ Jun 25, 2023 am 08:02 AM

Java中的UnsupportedEncodingException異常該如何處理？在Java程式設計中，可能會遇到UnsupportedEncodingException異常。這個異常通常是由於編碼轉換不正確或編碼不支援所造成的。在這篇文章中，我們將介紹UnsupportedEncodingException異常的原因和如何處理它。什麼是UnsupportedE

Python內建類型str原始碼分析 May 09, 2023 pm 02:16 PM

1Unicode電腦儲存的基本單位是位元組，由8個位元組組成。由於英文只由26個字母加若干符號組成，因此英文字元可以直接用位元組來保存。但是其他語言（例如中日韓等），由於字元眾多，不得不使用多個位元組來進行編碼。隨著電腦科技的傳播，非拉丁文字元編碼技術不斷發展，但是仍有兩個比較大的限制：不支援多語言：一種語言的編碼方案不能用於另一種語言沒有統一標準：例如中文就有GBK、GB2312、GB18030等多種編碼標準由於編碼方式不統一，開發人員就需要在不同編碼之間來回轉換，不可避免地會出現很多錯

Python中__str__和__repr__有什麼異同點 Apr 29, 2023 pm 07:58 PM

__str__和__repr__有什麼異同?字串的表示形式我們都知道，Python的內建函數repr()能夠把物件用字串的形式表達出來，方便我們辨認。這就是“字串表示形式”。 repr()就是透過__repr__這個特殊方法得到一個物件的字串表示形式的。如果沒有實作__repr__，當我們在控制台裡列印一個向量的實例時，得到的字串可能會是。 >>>classExample:pass>>>print(str(Example()))>>>

HTML和代碼：仔細觀察術語 Apr 10, 2025 am 09:28 AM

htmlisaspecifictypefodyfocusedonstructuringwebcontent，而“代碼” badlyLyCludEslanguagesLikeLikejavascriptandPytyPythonForFunctionality.1）htmldefineswebpagertuctureduseTags.2）“代碼”代碼“ code” code code code codeSpassSesseseseseseseseAwiderRangeLangeLangeforLageforLogageforLogicIctInterract

Redis類型type與編碼encoding原理及使用方法是什麼 May 29, 2023 pm 04:21 PM

摘要Redis是一款開源的高效能key-value資料庫，廣泛應用於各種場景。在Redis中，資料類型（type）和編碼（encoding）是非常重要的概念。本篇部落格將詳細介紹Redis支援的資料類型以及對應的編碼方式和底層實作原理。要查看Redis某個key的內部編碼，可以使用Redis指令OBJECTENCODINGkey。其中，key是你想要查詢的鍵名。例如，如果你想要查詢名為mykey的鍵的內部編碼，可以執行以下命令：127.0.0.1:6379>objectencodin

Java中的UnsupportedEncodingException異常的解決方法 Jun 25, 2023 am 08:48 AM

Java中可能會出現UnsupportedEncodingException異常，主要是因為編碼不被支援導致。在處理文字資料時，經常需要進行編碼轉換，也就是把一種編碼格式的內容轉換成另一種編碼格式的內容。而如果進行編碼轉換時所使用的編碼類型不被支持，就會拋出UnsupportedEncodingException異常。本文將介紹該異常的解決方法。一、

使用encoding/csv套件提供的函數進行CSV檔案的讀寫操作 Jul 24, 2023 pm 01:13 PM

使用encoding/csv套件提供的函數進行CSV檔案的讀寫操作CSV（Comma-SeparatedValues）是一種常用的資料儲存格式，可以簡單地將資料以逗號分隔的形式儲存為文字檔案。在Python中，可以使用標準函式庫中的encoding/csv套件來方便地進行CSV檔案的讀寫操作。首先，我們需要匯入encoding/csv套件：importcsv接下來

See all articles

关于curl抓取回来的网页中中文乱码的有关问题

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題