Ich habe kürzlich ein Crawling-Skript geschrieben. Der größte Teil des erfassten Inhalts ist normal, aber ein kleiner Teil davon ist verstümmelt
Erkennen Sie die Zeichenkodierung und das Ergebnis ist CP936
mb_detect_encoding(<span style="color: #800080;">$str</span>, 'GBK, gb2312, GB18030, ISO-8859-1, ASCII, UTF-8', <span style="color: #0000ff;">true</span>)
Es wird versucht, diese Kodierung zu konvertieren, aber das Ergebnis ist immer noch verstümmelt
mb_convert_encoding($str, 'UTF-8', 'CP936'); 氓聧掳氓潞娄盲赂聙70氓虏聛猫聙聛氓陇麓莽聦楼盲潞碌7氓虏聛氓楼鲁氓颅漏猫聙聦猫垄芦忙聧聲
Endlich festgestellt, dass dies transkodiert werden kann
iconv('utf-8', 'latin1', $str);
iconv('utf-8','latin1//IGNORE', $str);