file_get_contents() Corruption des caractères UTF-8 : une résolution
Lors de l'utilisation de file_get_contents() pour récupérer du contenu HTML avec encodage UTF-8 , les utilisateurs peuvent rencontrer un problème où les caractères spéciaux tels que ľ, š, č et ž ne sont pas rendus correctement. Cela entraîne l'affichage de caractères charabia comme Å, ¾ et ¤.
Le problème réside dans l'encodage par défaut utilisé par file_get_contents(). Pour le résoudre, on peut spécifier explicitement l'encodage souhaité dans l'appel de fonction. Cependant, enregistrer le HTML récupéré dans un fichier et l'imprimer avec l'encodage UTF-8 s'avère également inefficace, indiquant que les données brisées sont récupérées à partir de la source elle-même.
Une solution qui s'est avérée efficace consiste à effectuer une analyse multi Conversion en octets sur la chaîne HTML récupérée. Voici les étapes à suivre :
En mettant en œuvre ces étapes, la chaîne HTML récupérée sera correctement convertie, permettant aux caractères UTF-8 de s'afficher correctement.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!