Comment convertir « u00e9 » en caractères utf8 dans MySQL ou php ?
P粉704196697
P粉704196697 2023-08-24 20:34:18
0
2
769
<p>Je nettoie des données sur certaines données désordonnées que j'importe dans MySQL. </p> <p>Les données contiennent des "pseudo" caractères Unicode qui sont réellement intégrés dans la chaîne, tels que "u00e9", etc. </p> <p>Un champ pourrait donc être.."Jalostotitlu00e1n" Je dois extraire ce "u00e1n" maladroit et le remplacer par le caractère utf correspondant</p> <p>Je pourrais le faire dans MySQL, peut-être en utilisant des sous-chaînes et CHR, mais je prétraite les données via PHP, donc je peux également le faire là-bas. </p> <p>Je sais déjà comment configurer MySQL et PHP pour utiliser les données UTF. Le problème réside en fait dans les données sources que j'ai importées. </p> <p>Merci</p>
P粉704196697
P粉704196697

répondre à tous(2)
P粉743288436

/* fonction php pour convertir utf8 html en ansi */

public static function Utf8_ansi($valor='') {

    $utf8_ansi2 = array(
    "\u00c0" =>"À",
    "\u00c1" =>"Á",
    "\u00c2" =>"Â",
    "\u00c3" =>"Ã",
    "\u00c4" =>"Ä",
    "\u00c5" =>"Å",
    "\u00c6" =>"Æ",
    "\u00c7" =>"Ç",
    "\u00c8" =>"È",
    "\u00c9" =>"É",
    "\u00ca" =>"Ê",
    "\u00cb" =>"Ë",
    "\u00cc" =>"Ì",
    "\u00cd" =>"Í",
    "\u00ce" =>"Î",
    "\u00cf" =>"Ï",
    "\u00d1" =>"Ñ",
    "\u00d2" =>"Ò",
    "\u00d3" =>"Ó",
    "\u00d4" =>"Ô",
    "\u00d5" =>"Õ",
    "\u00d6" =>"Ö",
    "\u00d8" =>"Ø",
    "\u00d9" =>"Ù",
    "\u00da" =>"Ú",
    "\u00db" =>"Û",
    "\u00dc" =>"Ü",
    "\u00dd" =>"Ý",
    "\u00df" =>"ß",
    "\u00e0" =>"à",
    "\u00e1" =>"á",
    "\u00e2" =>"â",
    "\u00e3" =>"ã",
    "\u00e4" =>"ä",
    "\u00e5" =>"å",
    "\u00e6" =>"æ",
    "\u00e7" =>"ç",
    "\u00e8" =>"è",
    "\u00e9" =>"é",
    "\u00ea" =>"ê",
    "\u00eb" =>"ë",
    "\u00ec" =>"ì",
    "\u00ed" =>"í",
    "\u00ee" =>"î",
    "\u00ef" =>"ï",
    "\u00f0" =>"ð",
    "\u00f1" =>"ñ",
    "\u00f2" =>"ò",
    "\u00f3" =>"ó",
    "\u00f4" =>"ô",
    "\u00f5" =>"õ",
    "\u00f6" =>"ö",
    "\u00f8" =>"ø",
    "\u00f9" =>"ù",
    "\u00fa" =>"ú",
    "\u00fb" =>"û",
    "\u00fc" =>"ü",
    "\u00fd" =>"ý",
    "\u00ff" =>"ÿ");

    return strtr($valor, $utf8_ansi2);      

}
P粉198814372

Il existe un moyen. Mettez tout uXXXX 替换为其 HTML 表示形式,并执行 html_entity_decode()

C'est echo html_entity_decode("Jalostotitlán");

u1234 形式的每个 UTF 字符都可以在 HTML 中打印为 . Mais faire le remplacement est très difficile car s’il n’y a pas d’autres caractères pour identifier le début de la séquence UTF, vous pouvez obtenir beaucoup de faux positifs. Une simple expression régulière pourrait être

preg_replace('/u([da-fA-F]{4})/', '', $str)

Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal