用php实现gb2312和unicode间的编码转换_php基础
gb2312 和 unicode 间的编码转换
下面的例子是将 gb2312 转换为 "全"这种形式
php4.3.1以后的iconv函数很好用的,只是需要自己写一个uft8到unicode的转换函数
查表(gb2312.txt)也行
$text = "脚本之家";
preg_match_all("/[\x80-\xff]?./",$text,$ar);
foreach($ar[0] as $v)
echo "".utf8_unicode(iconv("GB2312","UTF-8",$v)).";";
?>
// utf8 -> unicode
function utf8_unicode($c) {
switch(strlen($c)) {
case 1:
return ord($c);
case 2:
$n = (ord($c[0]) & 0x3f) $n += ord($c[1]) & 0x3f;
return $n;
case 3:
$n = (ord($c[0]) & 0x1f) $n += (ord($c[1]) & 0x3f) $n += ord($c[2]) & 0x3f;
return $n;
case 4:
$n = (ord($c[0]) & 0x0f) $n += (ord($c[1]) & 0x3f) $n += (ord($c[2]) & 0x3f) $n += ord($c[3]) & 0x3f;
return $n;
}
}
?>
下面的例子是利用php将"全"这中编码转换为gb2312.
$str = "TTL全天候自动聚焦";
$str = preg_replace("|([0-9]{1,5});|", "\".u2utf82gb(\\1).\"", $str);
$str = "\$str=\"$str\";";
eval($str);
echo $str;
function u2utf82gb($c){
$str="";
if ($c $str.=$c;
} else if ($c $str.=chr(0xC0 | $c>>6);
$str.=chr(0x80 | $c & 0x3F);
} else if ($c $str.=chr(0xE0 | $c>>12);
$str.=chr(0x80 | $c>>6 & 0x3F);
$str.=chr(0x80 | $c & 0x3F);
} else if ($c $str.=chr(0xF0 | $c>>18);
$str.=chr(0x80 | $c>>12 & 0x3F);
$str.=chr(0x80 | $c>>6 & 0x3F);
$str.=chr(0x80 | $c & 0x3F);
}
return iconv('UTF-8', 'GB2312', $str);
}
?>
或者是
function unescape($str) {
$str = rawurldecode($str);
preg_match_all("/(?:%u.{4})|.{4};|\d+;|.+/U",$str,$r);
$ar = $r[0];
print_r($ar);
foreach($ar as $k=>$v) {
if(substr($v,0,2) == "%u")
$ar[$k] = iconv("UCS-2","GB2312",pack("H4",substr($v,-4)));
elseif(substr($v,0,3) == "")
$ar[$k] = iconv("UCS-2","GB2312",pack("H4",substr($v,3,-1)));
elseif(substr($v,0,2) == "") {
echo substr($v,2,-1)."
";
$ar[$k] = iconv("UCS-2","GB2312",pack("n",substr($v,2,-1)));
}
}
return join("",$ar);
}
$str = "TTL全天候自动聚焦";
echo unescape($str); //out TTL全天候自动聚焦
利用javascript来转换
下面是一个显示所有全角半角的字体的查看例子
<script> <BR>function showUni(min,max){ <BR>show.document.open(); <BR>show.document.writeln("<style>body{font-size:9pt;word-break:break-all;}"); <BR>show.document.writeln(min + " - " + max + "<br><br>"); <BR>var i=0; <BR>for(i=min;i<=max;i++){ <BR>show.document.write("&#" + i + ";"); <BR>} <BR>show.document.close(); <BR>} <BR></script>
自定义: -
下面是一个查表(gb2312),转换gb2312到utf8的例子, 现在有iconv函数,这个已经没有太大的意义了,
function gb2utf8($gb){
if(!trim($gb)) return $gb;
$filename="gb2312.txt";
$tmp=file($filename);
$codetable=array();
while(list($key,$value)=each($tmp))
$codetable[hexdec(substr($value,0,6))]=substr($value,7,6);
$utf8="";
while($gb) {
if (ord(substr($gb,0,1))>127) {
$this=substr($gb,0,2);
$gb=substr($gb,2,strlen($gb)-2);
$utf8.=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));
}else{
$this=substr($gb,0,1);
$gb=substr($gb,1,strlen($gb)-1);
$utf8.=u2utf8($this);
}
}
return $utf8;
}
function u2utf8($c){
$str="";
if ($c $str.=$c;
} else if ($c $str.=chr(0xC0 | $c>>6);
$str.=chr(0x80 | $c & 0x3F);
} else if ($c $str.=chr(0xE0 | $c>>12);
$str.=chr(0x80 | $c>>6 & 0x3F);
$str.=chr(0x80 | $c & 0x3F);
} else if ($c $str.=chr(0xF0 | $c>>18);
$str.=chr(0x80 | $c>>12 & 0x3F);
$str.=chr(0x80 | $c>>6 & 0x3F);
$str.=chr(0x80 | $c & 0x3F);
}
return $str;
}
?>

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Compréhension approfondie de PHP : méthode d'implémentation de conversion de JSONUnicode en chinois Au cours du développement, nous rencontrons souvent des situations où nous devons traiter des données JSON, et l'encodage Unicode en JSON nous posera quelques problèmes dans certains scénarios, en particulier lorsqu'Unicode doit être converti Lorsque l'encodage est converti en caractères chinois. En PHP, certaines méthodes peuvent nous aider à réaliser ce processus de conversion. Une méthode courante sera présentée ci-dessous et des exemples de code spécifiques seront fournis. Tout d’abord, comprenons d’abord le Un en JSON

Unicode est une norme de codage de caractères utilisée pour représenter diverses langues et symboles. Pour convertir le codage Unicode en caractères chinois, vous pouvez utiliser les fonctions intégrées de Python chr() et ord().

Êtes-vous gêné par les caractères chinois tronqués dans Eclipse ? Pour essayer ces solutions, vous avez besoin d'exemples de code spécifiques. 1. Introduction générale Avec le développement continu de la technologie informatique, le chinois joue un rôle de plus en plus important dans le développement de logiciels. Cependant, de nombreux développeurs rencontrent des problèmes de code tronqué lorsqu'ils utilisent Eclipse pour le développement chinois, ce qui affecte l'efficacité du travail. Ensuite, cet article présentera quelques problèmes courants de code tronqué et donnera les solutions correspondantes et des exemples de code pour aider les lecteurs à résoudre le problème du code tronqué chinois dans Eclipse. 2. Problèmes courants de code tronqué et fichiers de solutions

JSON (JavaScriptObjectNotation) est un format d'échange de données léger couramment utilisé pour l'échange de données entre applications Web. Lors du traitement des données JSON, nous rencontrons souvent des caractères chinois codés Unicode (tels que « u4e2du6587 ») et devons les convertir en caractères chinois lisibles. En PHP, nous pouvons réaliser cette conversion grâce à quelques méthodes simples. Ensuite, nous détaillerons comment convertir JSONUnico

Avec le développement de technologies telles que le Big Data et le Cloud Computing, les bases de données sont devenues l’une des pierres angulaires de l’informatisation des entreprises. Dans les applications développées en Java, la connexion à la base de données MySQL est devenue la norme. Cependant, dans ce processus, nous rencontrons souvent un problème épineux : un codage de jeu de caractères Unicode incohérent. Cela affectera non seulement notre efficacité de développement, mais également les performances et la stabilité de l'application. Cet article explique comment résoudre ce problème et permettre à Java de se connecter plus facilement à la base de données MySQL. 1.Unicode

Les différences entre Unicode et Ascii incluent différentes plages de codage, différents espaces de stockage et différentes compatibilités. Introduction détaillée : 1. La plage de codage de l'ASCII est 0-127, qui est principalement utilisée pour représenter les lettres anglaises. La plage de codage de l'Unicode est beaucoup plus large et peut représenter presque tous les caractères de langue ; l'espace est différent. ASCII utilise généralement 1 octet pour stocker un caractère, tandis qu'Unicode peut utiliser 2 octets ou plus pour stocker un caractère 3. Compatibilité différente, etc.

Accès séquentiel L'accès séquentiel est une opération de base pour le traitement des chaînes dans le langage Java. Selon cette approche, chaque caractère de la chaîne d'entrée est accessible séquentiellement du début à la fin, ou parfois de la fin au début. Cette section présente sept exemples techniques de création d'un tableau de points de code de 32 bits à partir d'une chaîne à l'aide de méthodes d'accès séquentiel et estime leur temps de traitement. Exemple 1-1 : Benchmark (pas de prise en charge des paires de substitution) Le listing 1 attribue une valeur de type char 16 bits directement à une valeur de point de code 32 bits, sans prendre en compte du tout la paire de substitution : Listing 1. Pas de prise en charge du substitut paires int[]toCodePointArray(Stringstr) {//Example1-1intlen=str.length();//t

Lors du développement PHP, le traitement des données JSON est une opération très courante. Cependant, vous pouvez rencontrer certains problèmes lors du traitement de données JSON contenant des caractères Unicode, notamment lors de la conversion des données et de la conversion de l'encodage. Cet article présentera quelques techniques de programmation PHP pour gérer efficacement la conversion Unicode dans les données JSON et fournira des exemples de code spécifiques. Lors du traitement de données JSON contenant des caractères Unicode, cela implique généralement la conversion et l'encodage des caractères Unicode. en PHP
