Einführung in eine Klassenbibliothek basierend auf einer PHP-Erweiterung zur Verarbeitung von Emoji-Methoden
Freigeben: 2016-08-08 09:22:41
Original
961 Leute haben es durchsucht
Einführung in CarmelaCarmela bietet eine Reihe vierteiliger UTF-8-Verarbeitungslösungen basierend auf PHP, PHP-Erweiterungen, JAVA, C und anderen Sprachen, wie z. B. Unterstützung für Common Emoji-TagsHintergrund: Das UTF-8-Format, das Emoji-Ausdruckszeichenfolgen enthält, wird direkt in die Datenbank eingefügt. Wenn die Datenbank nicht angepasst wurde, wird ein Fehler gemeldet Durch Ändern des Zeichensatzes der Datenbank und Tabelle in utf8mb4_general_ci kann dieses Problem vermieden werden. In vielen großen Systemen und Architekturen kann die Änderung des Zeichensatzes der Datenbank jedoch viele Probleme verursachen, wie z. B. die PC-seitige Anzeige und Kompatibilitätsprobleme zwischen neuen und alten Daten. Für diese Art von Problem gibt es eine andere Lösung, die darin besteht, vor dem Betreten der Datenbank zu ersetzen und nach dem Verlassen der Datenbank eine umgekehrte Ersetzung entsprechend dem Clienttyp durchzuführen. CarmelaCarmela bietet eine Lösung für die Verarbeitung von 4-teiligem UTF-8 basierend auf der PHP-Erweiterung, die UTF-8-Zeichen, die größer als 3 Byte sind, in UTF-8 in den UBB-Modus ersetzen kann, z als bestimmtes UTF-8-Zeichen 👤 (zur Vereinfachung der Anzeige wird der Kodierungsmodus des Emoji-Tags angezeigt), wie es nach der Ersetzung [u]1f464[/u] aussieht, wenn gleichzeitig aus der Datenbank gelesen wird , je nach Anforderung verschiedener Clients (iOS, Android, PC), eine umgekehrte Substitution durchzuführen. Der Name Carmela kommt von „Different Carmela“. Die Geschichtenreihe „Different Carmela“ erzählt die Abenteuergeschichten der Henne Carmela und ihrer Kinder Carmelido und Carmen Dinge auszuprobieren, an die andere nicht zu denken wagen. Installation1. Kompilieren und verpacken git clone https://github.com/ugg/Carmela
/phpize
./configure --with-php-c/php-config-path
make
make install
Ändern Sie die Konfigurationsdatei
vim /php.ini
Fügen Sie den folgenden Inhalt hinzu[carmela]
extension=carmela.so
Methode: carmela_str2ubb: Konvertieren Sie die Zeichenfolge, die das Emoji-Tag enthält, in den UBB-Modus, und die Ersetzung sieht so aus [u]1f464[ /u]. Ein Beispiel: $str = urldecode("This is test %F0%9F%98%9C+%F0%9F%98%99 by ugg");
echo "str:".$str."\n";
echo "ubb:".carmela_str2ubb($str)."\n";
Ausgabeergebnis: str:This is test xxxx(CSDN Emoji不能展示用XXXX代替) by ugg
ubb:This is test [u]1f61c[/u] [u]1f619[/u] by ugg
carmela_ubb2str: Enthält das in das UTF-8-Stringformat konvertierte ubb-Tag zur Übertragung auf die PC-Plattform You kann auf die Methode carmela_ubb2str in encode.class.php verweisen. Ein Beispiel: $str = urldecode("This is test %F0%9F%98%9C+%F0%9F%98%99 by ugg");
$str = carmela_str2ubb($str);
echo "ubb:".$str."\n";
echo "str:".carmela_ubb2str($str)."\n";
Ausgabeergebnis: ubb:This is test [u]1f61c[/u] [u]1f619[/u] by ugg
str:This is test(CSDN Emoji不能展示用XXXX代替) by uggcarmela_substr: Fängt eine Zeichenfolge ab, die Emoji-Zeichen mit einer angegebenen Zeichenlänge enthält . carmela_sububb: Fang die angegebene Länge von Zeichen aus der Zeichenfolge ab, die das ubb-Tag enthält. carmela_delstr: Emoji-Zeichen in der Zeichenfolge löschen, nicht strenger Modus, 3-Byte-Emoji-Zeichen können nicht gelöscht werden, werden hauptsächlich in einigen verwendet. carmela_delubb: Löscht das ubb-Tag in der Zeichenfolge, die das ubb-Tag enthält. Leistung使用PHP分别实现了两种方法,分别使用PHP的str_replace方法和PHP查找四字节emoji,进行替换的方法,以及PHP扩展方式,使用相同数据分别进行测试,测试效果如下。=========================== 方案1:PHP str_replace方式 =========================
=========== EMOJI TO STRING ==========
TIME:781.94ms,处理行数: 100,处理字数:10100,处理字节数:31028
平均每行处理时间:7.819ms
=========== STRING TO EMOJI ==========
TIME:118.566ms,处理行数: 100,处理字数:18710,处理字节数:37793
平均每行处理时间:1.186ms
=========================== 方案2:PHP字符查找方式 =========================
=========== EMOJI TO STRING ==========
TIME:51.526ms,处理行数: 100,处理字数:10100,处理字节数:31028
平均每行处理时间:0.515ms
=========== STRING TO EMOJI ==========
TIME:27.959ms,处理行数: 100,处理字数:23092,处理字节数:41236
平均每行处理时间:0.28ms
=========================== 方案3:PHP扩展方式 =========================
=========== EMOJI TO STRING ==========
TIME:0.721ms,处理行数: 100,处理字数:10100,处理字节数:31028
平均每行处理时间:0.007ms
=========== STRING TO EMOJI ==========
TIME:0.956ms,处理行数: 100,处理字数:20308,处理字节数:38452
平均每行处理时间:0.01ms
从以上测试效果上来看,str_replace方式,性能非常的差。使用PHP直接编写替换函数方式,性能提升10倍多,而采用扩展方式后,性能提升明显,在把emoji从字符形式转换为ubb方式时,性能提升1000倍。以上测试数据通过create_file.php可以动态生成。本测试用例,生成100行数据,每行100个字符,100字符中可以包含3-10个emoji字符,进行测试的,直接运行benchmark.php 查看运行性能。原理处理四字节的emoji原理非常简单,通过字符对比找到emoji字符进行替换。难点就是在基本原理上如何提升性能,如何快速查找,替换。PHP扩展方式,为大家提供了一种思路,可以参考这种思路实现java,C#,js等等版本的。PC如何支持EMoji表情展示?在项目目录中的emoji目录下找到images目录,从web根目录创建emoji文件夹,把images文件夹整个拷贝到emoji文件下,调用encode.class.php里面的carmela_ubb2str方法,Util_Encode::carmela_ubb2str($str, "PC");
即可在PC上展示Emoji表情,目前收集到的845个emoji表情,一些新的表情符号并没有纳入其中,当然,目前这种方法并没有写入PHP扩展中,性能相对来说并不高。Contact ugg.xchj@gmail.com for all questions
以上就介绍了基于PHP扩展一种处理Emoji方法的类库介绍,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
-
2024-10-22 09:46:29
-
2024-10-13 13:53:41
-
2024-10-12 12:15:51
-
2024-10-11 22:47:31
-
2024-10-11 19:36:51
-
2024-10-11 15:50:41
-
2024-10-11 15:07:41
-
2024-10-11 14:21:21
-
2024-10-11 12:59:11
-
2024-10-11 12:17:31