ホームページ バックエンド開発 PHPチュートリアル PHP ベースの絵文字処理メソッドを拡張するクラス ライブラリの紹介

PHP ベースの絵文字処理メソッドを拡張するクラス ライブラリの紹介

Aug 08, 2016 am 09:22 AM
emoji quot str

Carmela の紹介Carmela は、PHP、PHP 拡張機能、JAVA、C++、および一般的な絵文字タグのサポートなどのその他の言語に基づいて 4 セクションの UTF-8 を処理するための一連のソリューションを提供します背景: UTF-8 形式 絵文字表現を含む文字列はデータベースに直接挿入されます。データベースが調整されていない場合、この問題はデータベースとテーブルの文字セットを utf8mb4_general_ci に変更することで回避できます。しかし、多くの大規模なシステムやアーキテクチャでは、データベースの文字セットを変更すると、PC 側の表示や新旧データ間の互換性の問題など、多くの問題が発生する可能性があります。この種の問題には、データベースに入る前に置換し、データベースから出た後にクライアントのタイプに応じて逆置換するという別の解決策もあります。 CarmelaCarmela は、PHP 拡張機能に基づいて 4 セクション UTF-8 を処理するためのソリューションを提供します。これにより、特定の UTF-8 文字 % など、UTF-8 の 3 バイトを超える UTF-8 文字を UBB モードに置き換えることができます。 f0%9f%91%a4 (表示の便宜上、絵文字タグのエンコード モードが表示されています)、[u]1f464[/u] の置換後、およびデータベースから読み取ったときの様子が異なります。リクエストクライアント (iOS、Andriod、PC) は逆置換を行います。カルメラという名前は、「異なるカルメラ」に由来しています。「異なるカルメラ」シリーズの物語は、雌鶏のカルメラとその子供たち、カルメリドとカルメンの冒険物語です。他の人が思いつかないようなことに挑戦すること。 Installation11。 ubb モードへの移行、[u]1f464[/u] の置換後の様子。 例: git clone https://github.com/ugg/Carmela /phpize ./configure --with-php-c/php-config-path make make install 出力結果: [carmela] extension=carmela.so carmela_ubb2str: PC プラットフォームの転送の場合は、encode.class.php の carmela_ubb2str メソッドを参照できます。
  • 例:

    $str = urldecode("This is test %F0%9F%98%9C+%F0%9F%98%99 by ugg"); echo "str:".$str."\n"; echo "ubb:".carmela_str2ubb($str)."\n";

    出力結果:

    str:This is test xxxx(CSDN Emoji不能展示用XXXX代替) by ugg ubb:This is test [u]1f61c[/u] [u]1f619[/u] by ugg
  • carmela_substr: 絵文字を含む文字列から指定された長さの文字を切り出します。 carmela_sububbb: ubb タグを含む文字列から指定された長さの文字をインターセプトします。 carmela_delstr: 文字列内の絵文字を削除します。非厳密モード。3 バイトの絵文字は削除できません。主に一部で使用されます。 carmela_delubb: ubb タグを含む文字列内の ubb タグを削除します。 パフォーマンス使用PHP分别实现了两种方法,分别使用PHP的str_replace方法和PHP查找四字节emoji,进行替换的方法,以及PHP扩展方式,使用相同数据分别进行测试,测试效果如下。=========================== 方案1:PHP str_replace方式 ========================= =========== EMOJI TO STRING ========== TIME:781.94ms,处理行数: 100,处理字数:10100,处理字节数:31028 平均每行处理时间:7.819ms =========== STRING TO EMOJI ========== TIME:118.566ms,处理行数: 100,处理字数:18710,处理字节数:37793 平均每行处理时间:1.186ms =========================== 方案2:PHP字符查找方式 ========================= =========== EMOJI TO STRING ========== TIME:51.526ms,处理行数: 100,处理字数:10100,处理字节数:31028 平均每行处理时间:0.515ms =========== STRING TO EMOJI ========== TIME:27.959ms,处理行数: 100,处理字数:23092,处理字节数:41236 平均每行处理时间:0.28ms =========================== 方案3:PHP扩展方式 ========================= =========== EMOJI TO STRING ========== TIME:0.721ms,处理行数: 100,处理字数:10100,处理字节数:31028 平均每行处理时间:0.007ms =========== STRING TO EMOJI ========== TIME:0.956ms,处理行数: 100,处理字数:20308,处理字节数:38452 平均每行处理时间:0.01ms 从以上测试效果上来看,str_replace方式,性能非常的差。使用PHP直接编写替换函数方式,性能提升10倍多,而采用扩展方式后,性能提升明显,在把emoji从字符形式转换为ubb方式时,性能提升1000倍。以上测试数据通过create_file.php可以动态生成。本测试用例,生成100行数据,每行100个字符,100字符中可以包含3-10个emoji字符,进行测试的,直接运行benchmark.php 查看运行性能。原理处理四字节的emoji原理非常简单,通过字符对比找到emoji字符进行替换。难点就是在基本原理上如何提升性能,如何快速查找,替换。PHP扩展方式,为大家提供了一种思路,可以参考这种思路实现java,C#,js等等版本的。PC如何支持EMoji表情展示?在项目目录中的emoji目录下找到images目录,从web根目录创建emoji文件夹,把images文件夹整个拷贝到emoji文件下,调用encode.class.php里面的carmela_ubb2str方法,Util_Encode::carmela_ubb2str($str, "PC"); 即可在PC上展示Emoji表情,目前收集到的845个emoji表情,一些新的表情符号并没有纳入其中,当然,目前这种方法并没有写入PHP扩展中,性能相对来说并不高。Contact ugg.xchj@gmail.com for all questions

    以上就介绍了基于PHP扩展一种处理Emoji方法的类库介绍,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

    このウェブサイトの声明
    この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

    ホットAIツール

    Undresser.AI Undress

    Undresser.AI Undress

    リアルなヌード写真を作成する AI 搭載アプリ

    AI Clothes Remover

    AI Clothes Remover

    写真から衣服を削除するオンライン AI ツール。

    Undress AI Tool

    Undress AI Tool

    脱衣画像を無料で

    Clothoff.io

    Clothoff.io

    AI衣類リムーバー

    Video Face Swap

    Video Face Swap

    完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

    ホットツール

    メモ帳++7.3.1

    メモ帳++7.3.1

    使いやすく無料のコードエディター

    SublimeText3 中国語版

    SublimeText3 中国語版

    中国語版、とても使いやすい

    ゼンドスタジオ 13.0.1

    ゼンドスタジオ 13.0.1

    強力な PHP 統合開発環境

    ドリームウィーバー CS6

    ドリームウィーバー CS6

    ビジュアル Web 開発ツール

    SublimeText3 Mac版

    SublimeText3 Mac版

    神レベルのコード編集ソフト(SublimeText3)

    Apple が iOS 17.4 Beta 1 をリリースし、フェニックスやライムなどを含む 118 個の新しい絵文字を導入しました。 Apple が iOS 17.4 Beta 1 をリリースし、フェニックスやライムなどを含む 118 個の新しい絵文字を導入しました。 Jan 26, 2024 am 08:24 AM

    海外テクノロジーメディアemojipediaによる1月26日の報道によると、本日リリースされたiOS 17.4ベータ1アップデートでは、サイドローディングやEU27カ国でのテスト用サードパーティアプリストアなどの大幅な改善に加え、Appleはいくつかの機能を追加したとのこと。新しい絵文字。 iOS 17.4 ベータ 1 アップデートでは、2023 年 9 月に Unicode によって提案された絵文字 15.1 アップデートから、フェニックス、ライム、首を上下に振る笑顔、道を示す一連のキャラクターの絵文字が追加されます。完全な絵文字は次のように添付されています。 このアップデートでは、6 つの新しい絵文字と 4 つの性別中立の家族絵文字を含む、合計 118 の絵文字が追加されます。さらに既存キャラクター表情は6種類

    Win10 Education Edition で絵文字をオフにする方法 Win10 Education Edition で絵文字をオフにする方法 Feb 24, 2024 pm 01:55 PM

    絵文字は、Win10 Education Edition に追加された最新の入力メソッド機能です。かわいい絵文字がたくさんあるので、チャットが退屈しません。ただし、一部のユーザーは、ショートカット キーを使用するときにこのインターフェイスをポップアップします。今日は、Win10 Education Edition で絵文字をオフにする方法を説明します。 。 導入。 Win10 Education Edition で emoji1 をオフにする方法. まず、以下のタスクバーの右側にある入力メソッドを右クリックする必要があります。 2. ポップアップ オプション ボックスで [設定] を選択して、言語設定インターフェイスに入ります。 3. インターフェイスで [キー] オプションを選択し、一番下までスクロールして [絵文字と記号パネルを開く] を見つけます。ここで絵文字表現をオフにすることができます。 4. 他の入力方法がインストールされている場合は、Windows の設定から「設定と言語」インターフェイスに入り、選択することができます。

    php提交表单通过后,弹出的对话框怎样在当前页弹出,该如何解决 php提交表单通过后,弹出的对话框怎样在当前页弹出,该如何解决 Jun 13, 2016 am 10:23 AM

    php提交表单通过后,弹出的对话框怎样在当前页弹出php提交表单通过后,弹出的对话框怎样在当前页弹出而不是在空白页弹出?想实现这样的效果:而不是空白页弹出:------解决方案--------------------如果你的验证用PHP在后端,那么就用Ajax;仅供参考:HTML code

    Huaweiの絵文字を入力する方法 Huaweiの絵文字を入力する方法 Sep 26, 2023 pm 01:31 PM

    Huawei 絵文字入力方法: 1. Huawei 携帯電話には絵文字キーボードが付属しています。テキストを入力するときにこのキーボードに切り替えて絵文字を入力できます。2. 絵文字を入力する必要がある場所で、入力ボックスを長押しして、「Enter」を選択します。 「入力方法の設定」では、システムに付属する絵文字入力方法を見つけて選択できます。 3. サードパーティの絵文字キーボードをダウンロードして使用し、希望する絵文字を参照して選択できます。キーボードで使用します。

    iOS 15.4とiPadOS 15.4 Beta 1パブリックベータ公開、マスク着用でもFace IDが利用可能に iOS 15.4とiPadOS 15.4 Beta 1パブリックベータ公開、マスク着用でもFace IDが利用可能に Apr 13, 2023 pm 11:01 PM

    Apple は、iOS 15.4 および iPadOS 15.4 Beta 1 (バージョン 19E5209h) を正式に公開しました。公式アップデートノートには、新機能の追加を含む多くの変更点が記載されています。マスク Face ID のサポート Apple は、iOS 15.4 で、iPhone がマスクを着用しているときに目の周りの領域の固有の特徴を識別してユーザーを認証する「Mask Face ID」を追加しました。この機能を使用するには、iPhone 12 以降を使用する必要があることに注意してください。 112 個の新しい絵文字表現を追加 iOS 15.4 ベータ 1 は絵文字 14 を正式にサポートします。それに追加する

    Python組み込み型strソースコード解析 Python組み込み型strソースコード解析 May 09, 2023 pm 02:16 PM

    1 Unicode コンピュータ ストレージの基本単位は 8 ビットで構成されるバイトです。英語は 26 文字といくつかの記号のみで構成されているため、英語の文字はバイト単位で直接格納できます。ただし、他の言語 (中国語、日本語、韓国語など) では、文字数が多いため、エンコードに複数のバイトを使用する必要があります。コンピューター技術の普及に伴い、非ラテン文字エンコード技術は発展を続けていますが、依然として 2 つの大きな制限があります。 多言語サポートがないこと。 ある言語のエンコード スキームを別の言語で使用することはできません。また、統一された標準もありません。たとえば、中国語には GBK、GB2312、GB18030 など、多くのエンコード標準があります。エンコード方式が統一されていないため、開発者は異なるエンコード間で相互に変換する必要があり、必然的に多くのエラーが発生します。

    Python の __str__ と __repr__ の類似点と相違点は何ですか? Python の __str__ と __repr__ の類似点と相違点は何ですか? Apr 29, 2023 pm 07:58 PM

    __str__ と __repr__ の類似点と相違点は何ですか? 文字列の表現については誰もが知っています。Python の組み込み関数 repr() は、識別を容易にするためにオブジェクトを文字列の形式で表現できます。これが「文字列表現」です。 repr() は、特別なメソッド __repr__ を通じてオブジェクトの文字列表現を取得します。 __repr__ が実装されていない場合、ベクトルのインスタンスをコンソールに出力すると、結果の文字列が次のようになります。 >>>classExample:pass>>>print(str(Example()))>>>

    mysqlの絵文字が文字化けした場合の対処法 mysqlの絵文字が文字化けした場合の対処法 Feb 16, 2023 am 10:01 AM

    文字化けした mysql 絵文字の解決策: 1. 「show create table test ENGINE=InnoDB DEFAULT CHARSET=utf8mb4」コマンドを使用して、mysql テーブルのエンコードを確認します。 2. 「set names utf8mb4;」を使用して、読み取りエンコードを「utf8mb4」に設定します。

    See all articles