中国語と英語のマルチコード文字の文字化け問題をスマートに解決-PHPチュートリアル-php.cn

ホームページ

バックエンド開発

PHPチュートリアル

中国語と英語のマルチコード文字の文字化け問題をスマートに解決

PHP中文网

Jul 25, 2016 am 08:59 AM

smarty 文字化けキャラクターインターセプト解決

この記事では、smarty の中国語と英語のマルチエンコーディング文字の文字化けの問題の解決策を主に紹介します。必要な方は参考にしてください。

この記事では、Smarty の中国語と英語のマルチエンコーディングの例を説明し、文字化けと文字化けの問題の解決策を皆さんに共有します。具体的な方法は次のとおりです:

一般的な Web サイトのページの表示には、必然的に部分文字列のインターセプトが含まれます。このとき、truncate が便利ですが、中国語ユーザーの場合、truncate を使用すると文字化けが発生します。文字列、および中国語と英語が混在した文字列の場合、同じ数の文字列がインターセプトされると、実際の表示長が異なり、視覚的に不均一に見え、外観に影響を与えます。これは、漢字 1 文字の長さが英語 2 文字の長さにほぼ等しいためです。さらに、truncate は GB2312、UTF-8、および他のエンコーディングと同時に互換性がありません。

改善されたsmartTruncate: ファイル名: modifier.smartTruncate.php
具体的なコードは次のとおりです:

コードは次のとおりです:

<?php 
function smartDetectUTF8($string) 
{ 
    static $result = array();
    if(! array_key_exists($key = md5($string), $result)) 
    { 
        $utf8 = " 
            /^(?: 
                [\x09\x0A\x0D\x20-\x7E]                            # ASCII 
                | [\xC2-\xDF][\x80-\xBF]                             # non-overlong 2-byte 
                | \xE0[\xA0-\xBF][\x80-\xBF]                       # excluding overlongs 
                | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2}           # straight 3-byte 
                | \xED[\x80-\x9F][\x80-\xBF]                      # excluding surrogates 
                | \xF0[\x90-\xBF][\x80-\xBF]{2}                 # planes 1-3 
                | [\xF1-\xF3][\x80-\xBF]{3}                          # planes 4-15 
                | \xF4[\x80-\x8F][\x80-\xBF]{2}                  # plane 16 
            )+$/xs 
        ";
        $result[$key] = preg_match(trim($utf8), $string); 
    }
    return $result[$key]; 
}
function smartStrlen($string) 
{ 
    $result = 0;
    $number = smartDetectUTF8($string) ? 3 : 2;
    for($i = 0; $i < strlen($string); $i += $bytes) 
    { 
        $bytes = ord(substr($string, $i, 1)) > 127 ? $number : 1;
        $result += $bytes > 1 ? 1.0 : 0.5; 
    }
    return $result; 
}
function smartSubstr($string, $start, $length = null) 
{ 
    $result = &#39;&#39;&#39;&#39;;
    $number = smartDetectUTF8($string) ? 3 : 2;
    if($start < 0) 
    { 
        $start = max(smartStrlen($string) + $start, 0); 
    }
    for($i = 0; $i < strlen($string); $i += $bytes) 
    { 
        if($start <= 0) 
        { 
            break; 
        }
        $bytes = ord(substr($string, $i, 1)) > 127 ? $number : 1;
        $start -= $bytes > 1 ? 1.0 : 0.5; 
    }
    if(is_null($length)) 
    { 
        $result = substr($string, $i); 
    } 
    else 
    { 
        for($j = $i; $j < strlen($string); $j += $bytes) 
        { 
            if($length <= 0) 
            { 
                break; 
            }
            if(($bytes = ord(substr($string, $j, 1)) > 127 ? $number : 1) > 1) 
            { 
                if($length < 1.0) 
                { 
                    break; 
                }
                $result .= substr($string, $j, $bytes); 
                $length -= 1.0; 
            } 
            else 
            { 
                $result .= substr($string, $j, 1); 
                $length -= 0.5; 
            } 
        } 
    }
    return $result; 
}
function smarty_modifier_smartTruncate($string, $length = 80, $etc = &#39;&#39;...&#39;&#39;, 
                                       $break_words = false, $middle = false) 
{ 
    if ($length == 0) 
        return &#39;&#39;&#39;&#39;;
    if (smartStrlen($string) > $length) { 
        $length -= smartStrlen($etc); 
        if (!$break_words && !$middle) { 
            $string = preg_replace(&#39;&#39;/\s+?(\S+)?$/&#39;&#39;, &#39;&#39;&#39;&#39;, smartSubstr($string, 0, $length+1)); 
        } 
        if(!$middle) { 
            return smartSubstr($string, 0, $length).$etc; 
        } else { 
            return smartSubstr($string, 0, $length/2) . $etc . smartSubstr($string, -$length/2); 
        } 
    } else { 
        return $string; 
    } 
} 
?>

ログイン後にコピー

上記のコードはtruncateの本来の機能を完全に実現しており、GB2312の両方と互換性があります。 UTF-8エンコーディングで文字長を判断する場合、中国語文字は1.0、英語文字は0.5としてカウントされるため、部分文字列をインターセプトする際にムラが発生しません。これは簡単なテストです:

コードは次のとおりです:

{$content|smartTruncate:5:".."}（$content等于"A中B华C人D民E共F和G国H"）

ログイン後にコピー

表示: A 中国語 B 中国語 C... (中国語の記号の長さは 1.0 としてカウントされ、英語の記号の長さは 0.5 としてカウントされます)省略されたシンボルの長さが考慮されます)

GB2312 エンコーディングまたは UTF-8 エンコーディングを使用しているかどうかに関係なく、結果が正しいことがわかります。これが、プラグイン名に「smart」という単語を追加した理由の 1 つです。。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7560

CakePHP チュートリアル

1384

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

ブートストラップテーブルがajaxを使用してデータを取得する場合はどうすればよいですか Apr 07, 2025 am 11:54 AM

AJAXを使用してサーバーからデータを取得する場合の文字化けコードのソリューション：1。サーバー側コード（UTF-8など）の正しい文字エンコードを設定します。 2. AJAXリクエストでリクエストヘッダーを設定し、受け入れられている文字エンコード（Accept-Charset）を指定します。 3.ブートストラップテーブルの「UNESCAPE」コンバーターを使用して、脱出したHTMLエンティティを元の文字にデコードします。

ブートストラップリストでデフォルトスタイルを削除する方法は？ Apr 07, 2025 am 10:18 AM

ブートストラップリストのデフォルトスタイルは、CSSオーバーライドで削除できます。より具体的なCSSルールとセレクターを使用し、「近接原理」と「重量原理」に従って、ブートストラップのデフォルトスタイルをオーバーライドします。スタイルの競合を避けるために、よりターゲットを絞ったセレクターを使用できます。オーバーライドが失敗した場合は、カスタムCSSの重量を調整します。同時に、パフォーマンスの最適化に注意を払い、重要な！の過剰使用を避け、簡潔で効率的なCSSコードを書いてください。

データベースに対するNAVICATのソリューションを接続できません Apr 08, 2025 pm 11:12 PM

次の手順を使用して、NAVICATがデータベースに接続できない問題を解決できます。サーバー接続を確認し、サーバーが実行されていることを確認、アドレス指定、ポートを正しく確認し、ファイアウォールにより接続を許可します。ログイン情報を確認し、ユーザー名、パスワード、許可が正しいことを確認します。ネットワーク接続を確認し、ルーターやファイアウォールの障害などのネットワークの問題をトラブルシューティングします。一部のサーバーでサポートされていない場合があるSSL接続を無効にします。データベースバージョンをチェックして、NAVICATバージョンがターゲットデータベースと互換性があることを確認してください。接続タイムアウトを調整し、リモートまたは遅い接続の場合は、接続タイムアウトタイムアウトを増やします。その他の回避策は、上記の手順が機能していない場合は、別の接続ドライバーを使用してソフトウェアを再起動したり、データベース管理者または公式NAVICATサポートに相談したりすることができます。

特定のシステムバージョンでMySQLが報告したエラーのソリューション Apr 08, 2025 am 11:54 AM

MySQLのインストールエラーのソリューションは次のとおりです。1。システム環境を慎重に確認して、MySQL依存関係ライブラリの要件が満たされていることを確認します。異なるオペレーティングシステムとバージョンの要件は異なります。 2.エラーメッセージを慎重に読み取り、依存関係のインストールやSUDOコマンドの使用など、プロンプト（ライブラリファイルの欠落やアクセス許可など）に従って対応する測定値を取得します。 3.必要に応じて、ソースコードをインストールし、コンパイルログを慎重に確認してみてください。これには、一定量のLinuxの知識と経験が必要です。最終的に問題を解決する鍵は、システム環境とエラー情報を慎重に確認し、公式の文書を参照することです。

MySQLを解く方法は、ローカルホストに接続できません Apr 08, 2025 pm 02:24 PM

MySQL接続は、次の理由が原因である可能性があります。MySQLサービスは開始されず、ファイアウォールは接続をインターセプトし、ポート番号が間違っています。ユーザー名またはパスワードが間違っています。My.cnfのリスニングアドレスは不適切に構成されています。トラブルシューティング手順には以下が含まれます。 2.ファイアウォール設定を調整して、MySQLがポート3306をリッスンできるようにします。 3.ポート番号が実際のポート番号と一致していることを確認します。 4.ユーザー名とパスワードが正しいかどうかを確認します。 5. my.cnfのバインドアドレス設定が正しいことを確認してください。

rootとしてmysqlにログインできません Apr 08, 2025 pm 04:54 PM

ルートとしてMySQLにログインできない主な理由は、許可の問題、構成ファイルエラー、一貫性のないパスワード、ソケットファイルの問題、またはファイアウォール傍受です。解決策には、構成ファイルのBind-Addressパラメーターが正しく構成されているかどうかを確認します。ルートユーザー許可が変更されているか削除されてリセットされているかを確認します。ケースや特殊文字を含むパスワードが正確であることを確認します。ソケットファイルの許可設定とパスを確認します。ファイアウォールがMySQLサーバーへの接続をブロックすることを確認します。

VUEでデフォルトのエクスポートを使用する方法 Apr 07, 2025 pm 07:21 PM

VUEのデフォルトのエクスポートが明らかになります：デフォルトのエクスポート、名前を指定せずにモジュール全体を一度にインポートします。コンポーネントはコンパイル時にモジュールに変換され、使用可能なモジュールはビルドツールを介してパッケージ化されます。名前付きのエクスポートと組み合わせて、定数や関数などの他のコンテンツをエクスポートできます。よくある質問には、循環依存関係、パスエラー、およびビルドエラーが含まれ、コードとインポートステートメントを慎重に調べる必要があります。ベストプラクティスには、コードセグメンテーション、読みやすさ、コンポーネントの再利用が含まれます。

PHPとBootstrapテーブルの文字化けコードの問題を解決する方法 Apr 07, 2025 am 11:27 AM

ブートストラップテーブルを使用して中国の文字盤を表示するソリューション：1。PHP文字セットをUTF-8に設定します。 2. PHPスクリプトで文字セットを設定します。 3.データベース文字セットがUTF-8であることを確認してください。 4.ブートストラップテーブルの文字セットを「Zh-Cn」に設定します。 5。Mbstringを使用して、キャストキャラクターセットを拡張します。 6.他のエンコーディングからのトランスコードデータ。 7.ブラウザエンコーディングを確認します。

See all articles