php UTF8中国語文字列インターセプトを自分で実装する
php UTF8 中国語文字列インターセプトを自分で実装する
header("Content-type: text/html; charset=utf-8"); function my_substr($str,$begin,$length){ $i = $begin; $result=""; while($length > 0){ if([color=red]ord($str[$i])>127[/color]){ $result .= substr($str,$i,3); $i = $i+3; }else{ $result .= substr($str,$i,1); $i++; } $length--; } return $result; } $chinese = "中a国people"; echo "<br>".my_substr($chinese,0,3);
出力結果は次のとおりです: China a
説明:
命令は文字の ASSIC 値を削除することです。
chr は assic から文字を取得します。
なぜ assic が 127 より大きいと判断されるのですか?
ASSIC コード表は次のとおりです
http://www.asciitable.com/
当初、コンピューターには文字を表現するために使用された ASSIC コーディングしかありませんでした。 ASSIC 文字は 1 バイトで表されます。したがって、ASSIC には最大でも 256 個の組み合わせしかありません。英語には十分ですが、中国語、日本語、韓国語、その他のアジアの言語には十分ではありません。
その場合、中国語の文字を表すために複数の BYTE を使用することのみを検討できます。たとえば、GB2312 は中国語の文字を表すために 2 バイトを使用します。ラップトップを使用して Windows で新しい TXT を作成し、ASSIC として保存します。簡体字中国語オペレーティング システムを使用している場合、TXT 内の中国語は GB2312 に保存されます。文字列をインターセプトする上記のプログラム $result .= substr($str,$i,3); では、その中の 3 を 2 に変更する必要があります。同時にヘッダーも変更することを忘れないでください。 GB2312 または UTF8 に関係なく、ASSIC 128 より前の A ~ Z などを表します。これらは BTYE で表され、可変長エンコーディングです。したがって、ASSIC を使用して、それらが中国語かどうかを判断できます。
文章が汚いかもしれません。必要に応じて注意してお読みください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









文字列の長さを取得するには、Java の String.length() 関数を使用します。Java プログラミングでは、文字列は非常に一般的なデータ型です。多くの場合、文字列の長さ、つまり文字列内の文字数を取得する必要があります。 Java では、String クラスの length() 関数を使用して文字列の長さを取得できます。簡単なコード例を次に示します。 publicclassStringLengthExample{publ

この記事では、PHP が返す文字列の最初の文字の ASCII 値について詳しく説明します。編集者が非常に実用的であると考えたので、参考として共有します。この記事を読んで何かを得ることができれば幸いです。 PHP は文字列の最初の文字の ASCII 値を返します はじめに PHP では、文字列の最初の文字の ASCII 値を取得することは、文字列処理と文字エンコーディングの基本的な知識を必要とする一般的な操作です。 ASCII 値は、コンピュータ システムで文字の数値を表すために使用され、文字の比較、データの送信、および保存に重要です。文字列の最初の文字の ASCII 値を取得するプロセスには、次の手順が含まれます。 文字列の取得: ASCII 値を取得する文字列を決定します。変数または文字列定数を指定できます

この記事では、PHP がどのようにして、別の文字列内の文字列の開始位置から終了位置まで文字列を返すかを詳しく説明します。非常に実用的であると編集者が考えたので、参考として共有します。この記事. この記事から何かを得ることができます。 PHP で substr() 関数を使用して、文字列から部分文字列を抽出します。substr() 関数は、文字列から指定された範囲内の文字を抽出できます。構文は次のとおりです。 substr(string,start,length) ここで、 string: 部分文字列が抽出される元の文字列。 start: 部分文字列の開始位置のインデックス (0 から始まります)。 length (オプション): 部分文字列の長さ。指定されていない場合は、

length 関数は、指定された文字列内の文字数またはバイト数を返すために使用されます。文字列データの問い合わせや加工を行う際に、文字列の長さを計算して演算・判定するために使用できます。 length 関数はバイト数ではなく、文字列内の文字数をカウントすることに注意してください。マルチバイト文字セットの場合、文字は複数のバイトで構成される場合があります。したがって、length 関数は文字列の長さを計算するときにマルチバイト文字を 1 文字としてカウントします。

1 Unicode コンピュータ ストレージの基本単位は 8 ビットで構成されるバイトです。英語は 26 文字といくつかの記号のみで構成されているため、英語の文字はバイト単位で直接格納できます。ただし、他の言語 (中国語、日本語、韓国語など) では、文字数が多いため、エンコードに複数のバイトを使用する必要があります。コンピューター技術の普及に伴い、非ラテン文字エンコード技術は発展を続けていますが、依然として 2 つの大きな制限があります。 多言語サポートがないこと。 ある言語のエンコード スキームを別の言語で使用することはできません。また、統一された標準もありません。たとえば、中国語には GBK、GB2312、GB18030 など、多くのエンコード標準があります。エンコード方式が統一されていないため、開発者は異なるエンコード間で相互に変換する必要があり、必然的に多くのエラーが発生します。

__str__ と __repr__ の類似点と相違点は何ですか? 文字列の表現については誰もが知っています。Python の組み込み関数 repr() は、識別を容易にするためにオブジェクトを文字列の形式で表現できます。これが「文字列表現」です。 repr() は、特別なメソッド __repr__ を通じてオブジェクトの文字列表現を取得します。 __repr__ が実装されていない場合、ベクトルのインスタンスをコンソールに出力すると、結果の文字列が次のようになります。 >>>classExample:pass>>>print(str(Example()))>>>

文字列をインターセプトするための PHP の substr() 関数について理解します。PHP 言語では、substr() 関数は非常に便利な文字列処理関数です。指定された位置と長さで文字列の断片をインターセプトするために使用できます。 substr() 関数は、インターセプトする文字列、インターセプトの開始位置、およびインターセプトの長さの 3 つのパラメーターを受け入れます。以下では、substr() 関数の使い方を詳しく紹介し、具体的なコード例を示します。 substr() 関数の基本的な使い方 substr() 関数

PHP 関数 "substr" を使用して、文字列の部分文字列を取得します。PHP プログラミングでは、文字列の内容の一部を取得する必要がある状況によく遭遇します。このとき、PHP の組み込み関数「substr」を使用してこれを実現できます。この記事では、「substr」関数を使用して文字列の部分文字列を取得する方法を説明し、いくつかのコード例を示します。 1. substr 関数の基本的な使い方 substr 関数は、文字列から指定した長さの部分文字列を取得するために使用します。その基本的な構文は次のとおりです。
