C で UTF-8 エンコードされた std::string の実際の長さを判断する方法-C++-php.cn

ホームページ

バックエンド開発

C++

C で UTF-8 エンコードされた std::string の実際の長さを判断する方法

Linda Hamilton

Oct 27, 2024 pm 08:43 PM

How to Determine the True Length of a UTF-8 Encoded std::string in C ?

UTF-8 でエンコードされた std::string の実際の長さを決定する

C では、 std::string は次の配列です。文字はそれぞれ 1 バイトのメモリを占有します。ただし、UTF-8 エンコードの場合は、複数バイトのシーケンスを使用して 1 つの文字を表すことができます。これにより、str.length() によって報告される文字列の長さと実際の文字数との間に不一致が生じます。

UTF-8 文字エンコーディング標準に従って、バイトはシーケンスにグループ化されます。シーケンスの長さを示す最初のバイト:

0x00000000 - 0x0000007F: 1 バイト
0x00000080 - 0x000007FF: 2 バイト
0x00000800 - FFFF: 3バイト
0x00010000 - 0x001FFFFF: 4 バイト

UTF-8 でエンコードされた std::string の実際の長さを確認するには、次の方法を使用できます。

*s 演算子を使用して、文字列を 1 文字ずつ繰り返します。
各文字について、(& 演算子を使用して) 最初のバイトが継続バイトパターン (10xxxxxx) に一致するかどうかを確認します。

最初のバイトが継続パターンと一致しない場合は、長さのカウントをインクリメントします。これは、新しい文字シーケンスの開始を示します。

実装例は次のとおりです。

<code class="c++">int len = 0;
while (*s) len += (*s++ & 0xc0) != 0x80;</code>

ログイン後にコピー

このアプローチに従うことで、UTF-8 でエンコードされた std の実際の長さを正確に決定できます。 :string。文字カウント、文字列操作、データ解析などのさまざまな操作に不可欠です。

以上がC で UTF-8 エンコードされた std::string の実際の長さを判断する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

ホットトピック

Java チュートリアル

1675

CakePHP チュートリアル

1429

Laravel チュートリアル

1333

PHP チュートリアル

1278

C# チュートリアル

1257

Related knowledge

C＃対C：歴史、進化、将来の見通し Apr 19, 2025 am 12:07 AM

C＃とCの歴史と進化はユニークであり、将来の見通しも異なります。 1.Cは、1983年にBjarnestrostrupによって発明され、オブジェクト指向のプログラミングをC言語に導入しました。その進化プロセスには、C 11の自動キーワードとラムダ式の導入など、複数の標準化が含まれます。C20概念とコルーチンの導入、将来のパフォーマンスとシステムレベルのプログラミングに焦点を当てます。 2.C＃は2000年にMicrosoftによってリリースされました。CとJavaの利点を組み合わせて、その進化はシンプルさと生産性に焦点を当てています。たとえば、C＃2.0はジェネリックを導入し、C＃5.0は非同期プログラミングを導入しました。これは、将来の開発者の生産性とクラウドコンピューティングに焦点を当てます。

C＃対C：学習曲線と開発者エクスペリエンス Apr 18, 2025 am 12:13 AM

C＃とCおよび開発者の経験の学習曲線には大きな違いがあります。 1）C＃の学習曲線は比較的フラットであり、迅速な開発およびエンタープライズレベルのアプリケーションに適しています。 2）Cの学習曲線は急勾配であり、高性能および低レベルの制御シナリオに適しています。

Cの静的分析とは何ですか？ Apr 28, 2025 pm 09:09 PM

Cでの静的分析の適用には、主にメモリ管理の問題の発見、コードロジックエラーの確認、およびコードセキュリティの改善が含まれます。 1）静的分析では、メモリリーク、ダブルリリース、非初期化ポインターなどの問題を特定できます。 2）未使用の変数、死んだコード、論理的矛盾を検出できます。 3）カバー性などの静的分析ツールは、バッファーオーバーフロー、整数のオーバーフロー、安全でないAPI呼び出しを検出して、コードセキュリティを改善します。

CおよびXML：関係とサポートの調査 Apr 21, 2025 am 12:02 AM

Cは、サードパーティライブラリ（TinyXML、PUGIXML、XERCES-Cなど）を介してXMLと相互作用します。 1）ライブラリを使用してXMLファイルを解析し、それらをC処理可能なデータ構造に変換します。 2）XMLを生成するときは、Cデータ構造をXML形式に変換します。 3）実際のアプリケーションでは、XMLが構成ファイルとデータ交換に使用されることがよくあり、開発効率を向上させます。

CでChronoライブラリを使用する方法は？ Apr 28, 2025 pm 10:18 PM

CでChronoライブラリを使用すると、時間と時間の間隔をより正確に制御できます。このライブラリの魅力を探りましょう。 CのChronoライブラリは、時間と時間の間隔に対処するための最新の方法を提供する標準ライブラリの一部です。 Time.HとCtimeに苦しんでいるプログラマーにとって、Chronoは間違いなく恩恵です。コードの読みやすさと保守性を向上させるだけでなく、より高い精度と柔軟性も提供します。基本から始めましょう。 Chronoライブラリには、主に次の重要なコンポーネントが含まれています。STD:: Chrono :: System_Clock：現在の時間を取得するために使用されるシステムクロックを表します。 STD :: Chron

Cの未来：適応と革新 Apr 27, 2025 am 12:25 AM

Cの将来は、並列コンピューティング、セキュリティ、モジュール化、AI/機械学習に焦点を当てます。1）並列コンピューティングは、コルーチンなどの機能を介して強化されます。 2）セキュリティは、より厳格なタイプのチェックとメモリ管理メカニズムを通じて改善されます。 3）変調は、コード組織とコンパイルを簡素化します。 4）AIと機械学習は、数値コンピューティングやGPUプログラミングサポートなど、CにComply Coveに適応するように促します。

C：それは死にかけていますか、それとも単に進化していますか？ Apr 24, 2025 am 12:13 AM

c isnotdying; it'sevolving.1）c relelevantdueToitsversitileSileSixivisityinperformance-criticalApplications.2）thelanguageSlikeModulesandCoroutoUtoimveUsablive.3）despiteChallen

C＃対C：メモリ管理とガベージコレクション Apr 15, 2025 am 12:16 AM

C＃は自動ガベージコレクションメカニズムを使用し、Cは手動メモリ管理を使用します。 1。C＃のゴミコレクターは、メモリを自動的に管理してメモリの漏れのリスクを減らしますが、パフォーマンスの劣化につながる可能性があります。 2.Cは、微細な管理を必要とするアプリケーションに適した柔軟なメモリ制御を提供しますが、メモリの漏れを避けるためには注意して処理する必要があります。

See all articles

C で UTF-8 エンコードされた std::string の実際の長さを判断する方法

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック