UTF-8 照合順序: 一般 CI、Unicode CI、またはバイナリのどれを選択する必要がありますか?-mysql チュートリアル-php.cn

UTF-8 照合順序: 一般 CI、Unicode CI、またはバイナリのどれを選択する必要がありますか?

Susan Sarandon

リリース： 2024-12-10 21:05:14

オリジナル

852 人が閲覧しました

UTF-8 Collation: Which One Should You Choose – General CI, Unicode CI, or Binary?

ユーザーが送信したデータの UTF-8 照合順序: 包括的なガイド

ユーザーが送信したデータを扱う場合、UTF-8 などの適切な照合順序を選択する一般CI または UTF-8 Unicode CI は、効果的なデータの編成と取得に不可欠です。この記事の目的は、これら 2 つの照合順序の区別を明確にし、UTF-8 バイナリをいつ使用するかについてのガイダンスを提供することです。

UTF-8 一般 CI と UTF-8 Unicode CI

UTF -8 一般 CI (大文字と小文字を区別しない) と UTF-8 Unicode CI (大文字と小文字を区別しない) は、両方とも Unicode 文字セットの照合タイプです。ただし、大文字と小文字の区別と文字比較の処理が異なります。

UTF-8 一般 CI は UTF-8 Unicode CI よりも高速ですが、精度は低くなります。文字間の 1 対 1 の比較が実行され、文字の拡張、縮小、または無視可能な文字はサポートされません。これにより、ドイツ語の文字とその展開された形式を比較する場合など、特定のシナリオでは不正確な結果が生じる可能性があります。一方、

UTF-8 Unicode CI はより正確ですが、速度が遅くなります。文字マッピングをサポートし、より微妙な比較を提供します。これにより、文字に複数の形式や表現がある場合でも、文字が正しく比較されるようになります。