PostgreSQL での数値文字列とテキスト文字列の混合の「人に優しい」並べ替え
数値とテキストが混在する文字列の並べ替えは、特に「人間に優しい」並べ替えを実現することが目標である場合には、困難になることがあります。この場合、数値は文字列全体としてではなく、単一の数値として扱われます。
この問題を解決するために、データベース エンジニアは PostgreSQL に「人に優しい」文字列ソートを実装することに着手しました。課題は、各文字列を文字と数字の交互のチャンクに分割し、結果のデータを並べ替えることです。
文字列をチャンクに分割します
文字列をチャンクに分割する 1 つの方法は、パターン (D*)(d*)
で regexp_matches()
関数を使用することです。 「g」オプションを設定すると、指定された文字列内の各文字と数字の組み合わせの一致を表す複数行が返されます。
マッチング結果の集計
次に、これらの一致を配列に集約することが重要です。整数コンポーネントの空の文字列 ('') を 0 に置き換えると ('' は整数に変換できないため)、集計を正確に実行できるようになります。
カスタム複合データ型
効率的な並べ替えを実現するために、エンジニアはデータベースにカスタム複合データ型 ai
を作成しました。このタイプには、テキスト フィールド (a) と整数フィールド (i) が含まれます。
すべてのステップを統合します
最後のステップは、構築された ai
オブジェクトの配列に基づいてデータを並べ替えることです。 ORDER BY
句は、まず regexp_replace()
を使用して先頭の文字コンポーネントを並べ替えます。これは、先頭の数字と空の文字列を効率的に処理するのに役立ちます。次に、文字と数字が交互に並んだブロックを表す ai
オブジェクトの配列を並べ替えます。
概要
このアプローチは、Mac OS の Finder で観察される動作と同様の、混合数値とテキストの「人間に優しい」文字列ソートを効果的に実現します。この方法では、さまざまな PostgreSQL 関数を組み合わせて、文字と数字のブロックを交互に並べる人間スタイルの並べ替えをシミュレートし、混合文字列の自然な並べ替えを可能にします。
以上がPostgreSQL で数字とテキストが混在する場合の文字列ソートを人間らしくするにはどうすればよいでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。