PostgreSQL 中混合数字和文本字符串的“人性化”排序
对包含混合数字和文字的字符串进行排序是一个挑战,尤其当目标是实现“人性化”排序时。在这种情况下,数字被视为单个数字,而不是整个字符串。
为了解决这个问题,一位数据库工程师着手在 PostgreSQL 中实现“人性化”字符串排序。挑战在于将每个字符串分割成交替的字母和数字块,然后对结果数据进行排序。
将字符串分割成块
将字符串分割成块的一种方法是使用带有模式 (D*)(d*)
的 regexp_matches()
函数。通过设置 'g' 选项,它返回多行,表示给定字符串中每个字母和数字组合的匹配项。
聚合匹配结果
接下来,至关重要的是将这些匹配项聚合到一个数组中。将空字符串 ('') 替换为整数组件中的 0(因为 '' 无法转换为整数)确保可以准确地执行聚合。
自定义复合数据类型
为了实现高效排序,工程师在数据库中创建了一个自定义复合数据类型 ai
。此类型包含一个文本字段 (a) 和一个整数字段 (i)。
整合所有步骤
最后一步是根据构造的 ai
对象数组对数据进行排序。ORDER BY
子句首先使用 regexp_replace()
对前导字母组件进行排序。这有助于有效地处理前导数字和空字符串。随后,它对表示交替字母和数字块的 ai
对象数组进行排序。
总结
这种方法有效地实现了混合数字和文本的“人性化”字符串排序,类似于在 Mac OS 的 Finder 中观察到的行为。该方法结合了各种 PostgreSQL 函数来模拟具有交替字母和数字块的人类式排序,从而实现混合字符串的自然排序。
以上是我们如何人性化 PostgreSQL 中混合数字和文本的字符串排序?的详细内容。更多信息请关注PHP中文网其他相关文章!