PostgreSQL에서 숫자와 텍스트 문자열이 혼합된 "인간 친화적인" 정렬
숫자와 텍스트가 혼합된 문자열을 정렬하는 것은 어려울 수 있으며, 특히 목표가 "인간 친화적인" 정렬을 달성하는 것인 경우 더욱 그렇습니다. 이 경우 숫자는 전체 문자열이 아닌 단일 숫자로 처리됩니다.
이 문제를 해결하기 위해 한 데이터베이스 엔지니어는 PostgreSQL에서 "인간 친화적인" 문자열 정렬을 구현하기 시작했습니다. 문제는 각 문자열을 문자와 숫자의 교대로 분할한 다음 결과 데이터를 정렬하는 것입니다.
문자열을 덩어리로 나누기
문자열을 여러 개의 덩어리로 나누는 한 가지 방법은 (D*)(d*)
패턴과 함께 regexp_matches()
함수를 사용하는 것입니다. 'g' 옵션을 설정하면 주어진 문자열의 각 문자 및 숫자 조합에 대한 일치 항목을 나타내는 여러 줄이 반환됩니다.
일치 결과 집계
다음으로 이러한 일치 항목을 배열로 집계하는 것이 중요합니다. 정수 구성 요소에서 빈 문자열('')을 0으로 바꾸면(''를 정수로 변환할 수 없기 때문에) 집계가 정확하게 수행될 수 있습니다.
사용자 정의 복합 데이터 유형
효율적인 정렬을 위해 엔지니어는 데이터베이스에 사용자 정의 복합 데이터 유형ai
을 생성했습니다. 이 유형에는 텍스트 필드(a)와 정수 필드(i)가 포함되어 있습니다.
모든 단계 통합
마지막 단계는 구성된 ai
객체 배열을 기반으로 데이터를 정렬하는 것입니다. ORDER BY
절은 먼저 regexp_replace()
을 사용하여 선행 문자 구성 요소를 정렬합니다. 이는 선행 숫자와 빈 문자열을 효율적으로 처리하는 데 도움이 됩니다. 그런 다음 문자와 숫자가 교대로 나타나는 블록을 나타내는 ai
객체 배열을 정렬합니다.
요약
이 접근 방식은 Mac OS의 Finder에서 관찰되는 동작과 유사하게 숫자와 텍스트가 혼합된 "인간 친화적인" 문자열 정렬을 효과적으로 달성합니다. 이 방법은 다양한 PostgreSQL 함수를 결합하여 문자와 숫자의 교대 블록을 사용하여 인간 스타일 정렬을 시뮬레이션하므로 혼합 문자열을 자연스럽게 정렬할 수 있습니다.
위 내용은 혼합 숫자와 텍스트에 대해 PostgreSQL의 문자열 정렬을 어떻게 인간화할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!