Latin1로 인코딩된 MySQL 열에서 UTF-8 문자를 감지하는 방법은 무엇입니까?

Susan Sarandon
풀어 주다: 2024-11-13 07:59:02
원래의
673명이 탐색했습니다.

How to Detect UTF-8 Characters in Latin1 Encoded MySQL Columns?

MySQL의 Latin1 인코딩 열에서 UTF-8 문자 감지

문제:

귀하 데이터베이스를 변환하기 전에 데이터베이스의 Latin1 인코딩 열에 UTF-8 문자가 포함되어 있는지 확인하고 싶습니다.

옵션 1: MySQL 덤프 및 Perl 검색

이 옵션에는 MySQL 덤프를 사용하여 텍스트 파일을 생성한 다음 Perl을 사용하여 검색하는 작업이 포함됩니다. UTF-8 문자. 그러나 이 방법은 대규모 데이터 세트의 경우 시간이 많이 걸리고 비효율적일 수 있습니다.

옵션 2: MySQL CHAR_LENGTH 비교

이 옵션은 MySQL CHAR_LENGTH 함수를 사용하여 다음과 같은 행을 찾습니다. UTF-8 문자가 있음을 나타낼 수 있는 멀티바이트 문자입니다. 그러나 일부 Latin1 악센트 문자도 멀티바이트이므로 충분하지 않을 수 있습니다.

제안 해결 방법:

보다 포괄적인 접근 방식은 다음 쿼리를 사용하는 것입니다.

SELECT CONVERT(CONVERT(name USING BINARY) USING latin1) AS latin1, 
       CONVERT(CONVERT(name USING BINARY) USING utf8) AS utf8 
FROM users 
WHERE CONVERT(name USING BINARY) RLIKE CONCAT('[', UNHEX('80'), '-', UNHEX('FF'), ']')
로그인 후 복사

이 쿼리는 Latin1 악센트 문자 또는 UTF-8일 수 있는 "high-ASCII" 문자를 검색합니다. 멀티바이트 문자. Latin1 및 UTF-8 인코딩을 모두 사용하여 이름의 이진 표현을 변환하면 결과를 시각적으로 비교하고 UTF-8 문자가 있음을 나타내는 차이점이 있는지 확인할 수 있습니다.

위 내용은 Latin1로 인코딩된 MySQL 열에서 UTF-8 문자를 감지하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿