R의 MySQL에서 텍스트를 가져올 때 UTF-8 문자 인코딩 문제 해결
MySQL 데이터베이스에서 UTF-8로 인코딩된 텍스트를 R로 검색 문제가 발생하여 손상된 문자가 "?"로 표시될 수 있습니다. 기호. R과 다른 패키지를 사용하여 이 문제를 해결하려는 여러 시도는 성공하지 못한 것으로 입증되었습니다.
이 문제의 근본 원인은 R의 데이터베이스와 설정된 연결에서 사용되는 기본 문자 집합에 있습니다. 기본적으로 R의 로케일은 다음과 같습니다. en_US.UTF-8로 설정되어 있지만 데이터베이스 자체는 UTF-8 인코딩을 지원하지 않는 latin1과 같은 다른 문자 집합을 사용하도록 구성될 수 있습니다.
이 문제를 해결하려면 다음이 필요합니다. 연결 세션이 UTF-8 인코딩을 사용하도록 명시적으로 설정되어 있는지 확인하세요. 이를 달성하기 위한 두 가지 접근 방식이 있습니다:
RMySQL 사용:
dbConnect(MySQL())를 사용하여 MySQL 데이터베이스에 대한 연결을 설정한 후 다음 쿼리를 실행합니다.
SET NAMES utf8
이 쿼리는 현재 세션의 문자 집합을 UTF-8로 변경하여 후속 쿼리가 UTF-8로 올바르게 인코딩된 데이터를 검색하도록 보장합니다.
RODBC 사용 :
odbcDriverConnect()를 사용하여 데이터베이스에 연결할 때 DSN 문자열 내에서 CharSet=utf8 매개 변수를 지정합니다.
con <- odbcDriverConnect('DRIVER=mysql;user=root;CharSet=utf8')
문자 집합을 UTF-8로 명시적으로 설정하여 , RODBC를 통해 설정된 연결은 올바른 인코딩을 사용하여 데이터를 검색하여 손상된 문자 문제를 해결합니다.
위 내용은 R의 MySQL에서 텍스트를 가져올 때 UTF-8 문자 인코딩 문제를 해결하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!