Cx_Oracle 쿼리 시 UnicodeDecodeError 문제를 Python으로 해결합니다.-파이썬 튜토리얼-php.cn

집

백엔드 개발

파이썬 튜토리얼

Cx_Oracle 쿼리 시 UnicodeDecodeError 문제를 Python으로 해결합니다.

高洛峰

Feb 16, 2017 am 11:13 AM

datatables oracle python

최근 프로젝트에서 100만 개 이상의 레코드가 포함된 테이블을 쿼리한 후 일부 데이터 통계를 수행해야 했는데 이 과정에서 일부 데이터만 쿼리한 후에 UnicodeDecodeError가 발생하는 것을 발견했습니다.
여기에서는 쿼리를 위해 sqlalchemy 라이브러리를 사용하고 내부적으로 Cx_Oracle을 사용하여 해당 작업을 수행합니다. 사용된 Python 버전은 3.5.0이고 호스트 시스템은 Windows 2008 Server이며 다음과 유사한 작업이 수행됩니다.

from sqlalchemy import create_engine

engine = create_engine('oracle://demo:123456@192.168.1.202/TEST')
conn = engine.connect()
sql = 'select t.type from TS t'
result = conn.execute(sql)
for row in result:
    print(row['type'])

로그인 후 복사

여기에서는 먼저 데이터베이스에 대한 연결을 만든 다음 해당 쿼리 작업을 수행합니다. 안타깝게도 10개 미만의 레코드를 쿼리한 후 UnicodeDecodeError가 발생했습니다.
원래는 데이터베이스의 서버 인코딩 문제인 줄 알고 create_engine 함수에 인코딩 매개변수를 추가하고 다음과 같이 변경했습니다.

engine = create_engine('oracle://demo:123456@192.168.1.202/TEST',encoding="UTF-8")

로그인 후 복사

또 다른 방법으로는 연결에서 인코딩을 직접 지정하는 방법이 있습니다. 경로는 다음과 유사합니다:

engine = create_engine('oracle://demo:123456@192.168.1.202/TEST?charset=utf-8')

로그인 후 복사

그러나 문제는 아직 해결되지 않았습니다. 인터넷을 검색했지만 적합한 솔루션을 찾을 수 없었습니다. Mysql 데이터베이스를 사용할 때(저는 개인적으로 Postgresql을 더 좋아합니다), 잘못된 문자가 나타날 때 다음 작업을 자주 수행했다는 것이 기억났습니다.

set names gbk;

로그인 후 복사

우리는 설정했습니다. 터미널에서 문자 깨짐 문제를 해결하기 위해 서버 인코딩이 아닌 클라이언트 인코딩을 이런 방식으로 사용합니다(Postgresql의 기본 데이터베이스는 UTF-8이므로 문자 깨짐 가능성이 낮습니다). 또한 Linux에서 Oracle 클라이언트를 설치하는 경우 NLS_LANG라는 환경 변수가 설정됩니다. 자세한 내용은 Ubuntu 14.04에 Oracle Instant Client 설치 문서를 참조하세요. 물론 이 문서에서는 일부 세부 사항을 소개하지 않습니다.
일반적으로 cmd에서 다음과 같이 설정합니다.

setenv NLS_LANG=SIMPLIFIED CHINESE_CHINA.ZHS16GBK

로그인 후 복사

Oracle 메시지에 사용되는 언어는 중국어 간체이고 클라이언트의 문자 집합은 GBK로 지정합니다.
또한 다음 명령문을 실행하여 위 작업이 올바른지 확인할 수도 있습니다.

SELECT * FROM v$nls_parameters;

로그인 후 복사

위 데이터베이스 서버가 Windows에 배포되었으므로 결과는 당연히 GBK이므로 고객이 만약 클라이언트는 디코딩을 위해 UTF8 문자 세트를 사용하므로 디코딩 오류는 자연스럽게 발생합니다.
주의해야 할 점은 데이터베이스 서버와 클라이언트의 인코딩이 일관되어야만 비ASCII 인코딩을 정상적으로 표시할 수 있으며, sqlalchemy에서는 기본적으로 쿼리 문자열을 강제로 유니코드로 변환한다는 점입니다. 따라서 Python3에서는

>>> a='中国'.encode('gbk')
>>> a
b'\xd6\xd0\xb9\xfa'

로그인 후 복사

의 과정과 유사합니다. sqlalchemy에서는 강제 인코딩 변환으로 인해

>>> a.decode('utf-8')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd6 in position 0: invalid continuation byte

로그인 후 복사

의 과정과 유사하게 됩니다. 따라서 위와 같은 문제가 발생합니다. . 일반적인 상황에서는 인코딩을 GBK:

>>> a.decode('gbk')
'中国'

로그인 후 복사

로 지정해야 하며 NLS_LANG 설정은 위 인코딩을 GBK로 수정하는 것과 같습니다.

Python에 대한 자세한 내용 - Cx_Oracle 쿼리 시 UnicodeDecodeError 문제 해결에 대한 내용은 PHP 중국어 웹사이트에서 관련 기사를 참고하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7469

Cakephp 튜토리얼

1376

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

Oracle 데이터베이스를 가져 오는 방법 Apr 11, 2025 pm 08:06 PM

데이터 가져 오기 방법 : 1. SQLLOADER 유틸리티 사용 : 데이터 파일 준비, 제어 파일 작성 및 SQLLOADER 실행; 2. IMP/EXP 도구를 사용하십시오 : 데이터 내보내기, 데이터 가져 오기. 팁 : 1. 빅 데이터 세트에 권장되는 SQL*로더; 2. 대상 테이블이 존재해야하고 열 정의가 일치해야합니다. 3. 가져 오기 후에는 데이터 무결성을 확인해야합니다.

Oracle의 테이블 스페이스 크기를 확인하는 방법 Apr 11, 2025 pm 08:15 PM

Oracle 테이블 스페이스 크기를 쿼리하려면 다음 단계를 따르십시오. 쿼리를 실행하여 테이블 스페이스 이름을 결정하십시오. 쿼리를 실행하여 테이블 스페이스 크기를 쿼리하십시오. sum (bytes)을 total_size, sum (bytes_free)으로 sum (bytes_free), sum (bytes) - sum (bytes_free)으로 dba_data_fices where tablespace_.

Oracle에서 테이블을 만드는 방법 Apr 11, 2025 pm 08:00 PM

Oracle 테이블 작성에는 다음 단계가 필요합니다. 테이블 작성 구문을 사용하여 테이블 이름, 열 이름, 데이터 유형, 제약 조건 및 기본값을 지정하십시오. 테이블 이름은 간결하고 설명 적이어야하며 30자를 초과해서는 안됩니다. 열 이름은 설명 적이어야하며 데이터 유형은 열에 저장된 데이터 유형을 지정합니다. NOT NULL 제약 조건은 열에서 NULL 값이 허용되지 않도록하고 기본 조항은 열의 기본값을 지정합니다. 테이블의 고유 한 레코드를 식별하기위한 주요 주요 제약. 외국 키 제약 조건은 테이블의 열이 다른 테이블의 기본 키를 지칭하도록 지정합니다. 기본 키, 고유 한 제약 조건 및 기본값이 포함 된 샘플 테이블 학생의 생성을 참조하십시오.

Python vs. C : 응용 및 사용 사례가 비교되었습니다 Apr 12, 2025 am 12:01 AM

Python은 데이터 과학, 웹 개발 및 자동화 작업에 적합한 반면 C는 시스템 프로그래밍, 게임 개발 및 임베디드 시스템에 적합합니다. Python은 단순성과 강력한 생태계로 유명하며 C는 고성능 및 기본 제어 기능으로 유명합니다.

오라클을 열 수 없다면해야 할 일 Apr 11, 2025 pm 10:06 PM

Oracle에 대한 솔루션은 개설 할 수 없습니다. 1. 데이터베이스 서비스 시작; 2. 청취자를 시작하십시오. 3. 포트 충돌을 확인하십시오. 4. 환경 변수를 올바르게 설정하십시오. 5. 방화벽이나 바이러스 백신 소프트웨어가 연결을 차단하지 않도록하십시오. 6. 서버가 닫혀 있는지 확인하십시오. 7. RMAN을 사용하여 손상된 파일을 복구하십시오. 8. TNS 서비스 이름이 올바른지 확인하십시오. 9. 네트워크 연결 확인; 10. Oracle 소프트웨어를 다시 설치하십시오.

Oracle에서 Barbled 코드를 해결하는 방법 Apr 11, 2025 pm 10:09 PM

데이터베이스 문자 세트를 확인하여 데이터와 일치하는지 확인하여 Oracle Garbled 문제를 해결할 수 있습니다. 클라이언트 문자 세트를 데이터베이스와 일치하도록 설정하십시오. 데이터베이스 문자 세트와 일치하도록 데이터 변환 또는 열 문자 세트를 수정하십시오. 유니 코드 문자 세트를 사용하고 멀티 바이트 문자 세트를 피하십시오. 데이터베이스 및 클라이언트의 언어 설정이 올바른지 확인하십시오.

Oracle 설치를 제거하는 방법에 실패했습니다 Apr 11, 2025 pm 08:24 PM

Oracle 설치 실패에 대한 방법 제거 : Oracle Service를 닫고 Oracle Program 파일 및 레지스트리 키 삭제, Oracle 환경 변수를 제거하고 컴퓨터를 다시 시작하십시오. 제거되지 않으면 Oracle 범용 제거 도구를 사용하여 수동으로 제거 할 수 있습니다.

Oracle View를 암호화하는 방법 Apr 11, 2025 pm 08:30 PM

Oracle View 암호화를 사용하면보기에서 데이터를 암호화 할 수 있으므로 민감한 정보의 보안을 향상시킬 수 있습니다. 단계에는 다음이 포함됩니다. 1) 마스터 암호화 키 생성 (MEK); 2) 암호화 된 뷰 생성, 암호화 할보기 및 MEK를 지정하는 것; 3) 사용자가 암호화 된보기에 액세스하도록 승인합니다. 암호화 된 뷰 작동 방식 : 사용자가 암호화 된보기를 쿼리 할 때 Oracle은 MEK를 사용하여 데이터를 해독하여 공인 사용자 만 읽기 쉬운 데이터에 액세스 할 수 있도록합니다.

See all articles

Cx_Oracle 쿼리 시 UnicodeDecodeError 문제를 Python으로 해결합니다.

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제