Python 문자열 접두사 'u', 'r' 및 'ur'의 차이점은 무엇입니까?-파이썬 튜토리얼-php.cn

문자열 접두사의 뉘앙스: "u", "r" 및 "ur"

원시 문자열 리터럴에 수반되는 것

"u", "r" 및 "ur" 접두사 구별

문자열 유형 간 변환

인코딩 및 문자열 접두사

집

백엔드 개발

파이썬 튜토리얼

Python 문자열 접두사 'u', 'r' 및 'ur'의 차이점은 무엇입니까?

Mary-Kate Olsen

Dec 18, 2024 am 10:03 AM

What's the Difference Between Python String Prefixes

문자열 접두사의 뉘앙스: "u", "r" 및 "ur"

Python 문자열 영역에서는 목적과 목적에 관해 혼란이 자주 발생합니다. 문자열 접두사 "u", "r" 및 "ur"의 기능. 이 글의 목표는 원시 문자열 리터럴의 고유한 역할과 복잡성을 조명하는 것입니다.

원시 문자열 리터럴에 수반되는 것

일반적인 오해와는 달리 뚜렷한 "원시 문자열" 유형은 없습니다. 대신, "원시 문자열 리터럴"은 r'...' 또는 r"""..."""와 같이 문자 "r"이 접두사로 붙은 문자열을 나타냅니다. 이러한 리터럴은 백슬래시() 처리 방식만 다릅니다.

일반 문자열 리터럴에서 백슬래시 뒤에 다른 문자가 오면 일반적으로 줄 바꿈이나 탭과 같은 특수 문자를 나타내는 이스케이프 시퀀스가 발생합니다. 그러나 원시 문자열 리터럴은 문자열을 종료하는 닫는 작은따옴표 또는 큰따옴표 앞에 오는 경우를 제외하고 백슬래시를 그 자체로 해석합니다.

"u", "r" 및 "ur" 접두사 구별

"u" 접두사는 유니코드 유형의 유니코드 개체인 유니코드 문자열을 나타냅니다. Python 2.*에서 u'...'는 유니코드 문자열을 나타내고 '...'는 바이트 문자열을 나타냅니다.

앞서 설명한 것처럼 "r" 접두사는 원시 문자열 리터럴을 나타냅니다. 백슬래시를 문자 그대로 유지하므로 정규식이나 기본 Windows 파일 경로를 처리할 때 유용합니다. Python 2.*에서는 r'...' 및 r'''...''' 모두 바이트 문자열을 생성합니다.

"ur" 접두사는 "u"와 "r"의 기능을 결합합니다. , 원시 유니코드 문자열 리터럴이 생성됩니다. 원시 유니코드 문자열은 유니코드 문자가 포함된 파일 경로로 작업할 때 특히 유용합니다.

문자열 유형 간 변환

Python 2.*에서는 바이트 문자열과 유니코드 문자열이 구분됩니다. 유니코드 문자열을 바이트 문자열로 변환하려면 .encode() 메서드를 사용할 수 있습니다. 바이트 문자열을 유니코드 문자열로 변환하려면 .decode() 메서드를 사용할 수 있습니다.

인코딩 및 문자열 접두사

Python 2.*에서는 문자열의 인코딩이 결정됩니다. 원시 바이트 데이터를 디코딩하는 데(문자열을 생성할 때) 또는 유니코드 데이터를 인코딩하는 데(문자열을 생성할 때) 사용되는 코덱에 의해 결정됩니다. "u" 접두사는 결과 유니코드 문자열의 인코딩에 영향을 주지 않습니다.

Python 3.*에서 문자열은 기본적으로 유니코드이며 "u" 접두사는 더 이상 필요하지 않습니다. 또한 백슬래시는 원시 문자열에서 이스케이프 시퀀스로 처리되지 않으므로 정규식에는 원시 문자열 리터럴이 필요하지 않습니다.

위 내용은 Python 문자열 접두사 'u', 'r' 및 'ur'의 차이점은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.