Python 문자열에서 ANSI 이스케이프 시퀀스를 제거하는 방법은 무엇입니까?

Barbara Streisand
풀어 주다: 2024-11-23 08:47:11
원래의
426명이 탐색했습니다.

How to Remove ANSI Escape Sequences from Python Strings?

Python 문자열에서 ANSI 이스케이프 시퀀스 제거

많은 명령줄 도구와 SSH 애플리케이션은 터미널 동작을 제어하기 위해 출력에 ANSI 이스케이프 시퀀스를 추가합니다. 시각적 표현을 향상시킵니다. 그러나 시각적 신호 없이 문자열 내용을 구문 분석하거나 처리하려는 경우 이러한 시퀀스는 번거로울 수 있습니다. 이 문서에서는 이러한 이스케이프 시퀀스를 제거하고 일반 텍스트 콘텐츠를 추출하는 Python 방식을 살펴봅니다.

문제:

SSH 명령에서 검색된 다음 예제 문자열을 고려하세요.

'ls\r\n\x1b[00m\x1b[01;31mexamplefile.zip\x1b[00m\r\n\x1b[01;31m'
로그인 후 복사

목표는 프로그래밍 방식으로 ANSI 이스케이프 시퀀스를 제거하고 일반 텍스트만 남기는 것입니다. 내용:

'examplefile.zip'
로그인 후 복사

해결책:

Python의 정규 표현식 모듈은 이 문제에 대한 간결한 해결책을 제공합니다. 다음 정규식은 모든 ANSI 이스케이프 시퀀스를 효과적으로 캡처하고 제거합니다.

import re

ansi_escape = re.compile(r'''
    \x1B  # ESC
    (?:   # 7-bit C1 Fe (except CSI)
        [@-Z\-_]
    |     # or [ for CSI, followed by a control sequence
        \[
        [0-?]*  # Parameter bytes
        [ -/]*  # Intermediate bytes
        [@-~]   # Final byte
    )
''', re.VERBOSE)
로그인 후 복사

정규식을 적용하고 원하는 텍스트를 추출하려면:

import re

ansi_escape = re.compile(r'\x1B(?:[@-Z\-_]|\[[0-?]*[ -/]*[@-~])')
sometext = 'ls\r\n\x1b[00m\x1b[01;31mexamplefile.zip\x1b[00m\r\n\x1b[01;31m'
result = ansi_escape.sub('', sometext)
로그인 후 복사

출력:

'ls\r\nexamplefile.zip\r\n'
로그인 후 복사

위 내용은 Python 문자열에서 ANSI 이스케이프 시퀀스를 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿