Python의 문자열에서 ANSI 이스케이프 시퀀스 제거
Python에서 ANSI 이스케이프 시퀀스는 SSH에서 반환된 문자열로 작업할 때 방해가 될 수 있습니다. 명령. 서식 지정 및 커서 제어에 사용되는 이러한 시퀀스는 문자열의 가독성과 기능을 방해할 수 있습니다. 이 문제를 해결하고 원하는 텍스트를 추출하려면 정규식을 사용하여 솔루션을 탐색해 보겠습니다.
다음 Python 조각은 문자열에서 ANSI 이스케이프 시퀀스를 제거하는 방법을 보여줍니다.
import re # Regex to capture ANSI C1 escape sequences ansi_escape = re.compile(r'\x1B(?:[@-Z\-_]|\[[0-?]*[ -/]*[@-~])') # Replace escape sequences with an empty string result = ansi_escape.sub('', string_with_ansi_sequences)
ansi_escape 정규식은 7비트 및 8비트 C1 ANSI 이스케이프 시퀀스를 모두 대상으로 합니다. 이스케이프 문자(x1B)로 시작하고 그 뒤에 제어 시퀀스(예: [@-Z\-_]) 또는 [에 의해 도입된 제어 시퀀스가 오는 시퀀스를 캡처합니다. 그런 다음 sub() 메서드는 모든 일치 항목을 빈 문자열로 대체하여 이스케이프 시퀀스를 효과적으로 제거합니다.
예를 들어 다음 입력 문자열:
'ls\r\n\x1b[00m\x1b[01;31mexamplefile.zip\x1b[00m\r\n\x1b[01;31m'
은 다음으로 변환됩니다.
'ls\r\nexamplefile.zip\r\n'
이 방법을 사용하면 ANSI 이스케이프 시퀀스를 제거하고 SSH 명령에서 반환된 문자열에서 원하는 텍스트를 검색할 수 있으므로 추출된 텍스트를 사용하지 않고 작업할 수 있습니다. 서식 간섭.
위 내용은 Python의 문자열에서 ANSI 이스케이프 시퀀스를 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!