저는 다음 작업에 대한 올바른 정규식을 얻으려고 한동안 어려움을 겪었습니다.
파이썬을 사용하여 html 파일의 테이블 태그에서 데이터를 제거하고 싶습니다. 이에 대한 나의 접근 방식은 다음을 재귀적으로 수행하는 것입니다(태그 사이의 HTML 줄을 문자열로 저장).
s = "
s = re.sub('<{1}(은 '<' 也不是 '>'이 아닙니다).*>{1}', '', s)
제 질문은 괄호 안의 굵은 부분을 어떻게 구현하는지 입니다. 감사해요. 문자
해봤는데
으아아아내 테스트 문자열이 동일하게 유지되는 것을 볼 수 있습니다. 내가 뭘 잘못했나요?
내가 기대하는 위의 코드는 나에게 다음을 제공합니다. test_str = "Hello", 이 메서드에 다시 입력하고 ""을 추출하여 "Hello"를 제공합니다.
문자 클래스를 무효화하려면
으아악^
放在[
之后。此外,您不需要为出现一次的字符指定{1}
를 바꾸세요.그러나 HTML에서 데이터를 가져오려면 정규식 대신 BeautifulSoup과 같은 전용 HTML 파서를 사용하는 것이 더 적절하다는 점을 참고하세요.