Python은 데이터를 크롤링하고 목록을 가져옵니다. 그런데 그 안에 있는 span 태그를 제거하는 방법은 무엇입니까?
我想大声告诉你
我想大声告诉你 2017-05-18 10:55:53
0
3
949

p6ython3.6을 사용하여 일부 데이터를 크롤링했지만 최종적으로 표시되는 것은 범위 태그가 포함된 목록이었습니다. get_text, 내용 등을 사용하면 오류가 보고되었습니다. 왜 이런거야?
반환된 초기 결과는 다음과 같습니다.

으아악

제 코드는 다음과 같습니다:

으아악
我想大声告诉你
我想大声告诉你

모든 응답(3)
仅有的幸福

bs의 API는 잘 기억나지 않습니다. 텍스트를 직접 얻을 수 있는 함수가 있어야 합니다. get_text() 함수여야 합니다. find_all()을 사용하고 있으므로 반환된 결과를 다시 순회해야 합니다. 그게 전부입니다get_text()这个函数吧。由于你用的是find_all(),那么需要再在返回的结果下做一次遍历,就是这样

rs = list()
for data in soup.find("p",{"class":"list-main-eventset-finan"}).find_all("li"):
    contents=data.find("i",{"class":"cell date"}).find_all("span")
    for content in contents:
        rs.append(content.get_text())
  

此外,也可以使用正则表达式来匹配,直接匹配<span>(.*?)< 으아아아 또한 정규 표현식을 사용하여 <span>(.*?)< 패턴과 직접 일치시킬 수도 있습니다. 하지만 위와 같이 콘텐츠 목록을 순회해야 합니다.

phpcn_u1582

질문자는 text_content()방법

을 시도해 볼 수 있습니다.
左手右手慢动作

정규식이나 분할+SUBSTRING도 사용할 수 있으니 유연하게 사용하세요

최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!