웹 페이지에서 콘텐츠를 추출하기 위해 정규식을 사용하는 것은 꽤 번거로운 작업입니다. 다음은 HTML 또는 XML 파일에서 데이터를 추출할 수 있는 Python 라이브러리입니다. Beautiful Soup은 사용자가 선호하는 변환기를 통해 사용자 정의 문서 탐색 및 검색을 수행할 수 있습니다. 문서를 수정하세요. Beautiful Soup은 작업 시간을 절약하는 데 도움이 됩니다. Beautiful Soup 4.2.0 문서
특정 애플리케이션은 공식 문서에 명확하게 설명되어 있으므로 여기서는 자세히 다루지 않겠습니다. 설치하면서 겪은 문제에 대해 이야기하겠습니다.
1. python3 설치
공식 웹사이트에서 python3을 다운로드하여 설치하고, Path 변수를 추가한 후 설치된 python.exe의 이름을 python3.exe
2로 변경합니다. pip3
설치: >pip3
문제 프롬프트: 실행기의 치명적인 오류: '"'를 사용하여 프로세스를 생성할 수 없습니다
입력: >python3 -m pip install --upgrade pip
질문 프롬프트: 요구사항이 이미 최신 상태입니다: c:users****appdatalocalprogramspythonpythonpython36-의 pip 32libsite- packages
입력: >python3 -m pip install --upgrade pip --force-reinstall
출력:
입력: >pip3 -V
출력: c:users의 pip 9.0.1 ** **appdatalocalprogramspythonpython36-32libsite-packages (python 3.6)
pip3 설치 완료
3. Install BeautifulSoup4
>pip3 install beautifulsoup4
소스 코드로 설치하려면 BS4 소스 코드를 다운로드하고, 그런 다음 setup.py를 통해 설치합니다.
다운로드한 압축 패키지를 로컬에서 추출하고 다음 명령을 사용하여 Python3 코드로 변환합니다.
2to3.py가 포함된 Python 설치 디렉터리에 Toolsscripts를 입력하고 다음 명령을 사용하여
Python36을 변환합니다. -32Toolsscripts>python 2to3.py -w C:Users****AppDataLocalProgramsPythonPython36-32beautifulsoup4-4.6.0
명령 프롬프트를 사용하여 BS4의 압축이 풀린 디렉터리를 입력하고 설치를 시작합니다:
>python setup.py install
4. 파서 설치:
>pip3 install lxml
>pip3 install html5lib
설치가 완료되었습니다.
인터넷에 BeautifulSoup3 및 Python2 코드가 많이 있습니다. 제공된 데모에 대해 테스트할 때 다양한 문제가 발생할 수 있습니다. 새로운 콘텐츠를 학습할 때 공식 문서를 직접 참조하세요
.위 내용은 Python3+BeautifulSoup4 설치 예제 튜토리얼의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!