이 튜토리얼에서는 jQuery 라이브러리를 사용할 때 PyQuery
객체를 보면 $ () 로 얻는 것과 유사합니다. 선택한 요소의 html 컨텐츠를 얻거나 설정할 수있는 Pyquery의 HTML () 메소드와 마찬가지로, 현재 웹 페이지 객체는 전체 문서를 대표하기 때문에 전체 페이지의 마크 업을 반환한다고 말하면 첫 번째 웹 페이지의 마크 업을 반환하고 싶다고 가정 해 봅시다. 예는 다음과 같습니다.
pyquery를 사용한 속성 조작
print(webpage.html())<br><br>'''<br><head><br><meta charset="utf-8"/><br><title>A Simple Webpage</title><br><meta name="viewport" content="width=device-width, initial-scale=1"/><br></head><br><br><body><br> <p>Hello <b>world</b>! This is a basic webpage.</p><br> <p>Here is a list of some <i>random</i> words:</p><br> <ul ><br> <li>Impedimenta</li><br> <li>Decompensation</li><br> <li>Tergiversation</li><br> <li>Transcendentalism</li><br> <li>Polyphiloprogenitive</li><br> </ul><br></body><br>'''<br>
pyquery는 가능한 한 jQuery API를 가깝게 반영하려고한다. 이것은 목록에서
print(webpage("p").html())<br><br>'''<br>Hello <b>world</b>! This is a basic webpage.<br>'''<br>
샘플 HTML 문서에 단어 목록이 포함되어 있음을 기억할 수 있습니다. 단어 목록을 확장 할 수 있습니까? 물론 우리는 할 수 있습니다. prepend () 메소드는 전달 된 값을 호출 노드로 선불로 만듭니다. 예를 들어 예를 들면 다음과 같습니다. print(webpage.html())<br><br>'''<br><head><br><meta charset="utf-8"/><br><title>A Simple Webpage</title><br><meta name="viewport" content="width=device-width, initial-scale=1"/><br></head><br><br><body><br> <p>Hello <b>world</b>! This is a basic webpage.</p><br> <p>Here is a list of some <i>random</i> words:</p><br> <ul ><br> <li>Impedimenta</li><br> <li>Decompensation</li><br> <li>Tergiversation</li><br> <li>Transcendentalism</li><br> <li>Polyphiloprogenitive</li><br> </ul><br></body><br>'''<br>
웹 페이지에서 컨텐츠 추출
튜토리얼의 시작 부분에서 PyQuery가 문자열, 파일 또는 URL 또는 URL과 같은 여러 소스에서 입력을 수락 할 수 있다고 말했을 때 기억하십니까? 웹 페이지에는 Python에 대한 많은 정보가 포함되어 있습니다. 우리는 소비를 위해 그 중 일부를 추출하려고 노력할 것입니다. h2 <p> 레벨 제목을 모두 간단하게 유지하기 위해 레벨 제목을 얻을 수 있는지 살펴 보겠습니다. </p>
믿거 나 말거나, 제목 텍스트를 얻으려면 5 줄의 코드 만 있으면됩니다. print(webpage("p").html())<br><br>'''<br>Hello <b>world</b>! This is a basic webpage.<br>'''<br>를 사용했음을 알 수 있습니다. 이것은 단순히 를 사용하면 주요 콘텐츠의 일부가 아닌 추가 제목을 제공했기 때문입니다. 또한 정보를 추출하는 데 사용할 적절한 선택기를 결정하기 전에 비슷한 웹 페이지를 직접 수행해야합니다. 이미 이미지를 다운로드하기 위해 모듈을 사용한 Python의 요청 모듈에 대한 자습서를 이미 작성했습니다. 내가 포함한 예제의 한 가지 제한은 우리가 이미지의 경로를 하드 코딩하고 있다는 것이었다. Pyquery 라이브러리를 사용하여 웹 페이지에서 이미지 경로를 추출한 다음 요청 모듈로 공급하여 다운로드합시다. 이 예제에서는 미국에 대한 Wikipedia 페이지를 사용할 것입니다.
UI 아이콘 등의 이미지를 다운로드하고 싶지 않기 때문에보다 구체적인 선택기를 사용하여 이미지를 추출합니다. 이미지 파일 이름을 /from pyquery import PyQuery as pq<br><br>webpage = pq(filename = 'document.html')<br><br>print(webpage("p").html())<br>'''<br>Hello <b>world</b>! This is a basic webpage.<br>'''<br><br>webpage("p").html("Hello <b>world</b>! I have changed this paragraph.")<br><br>print(webpage("p").html())<br>'''<br>Hello <b>world</b>! I have changed this paragraph.<br>'''<br>
PyQuery
이 라이브러리 사용에 대한 자세한 정보는 공식 문서를 읽는 것이 좋습니다.
위 내용은 Pyquery : Python ' s jQuery의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!