ハウス プロファイルを個別にキャプチャし、独立した列としてディクショナリに保存したいと考えていますが、for ループを使用してインライン要素を直接抽出する方法はありません。 これは私のコードです:
これは Web ページの HTML コードです:
実際には、これにはパターンがあることがわかります。私がデモを書きました。 リーリー
ご質問がございましたら、お気軽にお問い合わせください。
ハウス概要:
46m²
内部テキスト
あなたの場合、すべてのテンプレートがこのように固定されている場合、forループと正規表現を使用するのが最も便利だと思います
pyquery吧
pyqueryからQとしてPyQueryをインポート
Q(テキスト).find('.house-info li').text()
実際には、これにはパターンがあることがわかります。私がデモを書きました。 リーリー
get_text() を通じてすべての内部コンテンツを取得し、スペースを削除します。後で分割する場合は、split を使用できます。残りは書きません。ご質問がございましたら、お気軽にお問い合わせください。
このHTMLコードの書き方が間違っているような気がします。ラベルの内容テキストがラベルの外にあります
正しいラベルの内容は 2 つだけです:
ハウス概要:
46m²
内部テキスト
あなたの場合、すべてのテンプレートがこのように固定されている場合、forループと正規表現を使用するのが最も便利だと思います
pyquery吧
pyqueryからQとしてPyQueryをインポート
Q(テキスト).find('.house-info li').text()