Python クローラーはどのようにしてspanとspanの間のコンテンツをクロールし、それぞれを辞書に保存しますか?
phpcn_u1582
phpcn_u1582 2017-05-18 10:52:42
0
5
2142

ハウス プロファイルを個別にキャプチャし、独立した列としてディクショナリに保存したいと考えていますが、for ループを使用してインライン要素を直接抽出する方法はありません。
これは私のコードです:

リーリー

これは Web ページの HTML コードです:

リーリー
phpcn_u1582
phpcn_u1582

全員に返信(5)
曾经蜡笔没有小新

実際には、これにはパターンがあることがわかります。私がデモを書きました。 リーリー

get_text() を通じてすべての内部コンテンツを取得し、スペースを削除します。後で分割する場合は、split を使用できます。残りは書きません。

ご質問がございましたら、お気軽にお問い合わせください。

いいねを押す +0
给我你的怀抱

このHTMLコードの書き方が間違っているような気がします。ラベルの内容テキストがラベルの外にあります

正しいラベルの内容は 2 つだけです:

  • ハウス概要:

  • 46m²

いいねを押す +0
巴扎黑

内部テキスト

いいねを押す +0
滿天的星座

あなたの場合、すべてのテンプレートがこのように固定されている場合、forループと正規表現を使用するのが最も便利だと思います

いいねを押す +0
黄舟

pyquery吧

pyqueryからQとしてPyQueryをインポート

Q(テキスト).find('.house-info li').text()

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート