Python - Web ページのコンテンツを取得する beautifulsoup に関する問題
習慣沉默
習慣沉默 2017-05-27 17:39:42
0
6
664
リーリー

Python コード:

リーリー

しかし、返された結果は空です。このセレクターの書き方が間違っているのでしょうか?

習慣沉默
習慣沉默

全員に返信(6)
某草草

リーリー

https://www.crummy.com/softwa...

いいねを押す +0
阿神

https://www.crummy.com/softwa... の説明を参照してください。正しい使用方法は次のとおりです:
neirong=soup.find('p',class_='talk-article__body talk-transcript__body')

ただp包含的内容,进一步调用neirong.contentsを手に入れるために

いいねを押す +0
刘奇

リーリー

いいねを押す +0
刘奇

ブラウザから見ている内容はjsで動的に生成されており、bsとのマッチングが出来ないのですが、見たところ変なクラス名は基本的にjsで生成されていることが分かりました

いいねを押す +0
给我你的怀抱

find_all を使用します。find はクラスには使用できません

いいねを押す +0
曾经蜡笔没有小新
  • 個人的には、BeautifulSoup を使用して Web ページを解析するときに、作成者が要素の配置に CSS 機能を使用する場合は、このメソッドでクラスの値をパラメータまたはタグとして使用するのが最善です。属性はパラメーターとして使用でき、非常に便利です。同時に、パラメーターは次のような CSS セレクター文字列をサポートします。クラス a.タイトル").

  • soup.find() メソッドは現在ではあまり使われていないようですが、BeautifulSoup4 では非推奨になっているのでしょうか。一般に、find が表示される限り、それは find_all() およびその他のメソッドです。
    上記の詳細については、「Super Soup」の中国語ドキュメントを参照してください: http://Beautifulsoup.readthed...

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート