楽しい Web スクレイピング プロジェクトのために、ttps://www.nhl.com/stats/teams から NHL データを収集したいと考えています。
クリック可能な Excel エクスポート タグがあり、selenium
と bs4
を使用して見つけることができます。
残念ながら、物事はここで終わります:
href
属性がないため、データにアクセスできないようです。
pynput を使用してマウス クリックをシミュレートすることで、目的の結果が得られましたが、知りたいのは次のとおりです:
-> エクスポート アイコン付きのラベルはここにあります:
リーリー
->これは私のコードですああああ
リーリーhref
属性はなく、ダウンロードは JS を通じてトリガーされます。selenium
を使用する場合は、要素を見つけて.click()
を使用してファイルをダウンロードします:ここで
を取得するか、# で終わることによって取得します。 ##styles__ExportIcon
onetrust バナーを処理する必要がある場合があるため、最初にバナーをクリックしてから表をダウンロードしてください。css セレクターを使用します。
直接の子の <a>
で始まるクラスは、それを直接選択します:
リーリー ###例###リーリー