BeautifulSoup はすべてのデータを取り込みますが、.findAll() は 1 つの親へのリンクのみを返します

Question

Python で BeautifulSoup を使用して Web サイトをスクレイピングしようとしています。アクセスしようとしたすべてのリンクを含む、すべてのデータが取り込まれます。ただし、.findAll() 関数を使用すると、探しているリンクの一部しか返されません。つまり、次の xpath 内のリンク /html/body/div[1]/div/div[2]/div/div[2]/div[1] のみが返され、リンク /html は無視されます。 /body/div in [1]/div/div[2]/div/di

P粉553428780 · Answer

ページに表示されるデータは、要素に Json として保存されます。これを解析するには、次の例を使用できます:

リーリー

印刷:

リーリー