卒業制作のテーマは、統計に基づいて Web ページのテキスト情報を抽出することです。そのため、一般的な Web ページがどのようなコンポーネントにテキスト情報を配置しているかを知る必要があります。これはとにかく体の中にあります
はは
はは
テーブルは以前は、Web ページを作成する場合、テキストを配置するためにテーブルを使用するのが一般的でしたが、現在では多くの Web サイトが DIV+CSS の形式を使用しているため、テキストはテーブルではなく DIV に配置される場合があります。
データベースに配置することもできるので、更新や保守が簡単です
それは少し曖昧な気がします ..2 つの可能性があります: 1. 表示されるテキストであり、もちろんコンテンツを参照します。
と の間 2. Web ページを構成するすべてのコンテンツです。 の前のコードも同じだと思いますが? Web ページのコンテンツが抽出され、指定されたコンテンツが統計のために検索されるということです... つまり、これは 2 番目のケースになるはずです... 笑はは
通常はテーブルに置かれているという紙を見ました
一般的に、テキスト情報は段落にあります、なぜなら< ;p> は標準の終端ブロック要素です。
現在の Web ページはレイアウトに div CSS を使用しています。
そのため、