JavaScript は、直感的でダイナミックかつインタラクティブなオンライン エクスペリエンスをユーザーに提供します。従来の HTML ページをスクレイピングする場合、すべてがシンプルでプロセスは高速です。 Googlebot は、HTML ファイルをダウンロードしてソース コードへのリンクを抽出した後、同時にアクセスする可能性があります。 CSS ファイルがダウンロードされると、ページは Google のインデクサーによってインデックス付けされ、ダウンロードされたすべてのリソースも受け取ります。
主に JavaScript を使用する Web サイトをクロールする場合、問題が発生します。 Googlebot は HTML ファイルをダウンロードします。
ソース コード内のリンクは JavaScript の実行後にのみ挿入されるため、Googlebot はソース コードを確認できません。
次に、CSS ファイルと JS ファイルをダウンロードします。 Googlebot は、JavaScript を解析、構築、実行するために Google Web レンダリング サービスを使用する必要があります。
WRS は、データベースまたは他の API からデータを取得します。
Indexer はマテリアルにインデックスを付けることができます。 Googlebot は、新たに見つかったリンクをキューに追加して、さらにクロールすることができます。
これには Web ページのレンダリングが含まれます。 HTML、CSS、および JavaScript コードを、訪問者がリンクをクリックしたときに表示されることを期待するインタラクティブな Web ページに変換するプロセスは、Web ページのレンダリングと呼ばれます。ウェブサイトのすべてのページは、ユーザーを念頭に置いて作成されています。
JavaScript ファイルの解析、構築、実行には、ユーザーと Google の両方にとって多くの時間がかかります。 Google では、サイトが完全に生成されるまで、大量の JavaScript を含むページのコンテンツをインデックスに登録できないことがよくあります。
レンダリング プロセス中にすべてが遅くなるわけではありません。新しいつながりを見つける方法についても説明します。 Google は、ページを生成する前に、JavaScript が豊富な Web サイト ページ上のリンクを見つけることができないことがよくあります。 JavaScript は、使用する前にビルドする必要があるコンピュータ言語です。JavaScript の特定のバージョンと互換性のない構文があると、ビルドが失敗します。
最新の Chrome バージョンは Googlebot のベースです。これは、Googlebot がサイトの表示に最新バージョンのブラウザを使用していることを示しています。 Googlebot は、人間がブラウザを使用するのと同じ方法で Web サイトを閲覧します。ただし、Googlebot は標準の Chrome ブラウザではありません。 Googlebot はユーザー認証リクエストを拒否します (つまり、Googlebot はビデオ自動再生リクエストを拒否します)。クロスページロード、 Cookie、ローカル ストレージ、セッション ストレージは削除されます。コンテンツが Cookie またはその他のローカルに保存された情報に依存している場合、Google はコンテンツをインデックスに登録しません。 Googlebot はすべてのリソースをダウンロードしないことを決定する場合がありますが、ブラウザは常にダウンロードします。
Google は、JS を使用して行われた正規のタグ変更は信頼できないと考えています。したがって、正規 URL が JS 形式ではなく HTML 形式であることを確認してください。 Google がこの問題を解決した可能性はありますが、確実にわかるまでは SEO の危険を冒すべきではありません。
Google は JavaScript についてよく知っています。ただし、JavaScript は、クローラーが世界中の何十億もの Web サイトを理解してランク付けしようとするため、単純な HTML よりも多くの作業を必要とします。時にはこれに悩まされることもあります。
Google は、Googlebot が JavaScript を使用して 2 段階で Web サイトをクロールすると主張しています。クローラーは初期スキャン中に HTML を検査し、それを使用してサイトのインデックスを作成します。必要な JavaScript を表示するために後で戻ってきます。ただし、HTML でタグ付けされたマテリアルは、サーバー側レンダリングを使用して作成された Web サイトに表示されます。メイン コンテンツはすでに表示されているため、Googlebot はコンテンツを適切にインデックスするためにページに JavaScript をレンダリングするためにサイトに再度アクセスする必要はありません。これにより、JavaScript SEO 手法が大幅に改善されます。
サイトの最初の表示と 2 回目の表示の間には時間差があるため、JavaScript に含まれるコンテンツはすぐにインデックス付けされません。したがって、これらの資料は初期ランキングを決定する際には考慮されず、Google が変更に気づき、結果を更新するまでに時間がかかる場合があります。
したがって、JavaScript SEO を採用している企業は、Web サイトの HTML にできるだけ多くの重要な要素を含めるようにする必要があります。クローラーがすぐに理解できるように重要な情報を記述する必要があります (この情報をランキングにカウントしたい場合)。
JavaScript は、Googlebot がサイトを再度表示するまでレンダリングされません。その結果、一部の Web サイトでは、Google によるサイトの最初のスキャン中に読み込まれた HTML に「インデックスなし」タグなどのタグが誤って追加されてしまいます。このタグにより、Googlebot がサイトに再度アクセスして JavaScript を実行できなくなり、サイトのインデックスが正しく作成されなくなる可能性があります。
###結論は###以上が検索エンジンは JavaScript のインデックスを作成できますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。