robot.txt_html/css_WEB-ITnose

Jun 24, 2016 am 11:53 AM

中国では、Web サイト管理者は robots.txt にあまり注意を払っていないようですが、ロボット .txt なしでは実現できない機能もあるので、今日石家荘 SEO はこの記事を通じて robots.txt の書き方について簡単に説明したいと思います。 ? 部分を使用するか、検索エンジンに指定されたコンテンツのみが含まれるように指定します。

検索ロボット (検索スパイダーと呼ばれる場合もあります) がサイトにアクセスすると、

robots.txt の基本入門

robots.txt は、Web サイト管理者が次の部分を宣言できるプレーン テキスト ファイルです。ロボットにアクセスさせたくない Web サイトを指定するか、検索エンジンに指定したコンテンツのみを含めるように指定します。

検索ロボット (検索スパイダーと呼ばれる場合もあります) がサイトを訪問すると、まずサイトのルート ディレクトリに robots.txt が存在するかどうかを確認し、存在する場合はその内容に従って判断します。ファイルのアクセス範囲。ファイルが存在しない場合、検索ロボットはリンクに沿ってクロールします。

さらに、robots.txt はサイトのルート ディレクトリに配置する必要があり、ファイル名はすべて小文字にする必要があります。

robots.txt の記述構文

まず、robots.txt の例を見てみましょう: http://www.shijiazhuangseo.com.cn/robots.txt

上記の特定のアドレスにアクセスしてください。 robots.txt の特定のコンテンツは次のように参照できます:

# http://www.shijiazhuangseo.com.cn の Robots.txt ファイル

# すべてのロボットがドメインをスパイダーします

ユーザー エージェント: *

禁止:

上記のテキストは、すべての検索ロボットが www.shijiazhuangseo.com..cn サイト内のすべてのファイルにアクセスできることを意味します。

# に続くテキストは説明情報です。User-agent: の後には検索ロボットの名前が続き、その後に * が続く場合は、通常、すべての検索ロボットを指します。アクセスが許可されていないファイル ディレクトリによって。

以下に、robots.txt の具体的な用途をいくつかリストします:

すべてのロボットにアクセスを許可する

ユーザーエージェント: *

許可しない:

または、空のファイルを作成できる"/robots.txt" ファイル

すべての検索エンジンがサイトのどの部分にもアクセスできないようにします

ユーザーエージェント: *

Disallow: /

すべての検索エンジンがサイトのいくつかの部分にアクセスすることを禁止しますサイト (下記) 例では 01、02、03 ディレクトリ)

User-agent: *

Disallow: /01/

Disallow: /02/

Disallow: /03/

Ban特定の検索エンジンからのアクセス (以下の例では BadBot)

User-agent: BadBot

Disallow: /

特定の検索エンジンからのアクセスのみを許可 (以下の例では Crawler)

User-エージェント: ler

Disallow:

User-agent: *

Disallow: /

さらに、説明を拡張してロボットのメタについていくつかの紹介をする必要があると思います:

Robots METAタグ 主に各特定のページを対象としています。他の META タグ (使用言語、ページの説明、キーワードなど) と同様に、ロボットの META タグもページの

に配置され、特に検索エンジン ROBOTS に次の操作を指示するために使用されます。ページをクロールします。

ロボット META タグの書き込み:

Robots META タグでは大文字と小文字の区別はありません。name="Robots" はすべての検索エンジンを意味します。特定の検索エンジンに対して name="BaiduSpider" と記述することができます。コンテンツ部分には、index、noindex、follow、nofollow の 4 つのコマンド オプションがあり、コマンドは「,」で区切られます。

INDEX 命令は、検索ロボットにページをクロールするように指示します。

FOLLOW 命令は、検索ロボットがページ上のリンクに沿ってクロールを続けることができることを示します

ロボット メタのデフォルト値タグは、デフォルト値が INDEX,NOFOLLOW であるインクトミを除き、INDEX と FOLLOW です。

このように、以下の 4 つの組み合わせがあります。

<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">

<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">

<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">

<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">

どこ

<META NAME="ROBOTS " CONTENT = "INDEX,FOLLOW">は<META NAME="ROBOTS" CONTENT="ALL">と書くことができます

<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">は<META>と書くことができますNAME="ROBOTS" CONTENT="NONE">

現時点では、検索エンジンのロボットの大多数が robots.txt のルールに準拠しているようです。 Robots META タグに関しては、現在サポートされているものは多くありません。有名な検索エンジンである GOOGLE はこれを完全にサポートしており、GOOGLE が Web ページのスナップショットを保持するかどうかを制限できるコマンド「archive」も追加しています。例:

は、サイト内のページをクロールし、ページ内のリンクに沿ってクロールすることを意味しますが、サイト上にページを保持することはありません。 GOOLGE Web ページのスナップショット。

上記は、robots.txt を記述するための Shijiazhuang SEO の構文です

まず、robots.txt の例を見てみましょう: http://www.shijiazhuangseo.com.cn/robots.txt

上記にアクセスしてください特定のアドレスを使用すると、次のように robots.txt の特定の内容を確認できます:

# http://www.shijiazhuangseo.com.cn# の Robots.txt ファイル # すべてのロボットがドメインをスパイダーします

User-エージェント: *

禁止:

上記のテキストは、すべての検索ロボットが www.shijiazhuangseo.com.cn サイト内のすべてのファイルにアクセスできることを意味します。

# に続くテキストは説明情報です。User-agent: の後には検索ロボットの名前が続き、その後に * が続く場合は、通常、すべての検索ロボットを指します。アクセスが許可されていないファイル ディレクトリによって。

以下に、robots.txt の具体的な用途をいくつかリストします:

すべてのロボットにアクセスを許可する

ユーザーエージェント: *

許可しない:

または、空のファイルを作成できる"/robots.txt" ファイル

すべての検索エンジンがサイトのどの部分にもアクセスできないようにします

ユーザーエージェント: *

Disallow: /

すべての検索エンジンがサイトのいくつかの部分にアクセスすることを禁止しますサイト (下記) 例では 01、02、03 ディレクトリ)

User-agent: *

Disallow: /01/

Disallow: /02/

Disallow: /03/

Ban特定の検索エンジンへのアクセス (以下の例では BadBot)

ユーザーエージェント: BadBot

禁止: /

特定の検索エンジンへのアクセスのみを許可します (以下の例ではクローラー)

ユーザーエージェント: クローラー

許可しない:

ユーザーエージェント: *

許可しない: /

さらに、説明を拡張してロボット メタについていくつか紹介する必要があると思います:

Robots META タグは主に特定のページ用です。他の META タグ (使用言語、ページの説明、キーワードなど) と同様に、ロボットの META タグもページの

に配置され、特に検索エンジン ROBOTS に次の操作を指示するために使用されます。ページをクロールします。

Robots META タグの書き方:

Robots META タグでは大文字と小文字の区別はありません。name="Robots" はすべての検索エンジンを意味し、特定の検索に対して name="BaiduSpider" と記述することができます。エンジン。コンテンツ部分には、index、noindex、follow、nofollow の 4 つのコマンド オプションがあり、コマンドは「,」で区切られます。

INDEX 命令は、検索ロボットにページをクロールするように指示します。

FOLLOW 命令は、検索ロボットがページ上のリンクに沿ってクロールを続けることができることを示します

ロボット メタのデフォルト値タグは、デフォルト値が INDEX,NOFOLLOW であるインクトミを除き、INDEX と FOLLOW です。

このように、以下の 4 つの組み合わせがあります。

<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">

<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">

<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">

<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">

どこ

<META NAME="ROBOTS " CONTENT = "INDEX,FOLLOW">は<META NAME="ROBOTS" CONTENT="ALL">と書くことができます

<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">は<META>と書くことができますNAME="ROBOTS" CONTENT="NONE">

現時点では、検索エンジンのロボットの大多数が robots.txt のルールに準拠しているようです。 Robots META タグに関しては、現在サポートされているものは多くありません。有名な検索エンジンである GOOGLE はこれを完全にサポートしており、GOOGLE が Web ページのスナップショットを保持するかどうかを制限できるコマンド「archive」も追加しています。例:

は、サイト内のページをクロールし、ページ内のリンクに沿ってクロールすることを意味しますが、サイト上にページを保持することはありません。 GOOLGE Web ページのスナップショット。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

< Progress>の目的は何ですか 要素? < Progress>の目的は何ですか 要素? Mar 21, 2025 pm 12:34 PM

この記事では、HTML< Progress>について説明します。要素、その目的、スタイリング、および< meter>との違い要素。主な焦点は、< Progress>を使用することです。タスクの完了と< Meter> statiの場合

< datalist>の目的は何ですか 要素? < datalist>の目的は何ですか 要素? Mar 21, 2025 pm 12:33 PM

この記事では、HTML< Datalist>について説明します。オートコンプリートの提案を提供し、ユーザーエクスペリエンスの改善、エラーの削減によりフォームを強化する要素。

< meter>の目的は何ですか 要素? < meter>の目的は何ですか 要素? Mar 21, 2025 pm 12:35 PM

この記事では、html< meter>について説明します。要素は、範囲内でスカラーまたは分数値を表示するために使用され、Web開発におけるその一般的なアプリケーション。それは差別化< Meter> < Progress>およびex

HTMLは初心者のために簡単に学ぶことができますか? HTMLは初心者のために簡単に学ぶことができますか? Apr 07, 2025 am 12:11 AM

HTMLは、簡単に学習しやすく、結果をすばやく見ることができるため、初心者に適しています。 1)HTMLの学習曲線はスムーズで簡単に開始できます。 2)基本タグをマスターして、Webページの作成を開始します。 3)柔軟性が高く、CSSおよびJavaScriptと組み合わせて使用​​できます。 4)豊富な学習リソースと最新のツールは、学習プロセスをサポートしています。

ビューポートメタタグとは何ですか?レスポンシブデザインにとってなぜそれが重要なのですか? ビューポートメタタグとは何ですか?レスポンシブデザインにとってなぜそれが重要なのですか? Mar 20, 2025 pm 05:56 PM

この記事では、モバイルデバイスのレスポンシブWebデザインに不可欠なViewportメタタグについて説明します。適切な使用により、最適なコンテンツのスケーリングとユーザーの相互作用が保証され、誤用が設計とアクセシビリティの問題につながる可能性があることを説明しています。

< iframe>の目的は何ですか タグ?使用する際のセキュリティ上の考慮事項は何ですか? < iframe>の目的は何ですか タグ?使用する際のセキュリティ上の考慮事項は何ですか? Mar 20, 2025 pm 06:05 PM

この記事では、< iframe>外部コンテンツをWebページ、その一般的な用途、セキュリティリスク、およびオブジェクトタグやAPIなどの代替案に埋め込む際のタグの目的。

HTML、CSS、およびJavaScriptの役割:コアの責任 HTML、CSS、およびJavaScriptの役割:コアの責任 Apr 08, 2025 pm 07:05 PM

HTMLはWeb構造を定義し、CSSはスタイルとレイアウトを担当し、JavaScriptは動的な相互作用を提供します。 3人はWeb開発で職務を遂行し、共同でカラフルなWebサイトを構築します。

HTMLでの開始タグの例は何ですか? HTMLでの開始タグの例は何ですか? Apr 06, 2025 am 12:04 AM

Anexampleapalofastartingtaginhtmlis、それはaperginsaparagraph.startingtagsaresentionentientiontheyinitiateelements、definetheirtypes、およびarecrucialforurturingwebpagesandcontingthomedomを構築します。

See all articles