So verweigern Sie Suchmaschinen die Aufnahme einer Website: Sie können Inhalt [<meta name="robots" content="noarchive">] im Head-Tag hinzufügen, um zu verhindern, dass Suchmaschinen die Website crawlen Anzeigen von Webseiten-Schnappschüssen.
Nachdem eine neue Website erstellt wurde, ist die Suchmaschine sehr wahrscheinlich, solange der von Suchmaschinen-Spidern gecrawlte Inhalt der Website nicht sehr schlecht ist Wenn Sie aus irgendeinem Grund nicht möchten, dass Suchmaschinen Ihre Website einbinden, was sollten Sie tun? Der folgende Artikel wird es Ihnen erklären.
Methode 1: robots.txt-Methode festlegen
Mit robots.txt können Sie Suchmaschinen-Spider blockieren. Was ist also robots.txt?
Suchmaschinen verwenden Spider-Programme, um automatisch auf Webseiten im Internet zuzugreifen und Webseiteninformationen abzurufen. Wenn ein Spider eine Website besucht, prüft er zunächst, ob sich unter der Stammdomäne der Website eine Nur-Text-Datei namens robots.txt befindet. Diese Datei wird verwendet, um den Crawling-Bereich des Spiders auf Ihrer Website anzugeben. Sie können eine robots.txt-Datei in Ihrer Website erstellen und in der Datei die Teile der Website angeben, die Suchmaschinen nicht einbeziehen sollen, oder festlegen, dass Suchmaschinen nur bestimmte Teile einbeziehen.
Bitte beachten Sie, dass Sie nur dann eine robots.txt-Datei verwenden müssen, wenn Ihre Website Inhalte enthält, die von Suchmaschinen nicht indiziert werden sollen. Wenn Sie möchten, dass Suchmaschinen den gesamten Inhalt Ihrer Website einbeziehen, erstellen Sie keine robots.txt-Datei.
Wie verwende ich robots.txt, um Suchmaschinen-Spider zu blockieren?
Suchmaschinen entsprechen standardmäßig dem robots.txt-Protokoll und platzieren Sie diese im Stammverzeichnis der Website:
User-agent: * Disallow: /
Durch den obigen Code können Sie Suchmaschinen mitteilen, dass sie diese Website nicht crawlen oder einbinden sollen. Seien Sie bei der Verwendung des obigen Codes vorsichtig: Dadurch wird allen Suchmaschinen der Zugriff auf Teile der Website verwehrt.
Wenn Sie Baidu nur die Einbeziehung der gesamten Website verbieten möchten, können Sie den folgenden Code bearbeiten:
User-agent: Baiduspider Disallow: /
Wenn Sie Google nur die Einbeziehung der gesamten Website verbieten möchten, können Sie den folgenden Code bearbeiten Folgender Code:
User-agent: Googlebot Disallow: /
Methode 2: Legen Sie die Webseiten-Code-Methode fest
Fügen Sie den folgenden Code zwischen dem Code
;/head> auf der Startseite der Website, um das Crawlen durch Suchmaschinen zu verhindern. Nehmen Sie die Website auf und zeigen Sie einen Schnappschuss der Webseite an.<meta name="robots" content="noarchive">
Fügen Sie den folgenden Code zwischen den Codes
und hinzu, um zu verhindern, dass die Baidu-Suchmaschine die Website crawlt und Webseiten-Snapshots anzeigt.<meta name="Baiduspider" content="noarchive">
Fügen Sie den folgenden Code zwischen den Codes
auf der Startseite der Website hinzu, um zu verhindern, dass Google-Suchmaschinen die Website crawlen und Webseiten-Snapshots anzeigen.<meta name="googlebot" content="noarchive">
Das obige ist der detaillierte Inhalt vonSo verweigern Sie Suchmaschinen die Aufnahme einer Website. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!