검색 엔진이 웹사이트를 포함하는 것을 거부하는 방법: 헤드 태그 [<meta name="robots" content="noarchive">]에 콘텐츠를 추가하여 검색 엔진이 웹사이트를 크롤링하지 못하도록 할 수 있습니다. 웹사이트 및 웹페이지 스냅샷 표시.
새 홈페이지를 구축한 후, 검색엔진 스파이더가 크롤링하는 홈페이지의 내용이 크게 나쁘지 않은 이상, 그러면 검색 엔진이 우리 웹사이트를 포함할 가능성이 매우 높습니다. 어떤 이유로든 검색 엔진에 우리 웹사이트가 포함되는 것을 원하지 않는 경우 어떻게 해야 합니까? 다음 기사에서는 이에 대해 설명할 것입니다.
방법 1: robots.txt 설정 방법
robots.txt 설정을 사용하여 검색 엔진 스파이더를 차단할 수 있습니다. 로봇이란 무엇입니까? txt?
검색 엔진은 스파이더 프로그램을 사용하여 인터넷상의 웹 페이지에 자동으로 액세스하고 웹 페이지 정보를 얻습니다. 스파이더는 웹사이트를 방문할 때 먼저 웹사이트의 루트 도메인 아래에 robots.txt라는 일반 텍스트 파일이 있는지 확인합니다. 이 파일은 웹사이트에서 스파이더의 크롤링 범위를 지정하는 데 사용됩니다. 웹사이트에서 robots.txt를 생성하고 검색 엔진이 포함하지 않기를 원하는 웹사이트 부분을 파일에 선언하거나 검색 엔진이 특정 부분만 포함하도록 지정할 수 있습니다.
웹사이트에 검색 엔진에서 색인을 생성하고 싶지 않은 콘텐츠가 포함된 경우 robots.txt 파일만 사용해야 한다는 점에 유의하세요. 검색 엔진이 사이트의 모든 콘텐츠를 포함하도록 하려면 robots.txt 파일을 만들지 마세요.
robots.txt를 사용하여 검색 엔진 스파이더를 차단하는 방법은 무엇입니까?
검색 엔진은 기본적으로 robots.txt 프로토콜을 준수합니다. robots.txt 텍스트 파일을 만들고 다음과 같이 코드를 편집합니다. 🎜#
User-agent: * Disallow: /
User-agent: Baiduspider Disallow: /
User-agent: Googlebot Disallow: /
방법 2: 웹 페이지 코드 방법 설정
In 와 사이에 웹사이트 홈페이지 코드를 추가하려면 검색 엔진이 웹사이트를 크롤링하고 웹페이지 스냅샷을 표시하는 것을 방지하려면 다음 코드를 추가하세요.<meta name="robots" content="noarchive">
<meta name="Baiduspider" content="noarchive">
<meta name="googlebot" content="noarchive">
위 내용은 웹사이트를 포함하는 검색 엔진을 거부하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!