pcconfig.ru
robots.txt

Robots Exclusion Standard data for pcconfig.ru

Resource Scan

Scan Details

Site Domain pcconfig.ru
Base Domain pcconfig.ru
Scan Status Ok
Last Scan2024-11-04T08:12:54+00:00
Next Scan 2024-11-11T08:12:54+00:00

Last Scan

Scanned2024-11-04T08:12:54+00:00
URL https://pcconfig.ru/robots.txt
Domain IPs 185.219.40.195
Response IP 185.219.40.195
Found Yes
Hash 336f1c20ff31e69d3a2ba932ed53d711dbb7952ae27f95e9ef416145862b6386
SimHash ec38996d893c

Groups

*

Product Comment
* Создаем секцию правил для роботов. * значит для всеÑ
Rule Path Comment
Disallow /cgi-bin Стандартная папка на Ñ
Disallow /wp-admin/ Закрываем админку.
Disallow /? Все параметры запроса на главной.
Disallow *?s= Поиск.
Disallow *%26s%3D Поиск.
Disallow /search Поиск.
Disallow /author/ АрÑ
Disallow */embed Все встраивания.
Disallow */page/ Все виды пагинации.
Disallow */xmlrpc.php Файл WordPress API
Disallow *utm*%3D Ссылки с utm-метками
Disallow *openstat%3D Ссылки с метками openstat

Other Records

Field Value
sitemap https://pcconfig.ru/sitemap_index.xml

Comments

  • роботов. Чтобы указать секцию правил для отдельного
  • робота, вместо * укажите его имя: GoogleBot, Yandex.
  • Одина или несколько ссылок на карту сайта (файл Sitemap). Это независимая
  • директива и дублировать её для каждого User-agent не нужно. Так например
  • Google XML Sitemap создает 2 карты сайта:

Warnings

  • 2 invalid lines.