cleancitygroup.ru
robots.txt

Robots Exclusion Standard data for cleancitygroup.ru

Resource Scan

Scan Details

Site Domain cleancitygroup.ru
Base Domain cleancitygroup.ru
Scan Status Ok
Last Scan2024-11-09T23:04:53+00:00
Next Scan 2024-11-16T23:04:53+00:00

Last Scan

Scanned2024-11-09T23:04:53+00:00
URL https://cleancitygroup.ru/robots.txt
Domain IPs 91.201.43.178
Response IP 91.201.43.178
Found Yes
Hash ababbd61bf7f771a4c778267c2ad2b40459a4901ba70ad5783d5537f9db6bde0
SimHash 0518d0498731

Groups

*

Rule Path Comment
Disallow /cgi-bin папка на Ñ
Disallow /? все параметры запроса на главной
Disallow /wp- все файлы WP: /wp-json/, /wp-includes, /wp-content/plugins
Disallow /wp/ если есть подкаталог /wp/, где установлена CMS (если нет,
Disallow *?s= поиск
Disallow *%26s%3D поиск
Disallow /search/ поиск
Disallow /author/ арÑ
Disallow /users/ арÑ
Disallow */trackback трекбеки, уведомления в комментарияÑ
Disallow */feed все фиды
Disallow */rss rss фид
Disallow */embed все встраивания
Disallow */wlwmanifest.xml xml-файл манифеста Windows Live Writer (если не используете,
Disallow /readme.html -
Disallow /work.html -
Disallow /pravoobladateljam/ -
Disallow /xmlrpc.php файл WordPress API
Disallow *utm*%3D ссылки с utm-метками
Disallow *openstat%3D ссылки с метками openstat
Allow */uploads открываем папку с файлами uploads

Other Records

Field Value
sitemap https://cleancitygroup.ru/sitemap.xml

Comments

  • правило можно удалить)
  • ссылки на статью
  • правило можно удалить)

Warnings

  • 4 invalid lines.
  • `host` is not a known field.