the-warsaw.com
robots.txt

Robots Exclusion Standard data for the-warsaw.com

Resource Scan

Scan Details

Site Domain the-warsaw.com
Base Domain the-warsaw.com
Scan Status Ok
Last Scan2024-09-25T23:29:12+00:00
Next Scan 2024-10-02T23:29:12+00:00

Last Scan

Scanned2024-09-25T23:29:12+00:00
URL https://the-warsaw.com/robots.txt
Redirect https://www.the-warsaw.com/robots.txt
Redirect Domain www.the-warsaw.com
Redirect Base the-warsaw.com
Domain IPs 104.26.4.141, 104.26.5.141, 172.67.72.180, 2606:4700:20::681a:48d, 2606:4700:20::681a:58d, 2606:4700:20::ac43:48b4
Redirect IPs 104.26.4.141, 104.26.5.141, 172.67.72.180, 2606:4700:20::681a:48d, 2606:4700:20::681a:58d, 2606:4700:20::ac43:48b4
Response IP 104.26.5.141
Found Yes
Hash 74b4dec84b919712682fcb4cab850443783e181be1db09215a04fa2498e5a60f
SimHash 3608d052ac35

Groups

*

Product Comment
* общие правила для роботов, кроме Яндекса и Google,
Rule Path Comment
Disallow /cgi-bin папка на Ñ
Disallow /? все параметры запроса на главной
Disallow /wp- все файлы WP: /wp-json/, /wp-includes, /wp-content/plugins
Disallow /wp/ если есть подкаталог /wp/, где установлена CMS (если нет,
Disallow *?s= поиск
Disallow *%26s%3D поиск
Disallow /search/ поиск
Disallow /users/ арÑ
Disallow */trackback трекбеки, уведомления в комментарияÑ
Disallow */rss rss фид
Disallow */embed все встраивания
Disallow */wlwmanifest.xml xml-файл манифеста Windows Live Writer (если не используете,
Disallow /xmlrpc.php файл WordPress API
Disallow *utm*%3D ссылки с utm-метками
Disallow *openstat%3D ссылки с метками openstat
Allow */uploads открываем папку с файлами uploads

Other Records

Field Value
crawl-delay 10

googlebot

Product Comment
googlebot правила для Google (комментарии не дублирую)
Rule Path Comment
Disallow /cgi-bin -
Disallow /? -
Disallow /wp- -
Disallow /wp/ -
Disallow *?s= -
Disallow *%26s%3D -
Disallow /search/ -
Disallow /author/ -
Disallow /users/ -
Disallow */trackback -
Disallow */feed -
Disallow */rss -
Disallow */embed -
Disallow */wlwmanifest.xml -
Disallow /xmlrpc.php -
Disallow *utm*%3D -
Disallow *openstat%3D -
Allow */uploads -
Allow /*/*.js открываем js-скрипты внутри /wp- (/*/ - для приоритета)
Allow /*/*.css открываем css-файлы внутри /wp- (/*/ - для приоритета)
Allow /wp-*.png картинки в плагинаÑ
Allow /wp-*.jpg картинки в плагинаÑ
Allow /wp-*.jpeg картинки в плагинаÑ
Allow /wp-*.gif картинки в плагинаÑ
Allow /wp-admin/admin-ajax.php используется плагинами, чтобы не блокировать JS и CSS

yandex

Product Comment
yandex правила для Яндекса (комментарии не дублирую)
Rule Path
Disallow /cgi-bin
Disallow /?
Disallow /wp-
Disallow /wp/
Disallow *?s=
Disallow *%26s%3D
Disallow /search/
Disallow /author/
Disallow /users/
Disallow */trackback
Disallow */feed
Disallow */rss
Disallow */embed
Disallow */wlwmanifest.xml
Disallow /xmlrpc.php
Allow */uploads
Allow /*/*.js
Allow /*/*.css
Allow /wp-*.png
Allow /wp-*.jpg
Allow /wp-*.jpeg
Allow /wp-*.gif
Allow /wp-admin/admin-ajax.php

mj12bot

Rule Path
Disallow /

ahrefsbot

Rule Path
Disallow /

semrushbot

Rule Path
Disallow /

Other Records

Field Value
sitemap https://the-warsaw.com/sitemap.xml
sitemap https://the-warsaw.com/sitemap.xml.gz

Comments

  • т.к. для ниÑ
  • правило можно удалить)
  • ссылки на статью
  • правило можно удалить)
  • от индексирования, а удалять параметры меток,
  • Google такие правила не поддерживает
  • Укажите один или несколько файлов Sitemap (дублировать для каждого User-agent
  • не нужно). Google XML Sitemap создает 2 карты сайта, как в примере ниже.
  • Host прописывать больше не нужно.

Warnings

  • 8 invalid lines.
  • `clean-param` is not a known field.