agilest.org
robots.txt

Robots Exclusion Standard data for agilest.org

Resource Scan

Scan Details

Site Domain agilest.org
Base Domain agilest.org
Scan Status Ok
Last Scan2025-11-04T04:22:41+00:00
Next Scan 2025-12-04T04:22:41+00:00

Last Scan

Scanned2025-11-04T04:22:41+00:00
URL https://agilest.org/robots.txt
Domain IPs 104.21.18.136, 172.67.182.37, 2606:4700:3035::ac43:b625, 2606:4700:3036::6815:1288
Response IP 104.21.18.136
Found Yes
Hash 378ad888aaf6e2d05eeef611cf2b64093194c563e27629a834f6136e77eb2111
SimHash 0530d0c88629

Groups

*

Rule Path Comment
Disallow /cgi-bin папка на Ñ
Disallow /? все параметры запроса на главной
Disallow /wp- все файлы WP: /wp-json/, /wp-includes, /wp-content/plugins
Disallow *?s= поиск
Disallow *%26s%3D поиск
Disallow /search/ поиск
Disallow /author/ арÑ
Disallow /users/ арÑ
Disallow */trackback трекбеки, уведомления в комментарияÑ
Disallow */feed все фиды
Disallow */rss rss фид
Disallow */embed все встраивания
Disallow */wlwmanifest.xml xml-файл манифеста Windows Live Writer (если не используете,
Disallow /xmlrpc.php файл WordPress API
Disallow *utm*%3D ссылки с utm-метками
Disallow *openstat%3D ссылки с метками openstat
Disallow /shop/ стандартная Ву страница
Disallow /*?ical=1 -
Allow */uploads открываем папку с файлами uploads

Other Records

Field Value
crawl-delay 20

Comments

  • ссылки на статью
  • правило можно удалить)

Warnings

  • 4 invalid lines.