gent-dev.com
robots.txt

Robots Exclusion Standard data for gent-dev.com

Resource Scan

Scan Details

Site Domain gent-dev.com
Base Domain gent-dev.com
Scan Status Ok
Last Scan2024-11-12T07:40:31+00:00
Next Scan 2024-11-19T07:40:31+00:00

Last Scan

Scanned2024-11-12T07:40:31+00:00
URL https://gent-dev.com/robots.txt
Domain IPs 212.224.118.137
Response IP 212.224.118.137
Found Yes
Hash b26b5fa44258689be54e0579742979078993c253e6fc3fa2d95d7390e59224dc
SimHash 05a0a0330c30

Groups

*

Rule Path Comment
Disallow /cgi-bin классика...
Disallow /? все параметры запроса на главной
Disallow /wp- все файлы WP: /wp-json/, /wp-includes, /wp-content/plugins
Disallow *?s= поиск
Disallow *%26s%3D поиск
Disallow /search поиск
Disallow /author/ арÑ
Disallow *?attachment_id= страница вложения. Вообще-то на ней редирект...
Disallow */feed все фиды
Disallow */rss rss фид
Disallow */embed все встраивания
Disallow */page/ все виды пагинации
Allow */uploads открываем uploads
Allow /*/*.js внутри /wp- (/*/ - для приоритета)
Allow /*/*.css внутри /wp- (/*/ - для приоритета)
Allow /wp-*.png картинки в плагинаÑ
Allow /wp-*.jpg картинки в плагинаÑ
Allow /wp-*.jpeg картинки в плагинаÑ
Allow /wp-*.gif картинки в плагинаÑ

Other Records

Field Value Comment
sitemap https://gent-dev.com/sitemap.xml -
sitemap https://gent-dev.com/sitemap2.xml еще один файл

Comments

  • Disallow: /wp/ # когда WP установлен в подкаталог wp
  • Sitemap: https://gent-dev.com/sitemap.xml.gz # сжатая версия (.gz)
  • Версия кода: 1.0
  • Не забудьте поменять `gent-dev.com` на ваш сайт.

Warnings

  • 5 invalid lines.
  • `host` is not a known field.