willfound.com
robots.txt

Robots Exclusion Standard data for willfound.com

Resource Scan

Scan Details

Site Domain willfound.com
Base Domain willfound.com
Scan Status Ok
Last Scan2025-09-01T23:16:38+00:00
Next Scan 2025-09-08T23:16:38+00:00

Last Scan

Scanned2025-09-01T23:16:38+00:00
URL https://willfound.com/robots.txt
Domain IPs 144.76.112.106
Response IP 144.76.112.106
Found Yes
Hash 7a0602d04eebada1a216d4e4d4cebeee4a182da063bf00b9e467b9b0c0d04334
SimHash 0418d0408531

Groups

*

Product Comment
* общие правила для роботов, кроме Яндекса и Google,
Rule Path Comment
Disallow /cgi-bin папка на Ñ
Disallow /? все параметры запроса на главной
Disallow /wp- все файлы WP: /wp-json/, /wp-includes, /wp-content/plugins
Disallow /wp/ если есть подкаталог /wp/, где установлена CMS (если нет,
Disallow *?s= поиск
Disallow *%26s%3D поиск
Disallow /search/ поиск
Disallow /author/ арÑ
Disallow /users/ арÑ
Disallow */trackback трекбеки, уведомления в комментарияÑ
Disallow */feed все фиды
Disallow */rss rss фид
Disallow */embed все встраивания
Disallow */wlwmanifest.xml xml-файл манифеста Windows Live Writer (если не используете,
Disallow /xmlrpc.php файл WordPress API
Disallow *utm*%3D ссылки с utm-метками
Disallow *openstat%3D ссылки с метками openstat
Allow */uploads открываем папку с файлами uploads
Allow /ad/* -

Other Records

Field Value
sitemap https://www.willfound.com/sitemap.xml

Comments

  • т.к. для ниÑ
  • правило можно удалить)
  • ссылки на статью
  • правило можно удалить)

Warnings

  • 5 invalid lines.
  • `host` is not a known field.