danielagrob.de
robots.txt

Robots Exclusion Standard data for danielagrob.de

Resource Scan

Scan Details

Site Domain danielagrob.de
Base Domain danielagrob.de
Scan Status Ok
Last Scan2025-05-21T23:30:38+00:00
Next Scan 2025-06-20T23:30:38+00:00

Last Scan

Scanned2025-05-21T23:30:38+00:00
URL https://danielagrob.de/robots.txt
Redirect https://www.danielagrob.de/robots.txt
Redirect Domain www.danielagrob.de
Redirect Base danielagrob.de
Domain IPs 217.160.0.158
Redirect IPs 217.160.0.158
Response IP 217.160.0.158
Found Yes
Hash 2c5e247914baaac9d2ed4a54df839ca9c2e358a7678a91fa27aa7da65526f3dc
SimHash 395959048710

Groups

*

Rule Path
Disallow /cgi-bin/
Disallow /admin/
Disallow /temp/
Disallow /fonts/
Disallow /font-awesome/

webreaper
webcopier
offline explorer
httrack
microsoft.url.control
emailcollector
penthesilea

Rule Path
Disallow /

Other Records

Field Value
sitemap http://www.danielagrob.de/sitemap.xml

Comments

  • ===================================
  • Erstellt am: 20.08.2017, 16:17
  • Webseite: http://http://www.danielagrob.de
  • ===================================
  • ===================================
  • Folgende Seiten sollen nicht indexiert werden:
  • ===================================
  • ===================================
  • Schließe folgende Spider komplett aus:
  • ===================================