wg-gesucht.de
robots.txt

Robots Exclusion Standard data for wg-gesucht.de

Resource Scan

Scan Details

Site Domain wg-gesucht.de
Base Domain wg-gesucht.de
Scan Status Ok
Last Scan2024-09-22T15:39:20+00:00
Next Scan 2024-09-29T15:39:20+00:00

Last Scan

Scanned2024-09-22T15:39:20+00:00
URL https://wg-gesucht.de/robots.txt
Redirect https://www.wg-gesucht.de/robots.txt
Redirect Domain www.wg-gesucht.de
Redirect Base wg-gesucht.de
Domain IPs 159.69.70.79
Redirect IPs 138.201.98.175, 138.201.98.176, 159.69.70.78, 159.69.70.79, 176.9.141.111, 176.9.21.88, 5.9.34.11
Response IP 159.69.70.78
Found Yes
Hash ba7b9bcea80899ac4503295d9e1e04da391b9e5b6eb1a35d47e3701cefdfb869
SimHash c13091f08363

Groups

psbot

Rule Path
Disallow /

trovitbot

Rule Path
Disallow /

cityreview

Rule Path
Disallow /

dataforseobot

Rule Path
Disallow /

rogerbot

Rule Path
Disallow /

dotbot

Rule Path
Disallow /

*

Rule Path
Allow /.well-known/assetlinks.json
Disallow /angebot-bearbeiten.html
Disallow /gesuch-bearbeiten.html
Disallow /eintrag-loeschen.html
Disallow /nachricht-senden.html
Disallow /qs.php
Disallow /userdata.php
Disallow /api/
Disallow /security-information.html
Disallow /agb.html

Comments

  • robots.txt für www.wg-gesucht.de
  • Gibt an, welche Seiten nicht durch Crawler durchsucht werden sollen
  • User-agent: Googlebot-Image
  • Disallow: /
  • picsearch.com
  • trovit.com
  • cityreview.org