awstats.sourceforge.net
robots.txt

Robots Exclusion Standard data for awstats.sourceforge.net

Resource Scan

Scan Details

Site Domain awstats.sourceforge.net
Base Domain sourceforge.net
Scan Status Ok
Last Scan2025-08-19T04:13:46+00:00
Next Scan 2025-09-18T04:13:46+00:00

Last Scan

Scanned2025-08-19T04:13:46+00:00
URL https://awstats.sourceforge.net/robots.txt
Redirect https://awstats.sourceforge.io/robots.txt
Redirect Domain awstats.sourceforge.io
Redirect Base sourceforge.io
Domain IPs 104.18.12.149, 104.18.13.149, 2606:4700::6812:c95, 2606:4700::6812:d95
Redirect IPs 104.18.10.31, 104.18.11.31
Response IP 104.18.11.31
Found Yes
Hash 6d7b29b4847ada8eb33fe2ad6d7192dbc00773461996b2410667734f4282542e
SimHash ad20dbdc0f9f

Groups

*

Rule Path
Allow /files/awstats.spec
Allow /files/awstats.nsi
Allow /files/webalizeradd.txt
Allow /files/analogadd.txt
Allow /files/testgeoip*
Disallow /files

Comments

  • Fichier autorisant ou non la visite des robots de recherche Web
  • Pour connaitre les visites d'un robot, le serveur
  • doit supporter les User-agent
  • Rem: Pour limiter les robots au niveau des pages HTML, utiliser :
  • <META NAME="ROBOTS" CONTENT="INDEX|NOINDEX,FOLLOW|NOFOLLOW">
  • Nom des robots (* pour tous) et restrictions
  • robots.txt
  • Disallow: /outils/
  • Disallow: /php/
  • Disallow: /data/