awstats.sourceforge.io
robots.txt

Robots Exclusion Standard data for awstats.sourceforge.io

Resource Scan

Scan Details

Site Domain awstats.sourceforge.io
Base Domain sourceforge.io
Scan Status Ok
Last Scan2025-08-20T06:48:32+00:00
Next Scan 2025-09-19T06:48:32+00:00

Last Scan

Scanned2025-08-20T06:48:32+00:00
URL https://awstats.sourceforge.io/robots.txt
Domain IPs 104.18.10.31, 104.18.11.31
Response IP 104.18.10.31
Found Yes
Hash 6d7b29b4847ada8eb33fe2ad6d7192dbc00773461996b2410667734f4282542e
SimHash ad20dbdc0f9f

Groups

*

Rule Path
Allow /files/awstats.spec
Allow /files/awstats.nsi
Allow /files/webalizeradd.txt
Allow /files/analogadd.txt
Allow /files/testgeoip*
Disallow /files

Comments

  • Fichier autorisant ou non la visite des robots de recherche Web
  • Pour connaitre les visites d'un robot, le serveur
  • doit supporter les User-agent
  • Rem: Pour limiter les robots au niveau des pages HTML, utiliser :
  • <META NAME="ROBOTS" CONTENT="INDEX|NOINDEX,FOLLOW|NOFOLLOW">
  • Nom des robots (* pour tous) et restrictions
  • robots.txt
  • Disallow: /outils/
  • Disallow: /php/
  • Disallow: /data/