mycandycrush.fr
robots.txt

Robots Exclusion Standard data for mycandycrush.fr

Resource Scan

Scan Details

Site Domain mycandycrush.fr
Base Domain mycandycrush.fr
Scan Status Ok
Last Scan2024-11-19T11:09:24+00:00
Next Scan 2024-11-26T11:09:24+00:00

Last Scan

Scanned2024-11-19T11:09:24+00:00
URL https://mycandycrush.fr/robots.txt
Domain IPs 185.221.182.17
Response IP 185.221.182.17
Found Yes
Hash 7a752d31492207bfab365a7ec82be7d11f144e5d012436d54dbe70057b9c1144
SimHash 5e42bca566fc

Groups

*

Rule Path
Disallow /*?
Disallow /wp-login.php
Disallow /wp-admin
Disallow /wp-includes
Disallow /wp-content
Allow /wp-content/uploads
Disallow */trackback
Disallow /*/feed
Disallow /*/comments
Disallow /cgi-bin
Disallow /*.php$
Disallow /*.inc$
Disallow /*.gz$
Disallow /*.cgi$

mediapartners-google

Rule Path
Disallow

Comments

  • On désindexe tous les URL ayant des paramètres (duplication de contenu)
  • On désindexe la page de connexion (contenu inutile)
  • On désindexe tous les fichiers du coeur de WordPress (contenus inutiles)
  • On autorise Google à indexer les fichiers mis en ligne dans vos articles et pages (images, vidéos, audio,...)
  • On bloque tous les flux RSS sauf celui principal (enlevez /* pour bloquer TOUS les flux)
  • On bloque toutes les URL de commentaire (flux RSS inclus)
  • On élimine ce répertoire sensible présent sur certains serveurs
  • On désindexe tous les fichiers qui n'ont pas lieu de l'être
  • Autoriser Google AdSense

Warnings

  • 1 invalid line.