parlamento.it
robots.txt

Robots Exclusion Standard data for parlamento.it

Resource Scan

Scan Details

Site Domain parlamento.it
Base Domain parlamento.it
Scan Status Ok
Last Scan2024-05-22T11:10:05+00:00
Next Scan 2024-06-21T11:10:05+00:00

Last Scan

Scanned2024-05-22T11:10:05+00:00
URL https://parlamento.it/robots.txt
Redirect https://www.parlamento.it/robots.txt
Redirect Domain www.parlamento.it
Redirect Base parlamento.it
Domain IPs 80.64.127.53
Redirect IPs 13.35.18.103, 13.35.18.120, 13.35.18.13, 13.35.18.6
Response IP 13.35.18.103
Found Yes
Hash 386f989a9bcb8cc32a7efad4bec4f70ca0b546ef326c993cac9acea8592cde3c
SimHash f45d594ac70f

Groups

acunetix security scanner

Rule Path
Disallow /

*

Rule Path
Disallow /ric/
Disallow /ric2012/
Disallow /App/Pages/

Comments

  • DIRITTO ALL'OBLIO
  • I documenti per i quali e' stata accolta un'istanza di oblio ai sensi delle delibere n. 31 del 18 dicembre 2013 e n. 62 del 7 maggio 2015 (http://www.senato.it/4567)
  • sono oggetto di una procedura informatica finalizzata ad istruire i motori di ricerca a non effettuare l'indicizzazione dei testi in essi contenuti.
  • In particolare tale procedura prevede che venga restituita un'intestazione X-Robots-Tag con valore "noindex, nofollow, noarchive" nella risposta HTTP della pagina interessata.
  • Affinche' le suddette istruzioni di deindicizzazione siano efficaci, la pagina non deve essere bloccata da un file robots.txt, come specificato dalla documentazione online dei motori di ricerca.