glistatigenerali.com
robots.txt

Robots Exclusion Standard data for glistatigenerali.com

Resource Scan

Scan Details

Site Domain glistatigenerali.com
Base Domain glistatigenerali.com
Scan Status Ok
Last Scan2024-09-20T15:19:16+00:00
Next Scan 2024-09-27T15:19:16+00:00

Last Scan

Scanned2024-09-20T15:19:16+00:00
URL https://glistatigenerali.com/robots.txt
Domain IPs 34.76.139.90
Response IP 34.76.139.90
Found Yes
Hash 3a16b2622afa16911d4738339a9be7c9044707951dfd5295c174433e4c6552fc
SimHash 211cc84aec34

Groups

*

Rule Path Comment
Disallow /me/ per evitare l'accesso alle pagine me
Disallow /*?s=* per evitare l'indicizzazione delle pagine con querystring di ricerca
Disallow /search* per evitare l'indicizzazione di tutte le pagine fake di ricerca
Disallow /calcio/i-diritti-tv-ennesimo-scandalo-di-un-calcio-sempre-piu-marcio/ -
Disallow /economia-sommersa_macroeconomia/la-russia-aggira-le-sanzioni-vincenzo-trani-e-l-italia* -

Other Records

Field Value
sitemap https://www.glistatigenerali.com/sitemapindex.xml