glistatigenerali.com
robots.txt
Robots Exclusion Standard data for glistatigenerali.com
Resource Scan
Scan Details
Site Domain | glistatigenerali.com |
Base Domain | glistatigenerali.com |
Scan Status | Ok |
Last Scan | 2024-09-20T15:19:16+00:00 |
Next Scan | 2024-09-27T15:19:16+00:00 |
Last Scan
Scanned | 2024-09-20T15:19:16+00:00 |
URL | https://glistatigenerali.com/robots.txt |
Domain IPs | 34.76.139.90 |
Response IP | 34.76.139.90 |
Found | Yes |
Hash | 3a16b2622afa16911d4738339a9be7c9044707951dfd5295c174433e4c6552fc |
SimHash | 211cc84aec34 |
Groups
*
Rule | Path | Comment |
---|---|---|
Disallow | /me/ | per evitare l'accesso alle pagine me |
Disallow | /*?s=* | per evitare l'indicizzazione delle pagine con querystring di ricerca |
Disallow | /search* | per evitare l'indicizzazione di tutte le pagine fake di ricerca |
Disallow | /calcio/i-diritti-tv-ennesimo-scandalo-di-un-calcio-sempre-piu-marcio/ | - |
Disallow | /economia-sommersa_macroeconomia/la-russia-aggira-le-sanzioni-vincenzo-trani-e-l-italia* | - |
Other Records
Field | Value |
---|---|
sitemap | https://www.glistatigenerali.com/sitemapindex.xml |