en.wikiteka.com
robots.txt

Robots Exclusion Standard data for en.wikiteka.com

Resource Scan

Scan Details

Site Domain en.wikiteka.com
Base Domain wikiteka.com
Scan Status Ok
Last Scan2025-11-13T15:25:29+00:00
Next Scan 2025-12-13T15:25:29+00:00

Last Scan

Scanned2025-11-13T15:25:29+00:00
URL https://en.wikiteka.com/robots.txt
Domain IPs 104.26.4.69, 104.26.5.69, 172.67.75.56, 2606:4700:20::681a:445, 2606:4700:20::681a:545, 2606:4700:20::ac43:4b38
Response IP 172.67.75.56
Found Yes
Hash 909de30ef0603536a39a267ecf09fcd300c9e97d08cd21265d30ac419b8990c9
SimHash 8b4cd2445973

Groups

*

Rule Path Comment
Disallow /document-tools/* -
Disallow /documento.php* Antigua URL de acceso a documentos y su descarga
Disallow /directorio.php* Antigua URL de acceso al directorio
Disallow /confirmar-descarga.php* Antigua URL de acceso a la descarga de documentos
Disallow /descargar.php* Antigua URL de acceso a la descarga de documentos
Disallow /perfil/* Antigua URL de acceso a los perfiles de usuario
Disallow /imprimir/* Antigua URL de versión imprimible de un documento
Disallow /search/* Antigua URL de versión imprimible de un documento
Disallow /search?* Antigua URL de versión imprimible de un documento

mediapartners-google

Rule Path
Allow /document-tools/download/*
Allow /search/*
Allow /search?*

Other Records

Field Value
sitemap http://en.wikiteka.com/sitemap.xml

Comments

  • robots.txt

Warnings

  • 1 invalid line.