aulafacil.com
robots.txt

Robots Exclusion Standard data for aulafacil.com

Resource Scan

Scan Details

Site Domain aulafacil.com
Base Domain aulafacil.com
Scan Status Ok
Last Scan2024-06-26T15:37:05+00:00
Next Scan 2024-07-03T15:37:05+00:00

Last Scan

Scanned2024-06-26T15:37:05+00:00
URL https://aulafacil.com/robots.txt
Redirect https://www.aulafacil.com/robots.txt
Redirect Domain www.aulafacil.com
Redirect Base aulafacil.com
Domain IPs 104.21.42.234, 172.67.211.60, 2606:4700:3030::ac43:d33c, 2606:4700:3032::6815:2aea
Redirect IPs 104.21.42.234, 172.67.211.60, 2606:4700:3030::ac43:d33c, 2606:4700:3032::6815:2aea
Response IP 104.21.42.234
Found Yes
Hash 8833b50818193ddd4a649a39faa7e8746b78afe7bdfe3e993a6422f8ad4873e8
SimHash 4ab2fede4f60

Groups

*

Rule Path
Allow *
Disallow /*?*
Allow /*.js
Allow /*.css
Disallow /revelaInfoCurso
Disallow /site/marcaTestimonioPublicadoBoletin
Disallow /prev-
Disallow /traductor$
Disallow /profesores-expertos
Disallow /conexionremota.php$
Disallow /memcached/
Disallow /munin/
Disallow /backend/
Disallow /scripts/
Disallow /assets/
Disallow /lost%2Bfound/
Disallow /redirurl/
Disallow /profesores/descargar-cv-

googlebot-image

Rule Path
Disallow /

ia_archiver

Rule Path
Disallow /

Other Records

Field Value
sitemap http://www.aulafacil.com/sitemap.xml

Comments

  • Consejos de Reglas de Robots.txt desde https://developers.google.com/webmasters/control-crawl-index/docs/robots_txt
  • Probador de robots en: https://www.google.com/webmasters/tools/robots-testing-tool
  • Crawler
  • Issue #50
  • Deshabilitar las urls con parámetros. Issue #50
  • Pero permitir indexar los ficheros .js|.css aunque estos tengan parámetros
  • No indexar acción de revelar información de curso de webpush
  • No indexar la acción de marcado de testimonios del boletín
  • No indexar las previsualizaciones (que son públicas). No es necesario indicar /prev-* porque google ignora el * del final
  • No indexar traductor
  • No indexar duplicidad de página de contacto de profesores expertos
  • prueba de conexión remota.
  • Links de redirección.
  • JLM. 8.10.18 Se comenta la linea de abajo ya que deberá permitirse el acceso por robots para capturar el header X-Robots-Tag: noindex, al existir previamente dichos enlaces en el índice de google. De esta forma con la cabecera ya se sabe que no se deberá indexar
  • Disallow: /linkto
  • Usada para redirigir todo el contenido del que no se confía
  • No indexar los CVs de los profesores
  • 23-5 Desactivar indexación de imagenes
  • Internet archive