um.es
robots.txt

Robots Exclusion Standard data for um.es

Resource Scan

Scan Details

Site Domain um.es
Base Domain um.es
Scan Status Ok
Last Scan3/13/2025, 1:52:40 PM
Next Scan 4/12/2025, 1:52:40 PM

Last Scan

Scanned3/13/2025, 1:52:40 PM
URL https://um.es/robots.txt
Redirect https://www.um.es/robots.txt
Redirect Domain www.um.es
Redirect Base um.es
Domain IPs 155.54.212.103, 2001:720:1710:212::1:d
Redirect IPs 155.54.212.103, 2001:720:1710:212::1:d
Response IP 155.54.212.103
Found Yes
Hash c31aa4fe3027e95f9e6cdf4aab2e8e78f52f15261eba2f143bed34b5beac1475
SimHash 815bdf500e34

Groups

*

Rule Path
Disallow /ayudaumu/
Disallow /cgi-bin/
Disallow /si/
Disallow /atica/index.php
Disallow /atica/directorio/
Disallow /publicaciones/estadisticas/
Disallow /web/universidaddemurcia
Disallow /web/universidaddemurcia/
Disallow /*/web/universidaddemurcia
Disallow /*/web/universidaddemurcia/
Disallow /web/modelo-*
Disallow /*/web/modelo-*

Other Records

Field Value
crawl-delay 1

Comments

  • robots.txt for www.um.es
  • Updated: 2024-12-04
  • Bloqueo de User-agent específico '008'
  • Directivas generales para todos los bots
  • Bloqueo de directorios específicos
  • Bloqueo de todo lo que cuelgue de /web/universidaddemurcia/ y sus descendientes
  • Bloqueo de patrones en cualquier subdirectorio que contenga /web/modelo-*

Warnings

  • 2 invalid lines.