dream-alcala.com
robots.txt

Robots Exclusion Standard data for dream-alcala.com

Resource Scan

Scan Details

Site Domain dream-alcala.com
Base Domain dream-alcala.com
Scan Status Ok
Last Scan2024-11-13T07:55:12+00:00
Next Scan 2024-11-20T07:55:12+00:00

Last Scan

Scanned2024-11-13T07:55:12+00:00
URL https://dream-alcala.com/robots.txt
Redirect https://www.dream-alcala.com/robots.txt
Redirect Domain www.dream-alcala.com
Redirect Base dream-alcala.com
Domain IPs 51.83.44.8
Redirect IPs 51.83.44.8
Response IP 51.83.44.8
Found Yes
Hash e8290fa033a53e3d7f741138b76109eee178ca80ec2df560f5e51cbf4d016fb7
SimHash c85d4c140110

Groups

*

Rule Path
Allow /feed/$
Disallow /feed
Disallow /comments/feed
Disallow /*/feed/$
Disallow /*/feed/rss/$
Disallow /*/trackback/$
Disallow /*/*/feed/$
Disallow /*/*/feed/rss/$
Disallow /*/*/trackback/$
Disallow /*/*/*/feed/$
Disallow /*/*/*/feed/rss/$
Disallow /*/*/*/trackback/$
Disallow /wp-admin/
Disallow /wp-content/plugins/pdfjs-viewer-shortcode/

Other Records

Field Value
sitemap http://wwww.dream-alcala.com/sitemapindex.xml

Comments

  • Permitimos el feed general para Google Blogsearch.
  • Impedimos que permalink/feed/ sea indexado ya que el feed con los comentarios suele
  • posicionarse en lugar de la entrada y desorienta a los usuarios.
  • Lo mismo con URLs terminadas en /trackback/ que sólo sirven como Trackback URI
  • (y son contenido duplicado).