noseas.com
robots.txt

Robots Exclusion Standard data for noseas.com

Resource Scan

Scan Details

Site Domain noseas.com
Base Domain noseas.com
Scan Status Failed
Failure StageFetching resource.
Failure ReasonCouldn't connect to server.
Last Scan2025-11-22T14:51:38+00:00
Next Scan 2026-02-20T14:51:38+00:00

Last Successful Scan

Scanned2023-01-14T23:23:57+00:00
URL https://noseas.com/robots.txt
Domain IPs 170.249.236.167
Response IP 170.249.236.167
Found Yes
Hash 461f3c2bcea0d1b918310533984b0c650ecd044f8e02facd2043da6ac73416a7
SimHash c970cfc30436

Groups

mediapartners-google

Rule Path
Allow /

*

Rule Path
Allow /wp-content/uploads/
Disallow /wp-
Disallow /*?
Disallow /search/
Disallow /*.php$
Disallow /*.inc$
Allow /*.css
Allow /*.js
Disallow /cgi-bin/
Disallow /stats/
Disallow /logs/
Disallow /author/
Disallow /downloads/
Disallow /page*/
Disallow /comments/
Disallow /archives/
Disallow /author/
Disallow /author/
Disallow /feed*/
Disallow /trackback*/
Disallow /attachment*/

Other Records

Field Value
sitemap https://www.noseas.com/sitemap_index.xml
sitemap https://www.noseas.com/post-sitemap.xml
sitemap https://www.noseas.com/page-sitemap.xml
sitemap https://www.noseas.com/category-sitemap.xml
sitemap https://www.noseas.com/post_tag-sitemap.xml

Comments

  • Ponemos todos los sitemaps
  • Dejamos al robot de publicidad de google que entre hasta la cocina para evitar problemas con la publicidad en paginaciones, búsquedas, etc
  • Desindexamos todo lo que empiece por wp- a excepción de la carpeta uploads
  • Desindexamos cualquier tipo de búsqueda y cualquier ruta que pueda llevar el parámetro ? en la url
  • Desindexamos cualquier archivo que termine con la extensión .php .js .inc .css
  • Desindexamos carpetas de logs, estadísticas y scripts
  • Desindexamos todas las paginaciones
  • Desindexamos posibles páginas con contenido duplicado o que no nos interesan, entre ellas los archivos, los comentarios, las páginas de autor y las tags
  • Desindexamos los feeds, trackbacks y attachments