noticiacristiana.com
robots.txt

Robots Exclusion Standard data for noticiacristiana.com

Archived Snapshots

Resource Scan

Scan Details

Site Domain	noticiacristiana.com
Base Domain	noticiacristiana.com
Scan Status	Ok
Last Scan	2024-05-22T05:23:21+00:00
Next Scan	2024-05-29T05:23:21+00:00

Last Scan

Scanned	2024-05-22T05:23:21+00:00
URL	https://noticiacristiana.com/robots.txt
Domain IPs	104.21.8.23, 172.67.138.65, 2606:4700:3030::6815:817, 2606:4700:3030::ac43:8a41
Response IP	172.67.138.65
Found	Yes
Hash	eda08fe89b15ca6c9819810c1a4c8a36accb0a79b66f684d6a2a7e2d73992326
SimHash	886c1e100c53

Groups

mediapartners-google

Rule	Path
Disallow

Rule

Path

Disallow

*

Rule	Path
Allow	/wp-content/uploads/
Disallow	/wp-content/plugins/
Disallow	/wp-content/themes/
Disallow	/wp-includes/
Disallow	/wp-admin/
Disallow	/404.html
Disallow	/author/
Disallow	/wp-
Disallow	/?s=
Disallow	/search
Allow	/feed/$
Disallow	/feed
Disallow	/comments/feed
Disallow	/*/feed/$
Disallow	/*/feed/rss/$
Disallow	/*/trackback/$
Disallow	///feed/$
Disallow	///feed/rss/$
Disallow	///trackback/$
Disallow	///*/feed/$
Disallow	///*/feed/rss/$
Disallow	///*/trackback/$
Disallow	/news/
Disallow	/post-from-mailing$

Rule

Path

Allow

/wp-content/uploads/

Disallow

/wp-content/plugins/

Disallow

/wp-content/themes/

Disallow

/wp-includes/

Disallow

/wp-admin/

Disallow

/404.html

Disallow

/author/

Disallow

/wp-

Disallow

/?s=

Disallow

/search

Allow

/feed/$

Disallow

/feed

Disallow

/comments/feed

Disallow

/*/feed/$

Disallow

/*/feed/rss/$

Disallow

/*/trackback/$

Disallow

/*/*/feed/$

Disallow

/*/*/feed/rss/$

Disallow

/*/*/trackback/$

Disallow

/*/*/*/feed/$

Disallow

/*/*/*/feed/rss/$

Disallow

/*/*/*/trackback/$

Disallow

/news/

Disallow

/post-from-mailing$

msiecrawler

Rule	Path
Disallow	/

Rule

Path

Disallow

webcopier

Rule	Path
Disallow	/

Rule

Path

Disallow

httrack

Rule	Path
Disallow	/

Rule

Path

Disallow

microsoft.url.control

Rule	Path
Disallow	/

Rule

Path

Disallow

libwww

Rule	Path
Disallow	/

Rule

Path

Disallow

noxtrumbot

No rules defined. All paths allowed.

Other Records

Field	Value
crawl-delay	50

Field

Value

crawl-delay

msnbot

No rules defined. All paths allowed.

Other Records

Field	Value
crawl-delay	30

Field

Value

crawl-delay

slurp

No rules defined. All paths allowed.

Other Records

Field	Value
crawl-delay	10

Field

Value

crawl-delay

Other Records

Field	Value
sitemap	https://www.noticiacristiana.com/sitemap.xml
sitemap	https://www.noticiacristiana.com/sitemap-news.xml

Field

Value

sitemap

https://www.noticiacristiana.com/sitemap.xml

sitemap

https://www.noticiacristiana.com/sitemap-news.xml

Comments

Primero el contenido adjunto.
Tambiï¿½n podemos desindexar todo lo que empiece
por wp-. Es lo mismo que los Disallow de arriba pero
incluye cosas como wp-rss.php
Sitemap permitido, bï¿½squedas no.
Permitimos el feed general para Google Blogsearch.
Impedimos que permalink/feed/ sea indexado ya que el
feed con los comentarios suele posicionarse en lugar de
la entrada y desorienta a los usuarios.
Lo mismo con URLs terminadas en /trackback/ que sï¿½lo
sirven como Trackback URI (y son contenido duplicado).
A partir de aquï¿½ es opcional pero recomendado.
Lista de bots que suelen respetar el robots.txt pero rara
vez hacen un buen uso del sitio y abusan bastante...
Aï¿½adir al gusto del consumidor...
Slurp (Yahoo!), Noxtrum y el bot de MSN a veces tienen
idas de pinza, toca decirles que reduzcan la marcha.
El valor es en segundos y podï¿½is dejarlo bajo e ir
subiendo hasta el punto ï¿½ptimo.

noticiacristiana.comrobots.txt

Resource Scan

Scan Details

Last Scan

Groups

mediapartners-google

*

msiecrawler

webcopier

httrack

microsoft.url.control

libwww

noxtrumbot

Other Records

msnbot

Other Records

slurp

Other Records

Other Records

Comments

noticiacristiana.com
robots.txt