farmarcas.com.br
robots.txt

Robots Exclusion Standard data for farmarcas.com.br

Resource Scan

Scan Details

Site Domain farmarcas.com.br
Base Domain farmarcas.com.br
Scan Status Ok
Last Scan2024-11-01T05:58:00+00:00
Next Scan 2024-12-01T05:58:00+00:00

Last Scan

Scanned2024-11-01T05:58:00+00:00
URL https://farmarcas.com.br/robots.txt
Domain IPs 138.97.107.172
Response IP 138.97.107.172
Found Yes
Hash c79be2daf59f5d3547bc996e971b5b38482f91db6ce3c4ed037ab2631411df3a
SimHash 809c8e1082c1

Groups

*

Rule Path
Disallow /

googlebot

Rule Path
Disallow /bets/
Disallow /apostas/
Disallow /bet/

badbetbot

Rule Path
Disallow /

anotherbetbot

Rule Path
Disallow /

*

Rule Path
Disallow /search/

*

Rule Path
Disallow /cemoara.com.br
Disallow /mobplay.com.br
Disallow /attachment-trauma.org
Disallow /uol.com.br
Disallow /rwadvocacia.com.br
Disallow /camaraserrinha.ba.gov.br
Disallow /ronaldalbrecht.com
Disallow /argoautomacao.com.br
Disallow /everystry.com
Disallow /edylutz.com.br
Disallow /oficinadocinto.com.br
Disallow /uakti.com

Comments

  • User-agent: *
  • Disallow: /
  • User-agent: Googlebot
  • Disallow:
  • Bloquear tudo para todos os bots por padrão
  • Permitir Googlebot acessar o site, mas bloquear diretórios específicos
  • Exemplo de bloqueio de bots específicos conhecidos
  • Bloquear diretórios específicos para todos os bots
  • Bloquear URLs específicas para todos os bots