/.well-known/

Log In Sign Up

colonialhouse.net
robots.txt

Robots Exclusion Standard data for colonialhouse.net

Archived Snapshots

Resource Scan

Scan Details

Site Domain	colonialhouse.net
Base Domain	colonialhouse.net
Scan Status	Ok
Last Scan	2026-01-15T09:44:31+00:00
Next Scan	2026-01-29T09:44:31+00:00

Last Scan

Scanned	2026-01-15T09:44:31+00:00
URL	https://colonialhouse.net/robots.txt
Redirect	https://www.colonialhouse.net/robots.txt
Redirect Domain	www.colonialhouse.net
Redirect Base	colonialhouse.net
Domain IPs	104.21.60.228, 172.67.202.25, 2606:4700:3030::6815:3ce4, 2606:4700:3032::ac43:ca19
Redirect IPs	104.21.60.228, 172.67.202.25, 2606:4700:3030::6815:3ce4, 2606:4700:3032::ac43:ca19
Response IP	172.67.202.25
Found	Yes
Hash	5ed771ed46e220b3c5e054dd07051adca7866796a0befcfe35381f4a422538f1
SimHash	9361b3770a47

Groups

rogerbot
exabot
mj12bot
dotbot
gigabot
ahrefsbot
blackwidow
chinaclaw
custo
disco
download\ demon
ecatch
eirgrabber
emailsiphon
emailwolf
express\ webpictures
extractorpro
eyenetie
flashget
getright
getweb!
go!zilla
go-ahead-got-it
grabnet
grafula
hmview
httrack
image\ stripper
image\ sucker
indy\ library
interget
internet\ ninja
jetcar
joc\ web\ spider
larbin
leechftp
mass\ downloader
midown\ tool
mister\ pix
navroad
nearsite
netants
netspider
net\ vampire
netzip
octopus
offline\ explorer
offline\ navigator
pagegrabber
papa\ foto
pavuk
pcbrowser
realdownload
reget
sitesnagger
smartdownload
superbot
superhttp
surfbot
takeout
teleport\ pro
voideye
web\ image\ collector
web\ sucker
webauto
webcopier
webfetch
webgo\ is
webleacher
webreaper
websauger
website\ extractor
website\ quester
webstripper
webwhacker
webzip
wget
widow
wwwoffle
xaldon\ webspider
zeus

Rule

Path

Disallow

/

Back to top

Other Records

Field

Value

sitemap

https://www.colonialhouse.net/sitemap.xml

Back to top