/.well-known/

Log In Sign Up

4icu.org
robots.txt

Robots Exclusion Standard data for 4icu.org

Archived Snapshots

Resource Scan

Scan Details

Site Domain	4icu.org
Base Domain	4icu.org
Scan Status	Ok
Last Scan	2024-11-11T00:08:09+00:00
Next Scan	2024-11-18T00:08:09+00:00

Last Scan

Scanned	2024-11-11T00:08:09+00:00
URL	https://4icu.org/robots.txt
Redirect	https://www.4icu.org/robots.txt
Redirect Domain	www.4icu.org
Redirect Base	4icu.org
Domain IPs	207.7.88.51
Redirect IPs	207.7.88.51
Response IP	207.7.88.51
Found	Yes
Hash	dc553e797561c8c414c47e52e5be6f7cbcd06e199c20a4644cd5f140635fcddf
SimHash	d36d99778e0b

Groups

gptbot
google-extended
feed
blexbot
crawl
nbot
ahrefsbot
blackwidow
semrushbot
grapeshotcrawler
dotbot
semrushbot-si
scrapy
linkcheck
sogou web spider
nbot
extractorpro
eyenetie
flashget
getright
getweb!
go!zilla
go-ahead-got-it
grabnet
image\ stripper
image\ sucker
interget
mass\ downloader
navroad
nearsite
netants
netspider
net\ vampire
netzip
octopus
offline\ explorer
offline\ navigator
pagegrabber
pcbrowser
realdownload
reget
sitesnagger
smartdownload
superbot
surfbot
webauto
webcopier
webfetch
webleacher
webreaper
websauger
website\ extractor
website\ quester
webstripper
webwhacker
webzip
wget
widow
wwwoffle
xaldon\ webspider
zeus

Rule

Path

Disallow

/

Back to top