sick.de
robots.txt

Robots Exclusion Standard data for sick.de

Archived Snapshots

Resource Scan

Scan Details

Site Domain	sick.de
Base Domain	sick.de
Scan Status	Ok
Last Scan	2024-09-29T16:55:14+00:00
Next Scan	2024-10-29T16:55:14+00:00

Last Scan

Scanned	2024-09-29T16:55:14+00:00
URL	https://sick.de/robots.txt
Redirect	https://www.sick.com/de/en/robots.txt
Redirect Domain	www.sick.com
Redirect Base	sick.com
Domain IPs	80.72.134.68
Redirect IPs	96.17.96.11, 96.17.96.19
Response IP	23.50.232.234
Found	Yes
Hash	b81db526f13e334dea504c3f40cad9f89251b0dfda5ba0d5c2a1b963bc603f4d
SimHash	3857c796eff2

Groups

*

Rule	Path
Disallow	/de/en/cart
Disallow	/de/en/checkout
Disallow	/de/en/my-account
Disallow	/de/en/my-company
Disallow	/de/en/compare
Disallow	/de/en/search

Rule

Path

Disallow

/de/en/cart

Disallow

/de/en/checkout

Disallow

/de/en/my-account

Disallow

/de/en/my-company

Disallow

/de/en/compare

Disallow

/de/en/search

cazoodlebot

Rule	Path
Disallow	/

Rule

Path

Disallow

/

mj12bot

Rule	Path
Disallow	/

Rule

Path

Disallow

/

dotbot/1.0

Rule	Path
Disallow	/

Rule

Path

Disallow

/

gigabot

Rule	Path
Disallow	/

Rule

Path

Disallow

/

Back to top

Other Records

Field	Value
sitemap	/de/en/sitemap.xml

Field

Value

sitemap

/de/en/sitemap.xml

Back to top

Comments

For all robots
Block access to specific groups of pages
Allow search crawlers to discover the sitemap
Block CazoodleBot as it does not present correct accept content headers
Block MJ12bot as it is just noise
Block dotbot as it cannot parse base urls properly
Block Gigabot

Back to top

sick.derobots.txt

Resource Scan

Scan Details

Last Scan

Groups

*

cazoodlebot

mj12bot

dotbot/1.0

gigabot

Other Records

Comments

sick.de
robots.txt