cms.marieclaire.co.uk
robots.txt

Robots Exclusion Standard data for cms.marieclaire.co.uk

Archived Snapshots

Resource Scan

Scan Details

Site Domain	cms.marieclaire.co.uk
Base Domain	marieclaire.co.uk
Scan Status	Failed
Failure Stage	Fetching resource.
Failure Reason	Couldn't connect to server.
Last Scan	2024-09-14T13:46:21+00:00
Next Scan	2024-11-13T13:46:21+00:00

Last Successful Scan

Scanned	2024-06-24T13:45:26+00:00
URL	https://cms.marieclaire.co.uk/robots.txt
Redirect	https://www.marieclaire.co.uk/robots.txt
Redirect Domain	www.marieclaire.co.uk
Redirect Base	marieclaire.co.uk
Domain IPs	52.51.86.0, 54.194.229.86
Redirect IPs	151.101.130.114, 151.101.194.114, 151.101.2.114, 151.101.66.114
Response IP	199.232.46.114
Found	Yes
Hash	de8d15ca6161854c0c3177d92606e56295e716ecf8934577002216e7c79ba2e0
SimHash	60048484bdb5

Groups

*

Rule	Path
Disallow	*/deals/compare
Disallow	*/html/
Disallow	/p//embed/captioned
Disallow	searchTerm%3D
Disallow	sortBy%3D
Disallow	productBrand%3D
Disallow	%7B%7D*
Disallow	/infinite-scroll-article/*
Disallow	/infinite-scroll-review/*
Disallow	/infinite-scroll-recipe/*

Rule

Path

Disallow

*/deals/compare

Disallow

*/html/

Disallow

*/p/*/embed/captioned

Disallow

*searchTerm%3D*

Disallow

*sortBy%3D*

Disallow

*productBrand%3D*

Disallow

*%7B*%7D*

Disallow

/infinite-scroll-article/*

Disallow

/infinite-scroll-review/*

Disallow

/infinite-scroll-recipe/*

*

Rule	Path
Disallow	searchTerm%3D
Disallow	sortBy%3D
Disallow	productBrand%3D
Disallow	jwsource%3D
Disallow	region-switch%3D
Disallow	%7B%7D*

Rule

Path

Disallow

*searchTerm%3D*

Disallow

*sortBy%3D*

Disallow

*productBrand%3D*

Disallow

*jwsource%3D*

Disallow

*region-switch%3D*

Disallow

*%7B*%7D*

*

No rules defined. All paths allowed.

Back to top

Other Records

Field	Value
sitemap	https://www.marieclaire.co.uk/sitemap.xml
sitemap	https://www.marieclaire.co.uk/sitemap.xml

Field

Value

sitemap

https://www.marieclaire.co.uk/sitemap.xml

sitemap

https://www.marieclaire.co.uk/sitemap.xml

Back to top

Comments

Vanilla-wide rules
Common path patterns (* prefix to handle localisation)
Common query string patterns
Infinite scroll paths
Site-specific rules
Sitemaps

Back to top

cms.marieclaire.co.ukrobots.txt

Resource Scan

Scan Details

Last Successful Scan

Groups

*

*

*

Other Records

Comments

cms.marieclaire.co.uk
robots.txt