worldwildlife.org
robots.txt

Robots Exclusion Standard data for worldwildlife.org

Resource Scan

Scanned	2024-09-21T00:13:04+00:00
URL	https://worldwildlife.org/robots.txt
Redirect	https://www.worldwildlife.org/robots.txt
Redirect Domain	www.worldwildlife.org
Redirect Base	worldwildlife.org
Domain IPs	104.18.2.107, 104.18.3.107, 2606:4700::6812:26b, 2606:4700::6812:36b
Redirect IPs	104.18.2.107, 104.18.3.107, 2606:4700::6812:26b, 2606:4700::6812:36b
Response IP	104.18.2.107
Found	Yes
Hash	1901566f70e3398046b798e4fc3d1604aefe8916cb8924748d9fa8a0884d4327
SimHash	b68d0c0db470

Rule	Path
Disallow	/pages/global-environment-facility-gef-business-resources
Disallow	/publications/wwf-us-recipient-procurement-guidelines
Disallow	/personalization

Rule

Path

Disallow

/pages/global-environment-facility-gef-business-resources

Disallow

/publications/wwf-us-recipient-procurement-guidelines

Disallow

/personalization

Back to top

Field	Value
sitemap	https://www.worldwildlife.org/sitemap.xml

Field

Value

sitemap

https://www.worldwildlife.org/sitemap.xml

Back to top

See http://www.robotstxt.org/wc/norobots.html for documentation on how to use the robots.txt file
To ban all spiders from the entire site uncomment the next two lines:
User-Agent: *
Disallow: /

Back to top