mybreedmatch.com
robots.txt

Robots Exclusion Standard data for mybreedmatch.com

Resource Scan

Scanned	2026-02-26T10:23:25+00:00
URL	https://mybreedmatch.com/robots.txt
Domain IPs	216.198.79.1
Response IP	216.198.79.1
Found	Yes
Hash	a25e8ba9c3d3fcc58439138410ac27d613b59c7396c0e6387156517abcf0bbb5
SimHash	0d35ce10e857

Rule

Path

Allow

/

Disallow

/_next/

Disallow

/api/

Rule	Path
Allow	/

Rule

Path

Allow

/

Back to top

Field	Value
sitemap	https://mybreedmatch.com/sitemap.xml

Field

Value

sitemap

https://mybreedmatch.com/sitemap.xml

Back to top

Allow all crawlers
Block Next.js internal files (optional but good practice)
Explicitly allow the AdSense bot
Sitemap location (Vercel generates this automatically usually, but good to have)

Back to top