app.joinhandshake.co.uk
robots.txt

Robots Exclusion Standard data for app.joinhandshake.co.uk

Archived Snapshots

Resource Scan

Scan Details

Site Domain	app.joinhandshake.co.uk
Base Domain	joinhandshake.co.uk
Scan Status	Ok
Last Scan	2025-09-13T04:02:19+00:00
Next Scan	2025-09-27T04:02:19+00:00

Last Scan

Scanned	2025-09-13T04:02:19+00:00
URL	https://app.joinhandshake.co.uk/robots.txt
Domain IPs	104.18.40.90, 172.64.147.166, 2606:4700:4404::6812:285a, 2606:4700:4407::ac40:93a6
Response IP	172.64.147.166
Found	Yes
Hash	629b73c3621dcab34581590b98256881d2e74f3b1bc251c25dd9811d732247de
SimHash	60f4890f8671

Groups

*

Rule	Path
Allow	/$
Allow	/login
Allow	/register
Allow	/employer_registrations/new
Allow	/career_fairs/*/student_preview
Allow	/career_fairs/*/employer_preview
Allow	/events/*/share_preview
Allow	/jobs/*/share_preview
Allow	/employers
Allow	/job_role_groups
Allow	/questions
Allow	/favicon-32x32.png
Allow	/favicon-16x16.png
Allow	/favicon.png
Allow	/favicon.ico
Allow	/profiles/*
Disallow	/profiles/*/posts
Disallow	/

Rule

Path

Allow

/$

Allow

/login

Allow

/register

Allow

/employer_registrations/new

Allow

/career_fairs/*/student_preview

Allow

/career_fairs/*/employer_preview

Allow

/events/*/share_preview

Allow

/jobs/*/share_preview

Allow

/employers

Allow

/job_role_groups

Allow

/questions

Allow

/favicon-32x32.png

Allow

/favicon-16x16.png

Allow

/favicon.png

Allow

/favicon.ico

Allow

/profiles/*

Disallow

/profiles/*/posts

Disallow

/

Back to top

Comments

See http://www.robotstxt.org/wc/norobots.html for documentation on how to use the robots.txt file
A basic robots.txt file which allows specific pages and regex matches of pages but disallows
every other page from scraping, for all user agents.

Back to top

app.joinhandshake.co.ukrobots.txt

Resource Scan

Scan Details

Last Scan

Groups

*

Comments

app.joinhandshake.co.uk
robots.txt