www.media.mit.edu
robots.txt

Robots Exclusion Standard data for www.media.mit.edu

Archived Snapshots

Resource Scan

Scan Details

Site Domain	www.media.mit.edu
Base Domain	mit.edu
Scan Status	Ok
Last Scan	2024-09-23T01:16:42+00:00
Next Scan	2024-10-23T01:16:42+00:00

Last Scan

Scanned	2024-09-23T01:16:42+00:00
URL	https://www.media.mit.edu/robots.txt
Domain IPs	18.27.74.51
Response IP	18.27.74.51
Found	Yes
Hash	10a36e552c92072c52ec93934c014f490dc4cee216c323283b47438ac8137c14
SimHash	515bec12e58b

Groups

ut-dorkbot

Rule	Path
Disallow	/

Rule

Path

Disallow

ut-dorkbot/1.0

Rule	Path
Disallow	/

Rule

Path

Disallow

openvas

Rule	Path
Disallow	/

Rule

Path

Disallow

openvas

Rule	Path
Disallow	/

Rule

Path

Disallow

*

Rule	Path
Disallow	/admin/
Disallow	/api/
Disallow	/breadcrumb/
Disallow	/csrf/
Disallow	/dam/
Disallow	/dashboard/
Disallow	/entities/
Disallow	/flower/
Disallow	/form-raw/
Disallow	/forms/
Disallow	/hijack/
Disallow	/projects/list/
Disallow	/search/

Rule

Path

Disallow

/admin/

Disallow

/api/

Disallow

/breadcrumb/

Disallow

/csrf/

Disallow

/dam/

Disallow

/dashboard/

Disallow

/entities/

Disallow

/flower/

Disallow

/form-raw/

Disallow

/forms/

Disallow

/hijack/

Disallow

/projects/list/

Disallow

/search/

Other Records

Field	Value
crawl-delay	30

Field

Value

crawl-delay

www.media.mit.edurobots.txt

Resource Scan

Scan Details

Last Scan

Groups

ut-dorkbot

ut-dorkbot/1.0

openvas

openvas

*

Other Records

www.media.mit.edu
robots.txt