social.ersei.net
robots.txt

Robots Exclusion Standard data for social.ersei.net

Archived Snapshots

Resource Scan

Scan Details

Site Domain	social.ersei.net
Base Domain	ersei.net
Scan Status	Ok
Last Scan	2024-10-01T08:25:16+00:00
Next Scan	2024-10-31T08:25:16+00:00

Last Scan

Scanned	2024-10-01T08:25:16+00:00
URL	https://social.ersei.net/robots.txt
Domain IPs	128.210.6.106, 2607:ac80:303:102:638a:ba7f:2013:b0c
Response IP	128.210.6.106
Found	Yes
Hash	196906bcc35d6862892485fec7ce46fdf11622bc47b8535b7eda5a027e328a7d
SimHash	742edb5ca484

Groups

adsbot-google
amazonbot
anthropic-ai
applebot-extended
bytespider
ccbot
chatgpt-user
claudebot
claude-web
cohere-ai
diffbot
facebookbot
friendlycrawler
google-extended
googleother
gptbot
imagesiftbot
img2dataset
omgili
omgilibot
perplexitybot
youbot

Rule	Path
Disallow	/

Rule

Path

Disallow

/

awariorssbot
awariosmartbot
dataforseobot
magpie-crawler
meltwater
peer39_crawler
peer39_crawler/1.0
piplbot
scoop.it
seekr

Rule	Path
Disallow	/

Rule

Path

Disallow

/

wellknownbot

Rule	Path
Disallow	/

Rule

Path

Disallow

/

*

Rule	Path
Disallow	/api/
Disallow	/auth/
Disallow	/oauth/
Disallow	/check_your_email
Disallow	/wait_for_approval
Disallow	/account_disabled
Disallow	/signup
Disallow	/.well-known/
Disallow	/fileserver/
Disallow	/users/
Disallow	/emoji/
Disallow	/admin
Disallow	/user
Disallow	/settings/
Disallow	/about/suspended

Rule

Path

Disallow

/api/

Disallow

/auth/

Disallow

/oauth/

Disallow

/check_your_email

Disallow

/wait_for_approval

Disallow

/account_disabled

Disallow

/signup

Disallow

/.well-known/

Disallow

/fileserver/

Disallow

/users/

Disallow

/emoji/

Disallow

/admin

Disallow

/user

Disallow

/settings/

Disallow

/about/suspended

Other Records

Field	Value
crawl-delay	500

Field

Value

crawl-delay

500

Back to top

Comments

GoToSocial robots.txt -- to edit, see internal/web/robots.go
More info @ https://developers.google.com/search/docs/crawling-indexing/robots/intro
AI scrapers and the like.
https://github.com/ai-robots-txt/ai.robots.txt/
Marketing/SEO "intelligence" data scrapers
Well-known.dev crawler. Indexes stuff under /.well-known.
https://well-known.dev/about/
Rules for everything else.
API endpoints.
Auth/Sign in endpoints.
Well-known endpoints.
Fileserver/media.
Fedi S2S API endpoints.
Settings panels.
Domain blocklist.

Back to top

social.ersei.netrobots.txt

Resource Scan

Scan Details

Last Scan

Groups

adsbot-googleamazonbotanthropic-aiapplebot-extendedbytespiderccbotchatgpt-userclaudebotclaude-webcohere-aidiffbotfacebookbotfriendlycrawlergoogle-extendedgoogleothergptbotimagesiftbotimg2datasetomgiliomgilibotperplexitybotyoubot

awariorssbotawariosmartbotdataforseobotmagpie-crawlermeltwaterpeer39_crawlerpeer39_crawler/1.0piplbotscoop.itseekr

wellknownbot

*

Other Records

Comments

social.ersei.net
robots.txt

adsbot-google
amazonbot
anthropic-ai
applebot-extended
bytespider
ccbot
chatgpt-user
claudebot
claude-web
cohere-ai
diffbot
facebookbot
friendlycrawler
google-extended
googleother
gptbot
imagesiftbot
img2dataset
omgili
omgilibot
perplexitybot
youbot

awariorssbot
awariosmartbot
dataforseobot
magpie-crawler
meltwater
peer39_crawler
peer39_crawler/1.0
piplbot
scoop.it
seekr