borkenerzeitung.de
robots.txt

Robots Exclusion Standard data for borkenerzeitung.de

Archived Snapshots

Resource Scan

Scan Details

Site Domain	borkenerzeitung.de
Base Domain	borkenerzeitung.de
Scan Status	Ok
Last Scan	2024-07-04T01:45:15+00:00
Next Scan	2024-07-11T01:45:15+00:00

Last Scan

Scanned	2024-07-04T01:45:15+00:00
URL	https://borkenerzeitung.de/robots.txt
Redirect	https://www.borkenerzeitung.de/robots.txt
Redirect Domain	www.borkenerzeitung.de
Redirect Base	borkenerzeitung.de
Domain IPs	217.182.187.119
Redirect IPs	217.182.187.119
Response IP	217.182.187.119
Found	Yes
Hash	84c93a99e4ad93b027296be9becfaa94f7c920c9a84c35af05edc600f894c90c
SimHash	117ed890cfb6

Groups

*

Rule	Path
Disallow	/User
Disallow	/Dateien
Disallow	/ScriptResource
Disallow	/WebResource
Disallow	/verlag/Template-kimeta

Rule

Path

Disallow

/User

Disallow

/Dateien

Disallow

/ScriptResource

Disallow

/WebResource

Disallow

/verlag/Template-kimeta

gptbot

Rule	Path
Disallow	/

Rule

Path

Disallow

/

ccbot

Rule	Path
Disallow	/

Rule

Path

Disallow

/

Other Records

Field	Value
crawl-delay	2

Field

Value

crawl-delay

2

Back to top

Comments

Robots.txt for crawler
Disallow Crawler
Crawler often creates invalid script/webresource resource request
Max crawler Time per page in sec
Sitemap
Sitemap: https://www.borkenerzeitung.de.de/Sitemap/Sitemap_Index.xml.gz
Die J. Mergelsberg GmbH & Co. KG behÃ¤lt sich eine Nutzung ihrer Inhalte fÃ¼r kommerzielles Text und Data Mining im Sinne von Â§ 44b UrhG ausdrÃ¼cklich vor. FÃ¼r den Erwerb eines entsprechenden Nutzungsrechts wenden Sie sich bitte an verlag@borkenerzeitung.de.

Back to top

borkenerzeitung.derobots.txt

Resource Scan

Scan Details

Last Scan

Groups

*

gptbot

ccbot

Other Records

Comments

borkenerzeitung.de
robots.txt