aachener-zeitung.de
robots.txt

Robots Exclusion Standard data for aachener-zeitung.de

Resource Scan

Scan Details

Site Domain aachener-zeitung.de
Base Domain aachener-zeitung.de
Scan Status Failed
Failure StageFetching resource.
Failure ReasonServer returned a client error.
Last Scan2024-10-27T17:56:19+00:00
Next Scan 2025-01-25T17:56:19+00:00

Last Successful Scan

Scanned2023-04-07T11:58:53+00:00
URL https://aachener-zeitung.de/robots.txt
Redirect https://www.aachener-zeitung.de/robots.txt
Redirect Domain www.aachener-zeitung.de
Redirect Base aachener-zeitung.de
Domain IPs 212.117.76.83
Redirect IPs 104.18.24.83, 104.18.25.83, 2606:4700::6812:1853, 2606:4700::6812:1953
Response IP 104.18.25.83
Found Yes
Hash c4979b142b63f3c36312bf9a05e710ce19118000ffad639fb9a4907281ebceb4
SimHash 7b681d29c197

Groups

*

Rule Path Comment
Disallow /check_area/ -
Disallow /app/ -
Disallow /*archiv/ -
Disallow /*-55153203$ zugefügt am: 2020-12-11 16:26
Disallow /*-55153201$ zugefügt am: 2020-12-11 16:26
Disallow /*-38936487$ zugefügt am: 2019-05-22 09:46
Disallow /*-38936485$ zugefügt am: 2019-05-22 09:46

Other Records

Field Value
sitemap https://www.aachener-zeitung.de/sitemap.xml
sitemap https://www.aachener-zeitung.de/zva/data/sitemap_termine_az.xml.gz