itcc.uni-koeln.de
robots.txt

Robots Exclusion Standard data for itcc.uni-koeln.de

Resource Scan

Scan Details

Site Domain itcc.uni-koeln.de
Base Domain uni-koeln.de
Scan Status Ok
Last Scan2025-12-10T18:38:29+00:00
Next Scan 2025-12-17T18:38:29+00:00

Last Scan

Scanned2025-12-10T18:38:29+00:00
URL https://itcc.uni-koeln.de/robots.txt
Domain IPs 134.95.81.57, 2a00:a200:0:2:0:70:6970:7069
Response IP 134.95.81.57
Found Yes
Hash 33e63b616f25a58eb56efc375a0d055ce289c799485a38ea179cbefaece48a61
SimHash c85a46c06bf9

Groups

*

Rule Path Comment
Disallow /t3lib/ -
Disallow /typo3/ -
Disallow /typo3-src/ -
Disallow /typo3temp/ -
Allow /fileadmin/media/ -
Allow /sites -
Disallow /*cHash -
Disallow /*%26type%3D Deaktiviert Alternative Templates
Disallow /*?type= Deaktiviert Alternative Templates
Disallow /*?no_cache=1 Deaktiviert Seiten ohne Cache
Disallow /*%26no_cache%3D1 Deaktiviert Seiten ohne Cache
Disallow /*%26L%3D Deaktiviert Seiten mit expliziter nennung der SprachID
Disallow /*?L= Deaktiviert Seiten mit expliziter nennung der SprachID

Other Records

Field Value
sitemap https://itcc.uni-koeln.de/sitemap.xml
sitemap https://itcc.uni-koeln.de/en/sitemap.xml

Warnings

  • 2 invalid lines.