portal.uni-koeln.de
robots.txt

Robots Exclusion Standard data for portal.uni-koeln.de

Resource Scan

Scan Details

Site Domain portal.uni-koeln.de
Base Domain uni-koeln.de
Scan Status Ok
Last Scan2025-10-05T18:15:59+00:00
Next Scan 2025-10-19T18:15:59+00:00

Last Scan

Scanned2025-10-05T18:15:59+00:00
URL https://portal.uni-koeln.de/robots.txt
Redirect https://www.uni-koeln.de/robots.txt
Redirect Domain www.uni-koeln.de
Redirect Base uni-koeln.de
Domain IPs 134.95.81.52, 2a00:a200:0:2::80
Redirect IPs 134.95.81.52, 2a00:a200:0:2::80
Response IP 134.95.81.52
Found Yes
Hash e31d59440f10a69629888641c309a0fd94471005ee6d44daed59ee8ef3ed2855
SimHash a8658b20a7c2

Groups

*

Product Comment
* All other spiders should avoid
Rule Path Comment
Disallow /cgi-bin/ Script files
Disallow /bin2/ Script files
Disallow /bin3/ Script files
Disallow /kurs-bin/ Script files
Disallow /htdig/ Script files
Disallow /admin/ -
Disallow /experimente/ -
Disallow /intern/ -
Disallow /extern/ -
Disallow /kiosk/ -
Disallow /rrzk/org/mitarbeiter/ -
Disallow /wiso-fak/szyperski/intern/ -
Disallow /phil-fak/phil/org/aktuell.htm -
Disallow /med-fak/auge/mitarbeiter.html -
Disallow /rrzk/software/fachspezifisch/Biologie-Genetik/wispact/ -
Disallow /google-suche -
Disallow /tr/ -
Disallow /fr/ -
Disallow /ar/ -
Disallow /es/ -
Disallow /rrzk/Abt-Systeme/ -
Disallow /rrzk/systeme/SFgate/ -
Disallow /rrzk/systeme/WWW/ -
Disallow /rrzk/systeme/cgi-bin/ -
Disallow /rrzk/systeme/dec/ -
Disallow /rrzk/systeme/hp/ -
Disallow /rrzk/systeme/htbin/ -
Disallow /rrzk/systeme/ibm/ -
Disallow /rrzk/systeme/intern/ -
Disallow /rrzk/systeme/microsoft/ -
Disallow /rrzk/systeme/nt/ -
Disallow /rrzk/systeme/os2/ -
Disallow /rrzk/systeme/sgi/ -
Disallow /rrzk/systeme/sun/ -
Disallow /rrzk/systeme/archiv -
Disallow /rrzk/systeme/linux/infos/howto -
Disallow /rrzk/server/sundoku/ -
Disallow /rrzk/software/dtp/tex/lokal/doc -
Disallow /rrzk/software/tv/tex/lokal/doc -
Disallow /rrzk/software/textverarbeitung/tex/lokal/doc -
Disallow /multimedia-tag/ -
Disallow /allgemeines/veranstaltungen/multimedia-tag/ -
Disallow /dienste/stat/mon/ -
Disallow /wiso-fak/wisostatsem/skripte 1.6.04 fuer Christoph Scheicher
Disallow /wiso-fak/wisostatsem/hauptstudium scheicher@statistik.uni-koeln.de
Disallow /wiso-fak/wisostatsem/grundstudium -
Disallow /ew-fak/Paeda 16.6. fuer Matthias Kleinow
Disallow /ew-fak/Allg_paeda kleinow@t-online.de

ia_archiver

Rule Path Comment
Disallow /wiso-fak/wisostatsem 25.5.04 fuer Christoph Scheicher
Disallow /med-fak/zahn/vorklinik 1.2.05 SW wegen Rekursion, 24.3.05 CO

nuclei

Rule Path
Disallow /

gptbot

Rule Path
Disallow /universitaet/aktuell/
Disallow /en/university/news/
Disallow /en/universitaet/aktuell/
Disallow /forschung/forschungsmeldungen/suche-und-archiv/
Disallow /sites/international/

Comments

  • robots.txt for http://www.uni-koeln.de/
  • see <http://www.robotstxt.org/wc/robots.html> for an explanation.
  • Die Custom-Google-Suche wieder neu zu indizieren hätte etwas von
  • Rekursion.
  • Sprachversionen, die es nie gegeben hat, die aber leider zumindest
  • zeitweise im HTML-Code der Startseite von www.uni-koeln.de angepriesen wurden.
  • Urspruengliche Komplettblockade zunaechst zumindest fuer Linux-
  • und Microsoft-Doku aufgehoben. CO, 14.07.2005
  • WH 2021-06-01, Nach Brute-Force-Angriff
  • WH, 2025-08-29, ChatGPT und der Abruf uralter Pressemeldungen und Co. vom
  • TYPO3-Server (pressestelle)