arthrolink.com
robots.txt

Robots Exclusion Standard data for arthrolink.com

Resource Scan

Scan Details

Site Domain arthrolink.com
Base Domain arthrolink.com
Scan Status Ok
Last Scan2025-10-29T00:18:26+00:00
Next Scan 2025-11-28T00:18:26+00:00

Last Scan

Scanned2025-10-29T00:18:26+00:00
URL https://arthrolink.com/robots.txt
Redirect https://www.arthrolink.com:443/robots.txt
Redirect Domain www.arthrolink.com
Redirect Base arthrolink.com
Domain IPs 35.71.163.53, 75.2.3.48
Redirect IPs 52.19.160.47, 52.210.156.82, 52.212.157.220
Response IP 52.212.157.220
Found Yes
Hash e1291569ededf04aaf3465418c4576d955f67d52cb7491a012906ef829612bd2
SimHash 619ead0ca792

Groups

*

Rule Path
Disallow /core/
Disallow /modules/
Disallow /profiles/
Disallow /libraries/
Disallow /README.txt
Disallow /web.config
Disallow /autoload.php
Disallow /update.php
Disallow /admin/
Disallow /comment/reply/
Disallow /filter/tips/
Disallow /node/add/
Disallow /search/
Disallow /node/
Disallow /index.php/admin/
Disallow /index.php/comment/reply/
Disallow /index.php/filter/tips/
Disallow /index.php/node/add/
Disallow /index.php/search/
Disallow /index.php/user/password/
Disallow /index.php/user/register/
Disallow /index.php/user/login/
Disallow /index.php/user/logout/
Disallow /es/radioteca/avanzada/
Disallow /fr/radiotheque/avancee/
Disallow /en/radiotheque/avancee/
Disallow /radiotheque/image/
Allow /core/*.css$
Allow /core/*.css?
Allow /core/*.js$
Allow /core/*.js?
Allow /core/*.gif
Allow /core/*.jpg
Allow /core/*.jpeg
Allow /core/*.png
Allow /core/*.svg
Allow /profiles/*.css$
Allow /profiles/*.css?
Allow /profiles/*.js$
Allow /profiles/*.js?
Allow /profiles/*.gif
Allow /profiles/*.jpg
Allow /profiles/*.jpeg
Allow /profiles/*.png
Allow /profiles/*.svg
Allow /sites/www.arthrolink.com/files/*.css$
Allow /sites/www.arthrolink.com/files/*.css?
Allow /sites/www.arthrolink.com/files/*.js$
Allow /sites/www.arthrolink.com/files/*.js?
Allow /sites/www.arthrolink.com/files/*.gif
Allow /sites/www.arthrolink.com/files/*.jpg
Allow /sites/www.arthrolink.com/files/*.jpeg
Allow /sites/www.arthrolink.com/files/*.png
Allow /sites/www.arthrolink.com/files/*.svg
Allow /sites/www.arthrolink.com/files/*.pdf
Allow /profiles/arthrolink/modules/custom/arthrolink_pvirt/patient.hyperesources/*

googlebot

Rule Path
Allow /

ai2bot
amazonbot
applebot-extended
anthropic-ai
blexbot
bytespider
ccbot
censysinspect
chatgpt-user
claudebot
claude-web
cohere-ai
diffbot
duckassistbot
ev-crawler
facebookbot
flyriverbot
gptbot
meta-externalagent
meta-externalagent
meta-externalfetcher
mj12bot
myeducationalcrawler
oai-searchbot
oi-crawler
perplexitybot
perplexitybot
seznambot
velenpublicwebcrawler

Rule Path
Disallow /

Other Records

Field Value
sitemap https://www.arthrolink.com/gsitemap.xml

Comments

  • 20/09/2025
  • Toute utilisation de nos contenus protégés autre qu'un usage strictement individuel (incluant notamment l'entraînement des grands modèles de langage (LLM),
  • l'entraînement des outils d'intelligence artificielle, la veille web ou le media monitoring) est conditionnée à la conclusion d'une licence d'utilisation
  • avec les laboratoires Expanscience. Nous vous invitons à cette fin à contacter contact@expanscience.com
  • Toute utilisation non-autorisée de nos contenus protégés est constitutive d'une contrefaçon de droit d'auteur et/ou du droit de producteur
  • de base de données et susceptible d'être poursuivie.
  • Il est interdit de crawler notre site web en utilisant un agent d'utilisateur (user agent) volé qui ne correspond pas à votre identité.
  • L'utilisation des robots d'indexation web ou d'autres méthodes automatiques de feuilletage ou de navigation sur ce site Web n'est pas autorisée.
  • Crawl-delay: 10
  • Directories
  • Files
  • Paths (clean URLs)
  • Disallow: /user/register/
  • Disallow: /user/password/
  • Disallow: /user/login/
  • Disallow: /user/logout/
  • Paths (no clean URLs)
  • radiotheque
  • CSS, JS, Images
  • Ressources Patient Virtuel
  • Disallow Rules for AI bots
  • Ajout du sitemap