Salut Rémi,
I guess we need a periodic job that tries to fetch all the URLs and spits out a list of URL with problems. Of course, that list must be reviewed by humans... :-\
(I am doing this exact thing for another (very small) project and a weekly check of a few hundred links gives a low one-digit number of things to fix each week. From websites that simply dissapear to new domain names... you get everything.)
Rgds Roman
Quoting Rémi Bovard remi.bovard@gmail.com:
Bonsoir à tous, Comme certains d’entre vous l’ont remarqué, j’ai ajouté `http://` aux valeurs des attributs `website` qui ne commençaient pas par `http://`. Une discussion sur un de mes changeset a commencé [1] et je pense judicieux de la continuer ici. En premier lieu je tiens à m’excuser ne pas avoir notifié la mailing list de mes intentions comme la mentionné datendelphin. D’autre part, comme indiqué dans les commentaires du changeset, je n’ai pas contrôlé les URL une par une mais reproduit le comportement que faisaient certains clients (p. ex. osm.org) en ajoutant `http://` aux valeurs qui n’avaient aucun schéma de défini pour respecter la synthaxe des URL [2]. De ce fait, les valeurs qui étaient incorrectes avant le sont toujours après mes modifications (mais par contre les liens qui ne commençaient pas par `www.` sont maintenant cliquables dans ces mêmes clients). A ce sujet, datendelphin m’a fait part en privé par email que plusieurs sites ne sont pas atteignables, à cause de typos (wwe.aesop.com) ou des valeurs incohérentes (`-` qui devient`http://-%60). Donc pour aller au fond de ma démarche, qui était d’améliorer les valeurs saisies dans `website`, est-ce que vous voyez un moyen pour régler les deux principaux problèmes qui sont :
- Le site n’existe pas ou plus (HTTP 40x?)
- Le site est accessible en `https` (HTTP 301?)
Merci d’avance pour vos suggestions et bonne soirée. Rémi
[1] https://www.openstreetmap.org/changeset/55231745 [2] https://wiki.openstreetmap.org/wiki/Key:website#Format