Les grandes villes françaises n’aiment pas les réutilisateurs mécaniques

Le projet :
Paris, Toulouse, Nantes ou Le Mans ont tous lancé leurs propres plateformes OpenData donnant accès aux données publiques de ces villes.

Le problème :
Si ces plateformes respectent généralement les principes de base de l’OpenData notamment en termes de licence ou de formats, l’accessibilité, notamment par des machines, ne semble pas vraiment prise en considération : sur toutes ces plateformes, pour pouvoir télécharger les données, il faut valider manuellement l’acceptation de la licence en cochant une case dans son navigateur. Cela crée une discrimination technologique en empêchant toute automatisation de l’accès aux données par les machines. La réutilisation mécanique est pourtant source de l’esprit de l’OpenData.

La solution :
- Placer sur les pages de téléchargement des données un lien explicite clair vers la licence et retirer les modules de validation de licence.

La SNCF veut réécrire à sa sauce les licences existantes

Le projet :
Suite à notre article du 27/03/12, data.sncf.com a déclaré par le biais d’un commentaire  que : « La licence proposée avec les premiers jeux de données n’est pas définitive. Le département juridique se penche sur une version d’une licence ODbL ». En effet, la sortie d’une nouvelle « licence OpenData SNCF » a été annoncé sur le forum consacré.

Le problème :
Le département juridique est en train de réécrire complètement sa propre version de la licence ODbL… S’inspirer de cette licence libre puis la remanier de fond en comble en gardant la mention « ODbl » n’en fait pas une nouvelle ODbL mais simplement une nouvelle licence créant des risques sérieux d’incompatibilité avec les autres, notamment avec son chapitre consacré à la propriété intellectuelle. Pourquoi réinventer la roue ?

La solution :
- Adopter une licence Open Data existante sans la réécrire. La dernière traduction en droit français en date de l’ODbL est disponible à cette adresse.

Le budget du CNN en PDF – image

Le projet :
Le Conseil National du Numérique continue à revendiquer dans sa rubrique Organisation la pratique de l’OpenData et a ajouté suite aux premières critiques plus d’informations sur ses données budgétaires.

Le problème :
Le CNN ne semble toujours pas avoir compris les bases de l’OpenData, à savoir la réutilisabilité des données. Outre des données chiffrées au fil d’un article dans une page web, les nouvelles données budgétaires proposées sont, comme à Saint-Quentin, au format PDF scanné, pas même passé à l’OCR et donc non-copiable.

La prochaine étape sera-t-elle un scan de l’agenda papier du CNN ?

La solution :
- Toujours mettre les données sous une licence ouverte et dans un format ouvert et réutilisable

Data.VisitProvence.com ne veut pas de réutilisateurs

Mise-à-jour (16h50 04/04/12) : Le site est passé en licence ODbL. Belle réactivité et bienvenue donc :-) !!!

Le projet :
L’agence Bouches-du-Rhône Tourisme libère ses données sur son nouveau site VisitProvence OpenData et explique dans sa Foire Aux Questions : « Un citoyen, un chercheur, un développeur amateur ou professionnel, un institutionnel, une association, ou une entreprise… C’est pour vous que Bouches-du-Rhône Tourisme libère ses données. »

Le problème :
Au premier abord, il est difficile d’identifier la licence sous laquelle les données sont proposées. On finit par la trouver individuellement sur chaque jeu de données. Et c’est là que l’on découvre : Creative-Commons, Paternité, Pas d’Utilisation Commerciale, Pas de Modification, 2.0 (CC-By-Nc-Nd 2.0).

En interdisant de modifier ses données, VisitProvence se coupe de toute réutilisation par quiconque souhaitant enrichir son travail d’autres données. La clause Non-Commerciale vient par ailleurs en totale contradiction avec le message introductif : quelle entreprise fera un usage « non-commercial » des données ? Enfin les licences Creative Commons dans leurs versions 1 à 3 ne sont pas prévues pour les bases de données et sont donc légalement très mal adaptées, comme en témoignent les efforts de la Fondation Creative Commons pour corriger cela dans une future version 4.

Data.VisitProvence n’a visiblement pas encore tout compris à l’Open Data…

Pour l’anecdote, il est assez amusant de noter qu’à chaque jeu de données est associé un différent fichier PDF de 2Mo du même scan de travers de la licence CC-BY-NC-ND :

http://data.visitprovence.com/uploads/tx_moduledonnees//licence_CC_41.pdf
http://data.visitprovence.com/uploads/tx_moduledonnees//licence_CC_42.pdf
http://data.visitprovence.com/uploads/tx_moduledonnees//licence_CC_43.pdf

Avec 49 jeux de données proposés en ligne, cela fait donc déjà près de 100Mo d’hébergement pour les fichiers de licence !

La solution :
- Adopter une licence Open Data, c’est-à-dire sans discrimination des usages notamment commerciaux, en utilisant par exemple une licence libre comme l’Open Database Licence (ODbL) ou la Licence Ouverte (LO).
- Appliquer cette licence globalement à la plateforme plutôt que d’uploader N fois le même fichier.

Home’n'Go : TechCrunch voit de l’OpenData partout

Le projet :
Home’nGo est un service web d’aide à la recherche d’appartements proposant aux utilisateurs des informations détaillées sur le marché immobilier. TechCrunch le qualifie ainsi d’ « une des premières startups utilisant l’Open Data ».

Le problème :
Contrairement à ce que la rubrique « Données publiques / Open Data » affirme (« Home’n’go met à votre disposition de très nombreux jeux de données contextualisées »), on ne peut trouver nulle trace où que ce soit d’un accès aux dits jeux de données.

On trouve bien une fois enregistré sur le site de jolies visualisations de résultats électoraux ou de cours immobilier, mais s’il s’agit effectivement de réutilisation d’OpenData, la mention des sources manque cruellement. Est-ce bien légal ? Cela ne respecte assurément pas les critères de la Licence Ouverte sous laquelle sont placés les jeux de données correspondants sur data.gouv.fr…

La solution :
- Citer les sources
- Proposer les données visualisées au téléchargement en csv