Quelles différences entre les plateformes open data ?

Emmanuel Jakobowicz actualités 0 Comments

La mise en place d’une politique open data doit se faire avec des moyens adaptés. La plateforme de partage des données en est un élément central.

Avec la généralisation de l’ouverture des données dans les administrations et dans les services publics, de nombreux décideurs se posent des questions sur la stratégie à observer concernant les plateformes open data et les outils de gestion des données. En effet, une politique d’ouverture des données fait apparaître de nombreux challenges dont le choix d’une plateforme open data reste un point important.

L’open data est une formidable opportunité pour les citoyens de mieux comprendre leurs institutions et leurs actions, si les données mises à disposition le sont dans les meilleures conditions. Sinon, il n’y aurait aucun bénéfice à avoir effectué ce long processus. Car autant être honnête, la mise en place d’une stratégie open data demande des investissements et des réflexions de fond.

En France, ces derniers mois, une accélération notable du nombre de projets open data fait ressortir une grande disparité dans les outils pour la mise en oeuvre de ces projets. Je vous propose un petit tour d’horizon des principales plateformes open data et de leur mise en place.

CKAN : la solution libre

Une solution libre avec une communauté active est la solution bien souvent préférée par les « gros » sites comme data.gouv.fr. Reste le problème de l’hébergement qui doit être assuré indépendamment de la plateforme. Des combinaisons avec WordPress ou Drupal sont possibles pour assurer un hébergement et une interface plus conviviale.

On trouve de nombreux exemples de sites open data qui utilisent CKAN ici : http://ckan.org/instances/
C’est clairement la solution préférée des sites gouvernementaux avec comme représentant les données ouvertes des Etats-Unis (data.gov) et celles du Royaume-Uni (data.gov.uk) ou encore celles de la France (data.gouv.fr). Voir l’article sur les 10 sites de référence de l’open data.

CKAN

Besoin de conseils pour choisir ?

STAT4DECISION vous conseille et vous oriente pour la mise en place de votre politique open data et pour le choix des outils. N'hésitez pas à nous contacter !

Travaillons ensemble !

Vous voulez en savoir plus ?

Cliquez tout de suite !

D’un point de vue technique, CKAN est un logiciel libre donc le code source est accessible et modifiable, il s’agit de code en Python pour le backend et de JavaScript pour la partie interface. Des technologies de gestion de données type PostgreSQL ou SQLAlchemy sont utilisées.

La mise en place peut être rapide mais la personnalisation et l’optimisation demande plus d’investissement qu’une solution clé en main. Une communauté de développeurs conséquente assure une évolution constante de la technologie et des outils.

En dehors des outils de recherche, de visualisation, de cartographie classiques, CKAN propose aussi des extensions externes qui sont rassemblées sur ce site : https://github.com/ckan/ckan/wiki/List-of-extensions
Il s’agit généralement d’extensions disponibles sur des sites importants qui ont été programmées par les équipe de ces sites.

CKAN est donc une solution non hébergée (même si des solutions payantes hébergées sont proposées sur le site) qui sera adaptée à une grosse quantité de jeux de données.

CKAN – The open source data portal software

Socrata : le leader outre Atlantique

Socrata se différencie de CKAN par le fait qu’il s’agit d’une solution commerciale hébergée. Sur le marché américain, il s’agit du leader incontesté des offres payantes avec notamment comme client les villes de New York et San Francisco (dont j’ai parlé dans l’article les 10 sites de référence de l’open data).

Les produits Socrata sont des produits propriétaires basés sur des technologies open source telles que PostgreSQL, MongoDB, Elasticsearch, Angular, D3.js, et Chef. Le marketplace permet de mettre à la disposition de tous des applications utilisant les données ouvertes.

Socrata

La cible visée est clairement nord-américaine et les produits proposés sont orientés open source.

Malheureusement, aucun détails sur leurs tarifs ne sont disponibles. De plus, pour des clients francophones, peu d’adaptations semblent proposées.

Socrata – The data expertience company.

OpenDataSoft : le français qui monte

C’est la solution française ! Il s’agit d’une solution hébergée tout en un qui vous évite d’avoir à gérer des installations et des aspects trop techniques. L’inconvénient de ce type de solution est le manque de personnalisation et le coût récurrent lié à un abonnement.

OpenDataSoft

L’équipe d’OpenDataSoft est jeune et réactive ce qui assure une bonne maintenance et des nouveautés fréquentes. Il s’agit d’une start-up en pleine expansion.

On pourra regretter l’absence d’extensions « externes » mais les visualisations existantes permettent déjà de nombreuses utilisations des données. De plus, un système d’API pour réutiliser les données dans des applications est mis à disposition.

OpenDataSoft est une solution adaptée si vous voulez être accompagné dans toutes les étapes de votre politique open data. Leurs principaux clients sont français, notamment la mairie de Paris, la SNCF et bien d’autres.

Ils présentent de nombreux cas pratiques sur leur site.

OpenDataSoft – Valorisez vos données.

Junar : une alternative à Socrata

Junar se concentre sur deux marchés, les Etats-Unis et l’Amérique du Sud. Avec de nombreux gouvernement latino-américains et quelques grandes villes des Etats-Unis.

Junar

Il s’agit d’un service clé en main avec hébergement et outils de gestion des données. Assez peu de détails techniques sont fournis sur l’infrastructure.

Ce sont les seuls à proposer un tarif très clair (200 USD par mois pour 50GB de stockage et 250 GB de bande passante). Il s’agit d’une solution tout-en-un avec l’hébergement. Leurs serveurs sont des serveurs AWS et ils hébèrgent les portails open data de villes telles Palo Alto ou Sacramento.

Comme les autres plateformes, Junar propose une API pour les développeurs et permet l’utilisation de données dans de nombreux formats.

Le marché français ne semble pas être une priorité pour cette petite start-up.

Junar – The open data platform.

Comment choisir ?

Le choix d’une solution doit se faire après une étude complète des besoins, des ressources et des attentes concernant votre site open data. Les sites Internet des plateformes présentées plus haut regorgent de conseils et d’exemples qui vous seront d’une grande aide.

Faut-il donc opter pour une solution open source libre ou des solutions propriétaires en SaaS ? Outre l’aspect politique de ce choix, il faut prendre en compte tous les paramètres techniques, financiers et humains pour répondre à cette question.

Besoin de conseil ?

Nous vous aidons à définir votre politique open data et à mettre en place votre plateforme.

Laissez-vous guider!

Définissons ensemble vos priorités et une roadmap détaillée.

En savoir plus

Deux principaux cas se présenteront :

  • Vous possédez beaucoup de jeux de données qui devront être mis à jour fréquemment. Vous serez obligé de recruter du personnel compétent pour assurer la maintenance de votre plateforme.
    • Une solution open source vaudra la peine, à condition de posséder un système d’hébergement efficace.
  • Vous êtes une petite structure avec peu de jeux de données et besoin d’une solution rapidement.
    • Une solution hébergée tout en un sera souvent plus adaptée. Pour ce cas, la solution française a ma préférence.

Vos remarques, commentaires et compléments d’informations sont les bienvenus.

N’hésitez pas à nous consulter si vous voulez plus de détails.

Partager cet article

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *