Open Data : une mine d’or à exploiter ?
En quelques années, l’Open Data est devenu un sujet très à la mode. Tout le monde en parle, mais rares sont ceux qui savent vraiment de quoi il s’agit et encore plus rares sont ceux qui savent l’exploiter à sa juste valeur.
Plus qu’une compilation de données brutes, l’Open Data représente une formidable opportunité d’accéder et d’utiliser une masse d’informations quasiment infinie.
L’Open Data : qu’est-ce que c’est ?
L’Open Data (ou donnée ouverte) est le terme utilisé pour qualifier les données qui ont été rendues publiques par l’Etat, les collectivités publiques voire même les établissements ou entreprises privés. L’accès y est totalement libre et gratuit : il n’existe aucune contrainte juridique ni technique. L’Etat a par exemple lancé le site data.gouv.fr sur lequel les services publics publient certaines de leurs données, et où les citoyens peuvent y apporter leur contribution.
Par où commencer ?
Avant de se lancer, il y a une question fondamentale à se poser : quel est votre objectif final? Avec des milliards de données à disposition, leur exploitation et leur analyse peuvent se révéler très vite extrêmement chronophages, et l’analyste peut se retrouver submergé. En définissant clairement l’objectif de votre analyse vous pourrez isoler les informations dont vous avez vraiment besoin, les organiser et déterminer les analyses statistiques adaptées.
Il est donc primordial de bien réfléchir en amont à la valeur ajoutée que peut fournir l’utilisation de la base de données. Celle-ci doit se faire intelligemment en s’appuyant sur des critères sélectionnés à l’avance. Rappelez-vous que vous ne serez pas le seul à visualiser ces données. A vous donc de vous démarquer en proposant au final une analyse pertinente, innovante voire décalée.
Traduire l’Open Data pour le commun des mortels
L’Open Data vous donne accès à des données brutes. Leur lecture se révèle quasiment impossible en l’état pour les non-initiés. Au moment du traitement et de l’analyse, il faut penser à l’utilisateur final. Comment lui fournir une information unique, utile et de manière claire et compréhensible ?
Chez Senior Media, dans le cadre de l’étude des seniors par catégorie d’âge en France, nous avons opté pour une interface simple. L’internaute choisit :
– un département en cliquant sur une carte de France (ex : Allier),
– un type de statistique (ex : le nombre de Français âgés de 50 à 54 ans),
– une période (ex : entre 1980-2023).
Une fois la sélection effectuée, un graphique sous forme de courbes apparaît.
Plus qu’une représentation des données, nous offrons la possibilité aux acteurs de notre secteur de mieux connaître leur cible séniors au niveau local, et surtout pouvoir anticiper les évolutions. De quoi les aider dans leurs prises de décisions stratégiques.
Comment réutiliser ces données ouvertes ?
Exploiter l’Open Data demande de respecter des étapes incontournables. En premier lieu, la source des données qui doit être choisie avec précaution. La croiser avec d’autres bases paraît essentiel pour effectuer un comparatif et en analyser la qualité (ex : INSEE, Service-Public.fr, Office national des forêts, Ministère de la Culture et de la Communication, ATOUT FRANCE – Agence de développement touristique de la France …).
Dans notre étude, nous nous sommes penchés sur le nombre de Français ayant plus de 80 ans par département en France. Pour obtenir des résultats pertinents à l’échelle nationale et départementale, différentes bases ont été utilisées et retraitées. Nous avons ensuite fait des regroupements par typologie afin de donner des résultats structurés et atteindre l’objectif que nous visions : établir des prévisions. Nous avons utilisé la méthode SARIMA qui prend en compte les données du passé pour obtenir des projections futures.
Grâce à l’exploitation de ces données, nous avons pu anticiper une tendance majeure : l’arrivée prochaine de la génération du PapyBoom.
On constate actuellement une très forte croissance du nombre de personnes âgées de plus de 95 ans (+ 25 % en 2015). Il s’agit de cette vague du PapyBoom qui arrivera à l’âge de la retraite dans 5 à 10 ans. Mais nous sommes allés plus loin, nous avons évalué l’arrivée de cette vague du PapyBoom sur les prochaines années par tranche d’âge et par département. L’analyse a notamment révélé que le phénomène devrait se stabiliser d’ici 2020. Grâce à ces chiffres, les acteurs du secteur des seniors peuvent anticiper le marché sur le long terme.
« Grâce aux données, nous pouvons mieux comprendre l’évolution de notre cible. Notre volonté étant de créer des échanges, nous avons pris le parti de rendre nos analyses facilement accessibles au plus grand nombre. » précise Charles, le fondateur de Senior Media.
Découvrez notre carte dédiée à l’étude des seniors par catégorie d’âge en France.