Posts Tagged 'bases de données'

Que fait l’IGN pour les journalistes de données ?

Bookmark and Share

Commençons par le début : pour faire du journalisme de données, il faut des bases de données. Le premier enjeu du database journalism, avant le modèle économique ou le webdesign, c’est donc l’ouverture des données publiques. Car si les journalistes peuvent collecter eux-mêmes certaines données, ils ont nécessairement besoin, pour les traiter, de bases documentaires existantes.

En effet, la production de sens naît souvent de la confrontation entre deux ou plusieurs bases de données. Le crime mapping, par exemple, met en relation des données géographiques (délimitation des rues et des quartiers) et des données policières (listes de délits) ; de même, le New York Times a mis en parallèle des données sociodémographiques et des données économiques pour produire sa très belle infographie montrant les inégalités face au chômage selon la race, le sexe, l’âge et le niveau de formation.

En France, les principales bases de données géographiques sont détenues par l’IGN (Institut géographique national) et sont accessibles via le site Web de l’établissement public ou via son géoportail. Ce géoportail permet de naviguer en 2D ou en 3D sur des photos aériennes, des cartes et des données géographiques sur l’ensemble du territoire français. Ouvert en 2006, il s’inscrit dans le cadre de la directive européenne INSPIRE (Infrastructure for Spatial Information in the European Community) visant à favoriser la production et l’échange de données géographiques entre Etats membres de l’Union.

L’IGN détient, pour l’ensemble du territoire métropolitain et les départements d’Outre-mer, des bases de données relatives :

– au relief sur la France

– à l’orthophotographie (images aériennes ou satellitales de la surface de la Terre rectifiées géométriquement)

– à l’information cadastrale

– aux adresses

– aux réseaux routiers

– aux limites administratives

– aux toponymes

L’IGN conserve aussi des bases de données géographiques à l’échelle de l’Union européenne

Parmi toutes ces données, certaines sont gratuites, librement exportables, d’autres nécessitent le paiement d’une licence, d’autres encore sont accessibles gratuitement mais sous forme d’échantillon.

Les bases de données librement accessibles en format numérique concernent :

– le référentiel du relief sur la France décrivant la forme du terrain à différentes échelles

– le réseau hydrographique français

– la description de l’ensemble des unités administratives françaises

– le Répertoire Géographique des Communes

– la carte routière 901 IGN sous forme de dalles géoréférencées

– les contours délimitant le monde terrestre et le monde marin

Par ailleurs, l’IGN met à disposition sur son site des fiches techniques de géodésie et de nivellement ainsi que toutes les données issues des différentes stations du Réseau GPS Permanent (RGP).

Les photos aériennes sont également consultables et seront bientôt téléchargeables gratuitement ou à un très bas prix.

Enfin, le géoportail teste une API JavaScript qui permet d’incorporer dans son site Internet des cartographies dynamiques superposant plusieurs couches de données (cartes IGN, photographies aériennes, parcelles cadastrales, routes, bâtiments, limites administratives, réseau hydrographique, réseau ferroviaire…)

Pour le moment, l’API Géoportail est en phase de bêta test, donc téléchargeable gratuitement. A l’avenir, elle nécessitera de souscrire à un contrat spécifique, même si 100 000 pages vues gratuites seront accordées aux sites Internet grand public.

Malgré tout, hors de ces données en accès libre, il faut, pour utiliser les bases de données les plus importantes, acheter une licence coûteuse.

Que conclure à l’issue de cet exposé ?

Les bases de données fournies gratuitement par l’IGN suffisent-elles pour la majorité des cartographies ?

Finalement, qu’offre l’IGN de plus par rapport à ce que Google Map donne déjà ?

N’ayant jamais réalisé de cartographie moi-même, je n’ai pas la réponse à ces questions, mais je suis très curieuse de connaître vos opinions sur la question.

Creative Commons License

Publicités

Le database journalism pour nous sauver du « frogboiling »

Bookmark and Share


Ou pourquoi le database journalism s’oppose au journalisme traditionnel

GRENOUILLE 5

Pour ce quatrième post, il me semble plus que temps d’esquisser une définition de mon sujet d’étude : en une phrase, le database journalism, ou journalisme de données, consiste à exploiter des bases de données pour en extraire de l’information compréhensible par tous.

Actuellement, les médias traditionnels traitent l’actualité par le récit (stories), ils racontent des histoires. A l’opposé, le database journalism initie un traitement de l’actualité par les données (data). Autrement dit : un dessin vaut mieux qu’un long discours.

Pour ceux qui ne verraient pas d’emblée l’attrait des données par rapport aux récits, je vous renvoie au vibrant plaidoyer de Nicolas Vanbremeersch (aka Versac) sur slate.fr (Pour un journalisme de données). Il y revient sur l’impressionnante ascension de Contador à Verbier, lors du dernier Tour de France, et regrette qu’aucun journal n’ait donné de réponses chiffrées à des questions comme : où se situe Contador par rapport à la vitesse de montée moyenne des coureurs ? que représente sa montée en terme de puissance ? à quoi la comparer ?…

L’homme fait une montée record, et, le lendemain, dans la presse, rien d’autre que du commentaire. On ne donne même pas son temps d’ascension, ou uniquement sur de très rares — et étrangers — sites web. Seule prime l’information de base (il a gagné), et vient ensuite immédiatement le temps du commentaire.

[…] Nulle part, sur le web ou dans le papier, le quidam ne peut retrouver un tableau simple, disposant les données objectives de la montée de Verbier. Nulle part, sur un des plus grands événements internationaux, générant un volume de commentaires et hypothèses absolument énorme […], on ne peut jouer avec des données simples: durée de la montée, poids du coureur, puissance développée, VO2Max…

Le débat, sur ces bases, est faussé. »

Ainsi, des données bien mises en valeur et intelligemment agrégées peuvent être un meilleur moyen de traiter une actualité qu’un article rédigé. Un vrai « renversement de perspective » pour reprendre les termes de Nicolas Kayser-Bril (blogueur sur Window on the media). L’unité de base de l’activité journalistique, traditionnellement, c’est l’article (story); avec le journalisme de donnée, ça devient la base de données. Le commentaire et la narration sont secondaires, les données chiffrées priment. Là où les journalistes traditionnels pensaient en terme de récit, de signature, de titraille, de chapeau et d’accroche, il s’agit de rendre visible les mêmes phénomènes mais à travers le langage des nombres, des bases de données, de l’infographie, de la cartographie et autres visualisations.

« Newspapers need to stop the story-centric worldview », enjoignait déjà en 2006 le journaliste américain Adrian Holovaty, précurseur sur ce thème, dans un article-plaidoyer pour le journalisme de données A fundamental way newspaper need to change.

Journalisme traditionnel et journalisme de données reposent sur deux modèles opposés. Le blogueur Adina Levin le démontre bien dans son post Database journalism – a different definition of “news” and “reader”. Au fondement du journalisme traditionnel on trouve le vieil adage selon lequel les trains qui arrivent à l’heure n’intéressent personne (le modèle man bites dog, en anglais). Seuls les faits inattendus, les événements soudains, méritent d’apparaître dans les journaux. Il est rare qu’on y rende compte des petites évolutions, des dynamiques de long terme.

Cette suprématie de l’actualité chaude rend nos sociétés vulnérables au frogboiling avertit Adina Levin. Le concept est tiré d’une légende urbaine selon laquelle la grenouille dont l’eau du bocal se réchauffe graduellement s’habitue au changement de température. Elle ne saute pas hors du bocal, même quand l’eau se met à bouillir. D’où, mort de la grenouille. De la même façon, l’encombrement de telle ou telle route départementale ne sera pas perçu comme un problème, jusqu’à ce qu’un grave accident ne fasse les gros titres.

En opposition au journalisme traditionnel, le database journalism met justement en valeur les tendances de fond et leur donne un sens. Par une visualisation appropriée, des données compilées depuis des années peuvent raconter des histoires.

Sans vouloir dramatiser en accentuant le côté « nos vies sont en danger sans journalisme de données », je crois qu’il existe de réelles attentes pour un traitement de l’actualité par les chiffres. L’absence d’une telle démarche à destination du grand public suscite un manque d’autant plus grand que le nombre de données structurées disponible augmente constamment. Dans son article Demain, l’intelligence des données, Hubert Guillaud (InternetActu) démontre que la masse de données brutes accessible via Internet va être décuplée dans les prochaines années, grâce au développement des capteurs, puces RFID ou autres interfaces connectées.

Sans attendre jusque là, les administrations françaises mettent à disposition de nombreuses bases de données. Pour autant, quel journal nous a présenté une infographie intelligente pour faire sentir l’ordre de grandeur de la dette publique, ou le niveau d’étude moyen des dirigeants des établissements publics français ?

Assez d’articles, on veut des contenus !

Creative Commons License

Illustration : www.photo-libre.fr

Articles les plus consultés

Inscrivez votre adresse e-mail pour vous abonner à ce blog et être averti de mes nouveaux posts par e-mail

Rejoignez 25 autres abonnés

Sélection de liens

Contact :

goulard.caroline@gmail.com

Blog Stats

  • 34,248 hits

Visuel d'en-tête : Photos Libres