Posts Tagged 'visualisation'

Nous lançons ActuVisu !

Enfin des nouvelles de mon grand projet à vous faire partager ! Nous lançons aujourd’hui notre marque d’information en ligne ActuVisu, et la page actuvisu.fr.

http://www.actuvisu.fr est un site de visualisation de l’actualité. Nous y publieront nos premières infographies interactives au début de l’été 2010.

J’en profite pour changer le nom du mon compte Twitter, qui devient @ActuVisu, et pour repeindre tout mon petit univers en ligne aux couleurs de notre logo.

Et j’ouvre une nouvelle page sur ce blog, totalement dédiée à ce projet, à son équipe, à notre démarche

Quatre voies du datajournalism

J’ai eu l’impression, ces derniers jours, de répéter plusieurs fois la même chose à des personnes différentes. (Ce qui est un vrai plaisir quand il s’agit de datajournalism). D’où l’idée d’articuler ici ces quelques éléments récurrents.

Finalement, le datajournalism ou journalisme de données, peut difficilement se résumer à un type de contenu ou à un type de démarche. J’ai identifié quatre dimensions, et pour chacune les compétences nécessaires à sa mise en œuvre :

1-Compréhension : Le datajournalism permet de mieux comprendre le monde.

Pour cette visualisation des succès au box office américain depuis 1986, l’équipe du nytimes.com a particulièrement travaillé sur la forme des courbes, et leur couleur.


Le datajournalism, c’est de la visualisation d’information. C’est une des composantes du traitement rich media (tel que le défini Alain Joannes), une des applications du journalisme visuel. Dans cette première logique, le datajournalism permet de faire comprendre par l’image certaines idées bien mieux que ne le feraient des mots.

Le datajournalism fait ici appel aux compétences des graphistes et aux connaissances en sémiotique visuelle ou en sémiologie graphique : pour que chaque forme et chaque couleur fasse sens instantanément.

Pour faire comprendre une affaire d’espionnage politique à Madrid, elpais.com a mis au point une visualisation animée et interactive.

Mais le datajournalism va au delà de l’infographie car il ne s’adresse pas uniquement à l’intelligence visuelle, il travaille également sur l’intelligence cinétique. En datajournalism la visualisation est forcément interactive. Elle doit permettre à l’internaute de jouer avec les données, de manipuler la visualisation. Plongé dans une posture active, l’usager appréhende et mémorise plus facilement l’information.

La datajournalism ne pourra donc pas se passer des compétences d’un interaction designer. Ni de celles d’un ergonome.

2.Personnalisation :  Le datajournalism permet de personnaliser la vue sur le monde

Gapminder permet de visualiser à la demande les relations entre différents indicateurs statistiques mondiaux.

Le datajournalism, c’est aussi de l’information à la carte. Un des moyens de répondre à la fragmentation des audiences.

La visualisation de données consiste à bâtir une interface graphique pour accéder à une base de données. Cela permet bien sûr de proposer un aperçu de gros volumes de données, d’en faire jaillir le message essentiel. Mais cela ouvre également la possibilité d’interroger n’importe quelle partie de cette base de données, et de la rendre accessible et compréhensible instantanément. Ainsi, une des dimensions de l’interactivité consiste à rendre la visualisation librement paramétrable. Une application de datajournalism peut alors répondre toutes les attentes particulières des internautes autour d’un thème d’information.

Les savoir-faire d’un architecte de l’information deviennent ici utiles.

3.Investigation : Le data journalisme permet d’éclairer autrement le monde.

En analysant un document de 458 mille pages sur les notes de frais des députés britanniques, le Guardian a révélé des abus dans l’utilisation des fonds publics britanniques.

Le datajournalism est également un outil d’investigation. Les bilans de la cour des comptes, les rapports du FMI, les statistiques de l’OCDE, etc., contiennent énormément de matériau pour le journalisme d’investigation. Seulement, il faut savoir faire parler ces données. C’est à dire qu’il faut prendre le temps de les lire, qu’il faut savoir les interpréter, qu’il faut des outils pour appréhender des tendances à partir de gros volumes de données, qu’il faut avoir l’idée de croiser une base de données avec une autre, etc., pour faire apparaître des informations jusque là ignorées.

Interroger les données plutôt que les témoins est un art encore très délaissé par les médias français. Peut-être parce que cela suppose d’emprunter des outils et des méthodes aux sciences (voir la brillante illustration de Fabrice Epelboin sur RWW France) : pour extraire de l’information d’immenses bases de données, il n’y pas d’autres moyens que de construire des modélisations, que d’utiliser des outils de gestion de la complexité.

Impossible de réaliser ce genre d’investigation sans statisticien.

4.Participation : Le data journalism permet de participer à la description du monde

Avec l’aide de 200 internautes, l’équipe d’Owni.fr a géolocalisé les bureaux de votes français et a rendu cette base de données gratuite, ouverte et libre.

Enfin, le datajournalism suppose parfois de faire appel au crowdsourcing pour collecter les données et pour les qualifier. Lorsque la base de données n’existe pas, lorsqu’il est matériellement impossible qu’un petit groupe de personnes collecte toutes les données sur un sujet, la force du datajournalism réside dans sa capacité à fédérer la participation des internautes pour obtenir des données à faire parler.

Cela nécessite un gros travail d’animation de communauté.

Il faut encore mentionner deux compétences indispensables au datajournalism, et transversales à ces quatre dimensions.

Tout d’abord les savoir-faire des développeurs. Développeur axé back office et data, pour construire et gérer les bases de données, mais aussi développeur axé animation, flash, et front office.

Et pour finir, pas de datajournalism sans travail d’éditorialisation. Par éditorialisation j’entends : problématisation, inscription dans le débat public, storytelling, hiérarchisation, définition d’un angle de traitement de l’actualité et d’un message à délivrer. Vous remarquerez que j’esquive volontairement la référence au journalisme. Je suis persuadée qu’il n’est pas besoin de se définir comme journaliste pour être capable de remplir ce rôle d’éditorialisation. Maintenant, est-ce que ce travail d’éditorialisation est du journalisme ? Je vous laisse en débattre.

Creative Commons License

Prix de la presse au Kg : la presse française bien plus chère que la presse étrangère

Bookmark and Share

Au menu : une très bonne visualisation d’Elsa Secco, des explications sur sa réalisation et quelques mots d’éditorialisation.

La visualisation d’abord, réalisée par Elsa Secco, à partir des données fournies par Philippe Douroux dans son très bon article « Aux Etats-Unis, la presse pèse 3 fois plus lourd et coûte moins de 2€/Kg« .

Elsa Secco est webdesigner et étudiante en quatrième année à l’Hetic.

Quelques précisions sur sa réalisation ensuite :

ELSA : « C’est la première visualisation que je réalise, et je voulais vraiment m’éclater, qu’elle soit, avant tout, fun et accessible.

J’ai tout de suite eu l’idée de représenter les données par des plumes, double-métaphore pour illustrer le poids et l’écriture.

Le plus laborieux a été de croiser l’image et les mathématiques. Il fallait absolument que les proportions soient respectées, pour que le lecteur comprenne instantanément ce qui est comparé et analysé. J’ai donc passé un moment à trouver la bonne échelle et faire des règles de 3 !

Ensuite, j’ai étudié plusieurs possibilités de schémas, je ne dis pas que le mien est le meilleur, mais je voulais aussi le mettre dans le contexte de l’illustration, comme si des plumes tombaient du nid de l’oiseau.

D’ailleurs je suis assez fière de mon oiseau, car il a une tête assez grotesque. 🙂  »

Et pour finir, je ne peux pas m’empêcher de vous livrer les quelques commentaires que ces données m’inspirent.

L a presse française, coûte, en moyenne 11,30€ le Kg alors qu’aux Etats-Unis elle coûte moins de 2€ le Kg, selon les calculs de PhDx dans son récent article sur slate.fr.

D’accord, vous allez me dire : quel sens ça a de comparer le prix au Kg de la presse ? J’y vois deux vertus pédagogiques :

Premièrement, comparer les prix au Kg, c’est mettre en lumière deux phénomènes très importants dans la perte d’attractivité de la presse papier française :

  1. La presse française offre moins de contenu que certains titres étrangers (par exemple, les très copieux Washington Post et New York Times)
  2. La presse française est plus chère que la presse étrangère.

Pour lutter contre des difficultés endémiques ou une crise économique conjoncturelle, certains titres ont amoindri leur rédaction et/ou leur pagination, tout en augmentant le prix d’achat. Comment s’étonner que les lecteurs désertent ? A l’origine des difficultés de la presse quotidienne française, il n’ y a pas seulement une transformation de la demande, un bouleversement des pratiques de lecture, il a aussi la faible attractivité de l’offre, et la visualisation d’Elsa montre bien cela.

Deuxièmement : cette référence au prix au Kg nous fait prendre conscience de la matérialité de la presse papier. Un journal c’est de l’encre, du papier, des camions pour le transporter… Et tout cela à un coût (plus de 60% des charges  d’exploitation d’un titre). Des coûts qui ne se retrouvent pas dans la presse en ligne.

Certains considèrent comme un paradoxe que bien des lecteurs, qui acceptaient de payer hier pour leur journal, ne conçoivent plus aujourd’hui de payer pour de l’information en ligne. Calculer le prix de la presse au Kg suggère une explication : les lecteurs ne payaient déjà pas pour l’information au temps des journaux imprimés, ils payaient pour le papier, l’encre, l’essence dans les camions et le salaire des porteurs.

Creative Commons License

Ce qu’aurait pu être le Sarkomètre du Nouvel Obs

Bookmark and Share

Avec son Sarkomètre, le Nouvel Obs a mis un pied dans les données structurées. Une avancée incontestable, mais si timide qu’elle souligne finalement l’ampleur du fossé  qui sépare encore la presse traditionnelle de la visualisation de données.

Reprenons. Le 1er février dernier, lenouvelobs.com publiait un tableau récapitulant, pour 113 promesses  formulées par Nicolas Sarkozy pendant la dernière campagne présidentielle, si l’engagement a été tenu, oublié ou engagé.

La base de données constituée par les journalistes comprend également, pour chaque promesse, sa thématique, la déclaration originelle du candidat Sarkozy, et un commentaire de la rédaction du Nouvel Observateur.

Il s’agit effectivement d’une démarche de structuration de données : publier dans un tableau ce qui d’ordinaire est publié par le Nouvel Obs sous forme d’article, de récit, en croisant des indicateurs (thème, promesse, déclaration, réalisation, commentaire) et des variables (les 113 promesses).

Le Nouvel Obs reprend ici la démarche de Politifact, avec son Obameter (The Obameter : Tracking Obama’s Campaign Promises), qui a noté plus de 500 promesses faites par Barack Obama pendant sa dernière campagne selon leur degré de réalisation (Promise Kept, Compromise, Promise Broken, Stalled, In the Works, Not yet rated).

Politifact est un projet de journalisme innovant lancé par Matt Waite au sein du St. Petersburg Time en 2008, pendant la campagne pour les élections présidentielles aux Etats-Unis : le site évaluait la véracité des propos tenus par les hommes politiques sur une échelle allant de « True » à « False » en passant par « Mostly True », « Half True » et « Barely True ».

Revenons d’abord sur le principal bon point du Sarkomètre : il a été publié via Socrata, une plateforme d’hébergement et de publication de bases de données. Avantages de la solution Socrata :

  • Interactive : l’interface de Socrata permet aux internautes de trier, de masquer ou de compiler les données par ligne ou par colonne.
  • Conversationnelle: les internautes peuvent noter et commenter la base de données
  • Virale : les internautes peuvent partager le Sarkomètre via Delicious, Digg, Facebook et Twitter
  • Ouverte : la base de données peut être librement publiée sur d’autres sites/blogs via un Social Data Player embeddable, il est possible de télécharger la base de donnée sous différent formats ou d’y accéder via l’API Socrata.

En passant par Socrata, le Nouvel Obs respecte tous les codes de l’open data. La base de donnée est libre, et cela représente une petite révolution dans un univers journalistique plutôt enclin à s’accrocher aux droits d’auteurs.

Maintenant cette belle avancée signalée, venons-en aux insuffisances.

Le tableau réalisé par le Nouvel Obs nous permet d’échapper à un article long, répétitif, encombré de formules destinées garder l’attention du lecteur tout en déroulant les 113 promesses. C’est déjà un beau progrès, mais le Nouvel Obs aurait pu aller beaucoup plus loin.

Le Sarkomètre ne nous permet pas de nous rendre compte instantanément que sur 103 promesses :

-31 ont été tenues

-39 ont été engagées

-43 ont été oubliées

Il ne nous permet pas de voir du premier coup d’œil que les thématiques ayant fait l’objet du plus grand nombre de promesses sont :

-La fiscalité (10 promesses)

-La famille (8 promesses)

-La santé (8 promesses)

-L’éducation (7 promesses)

Et que ces thématiques affichent des taux différents de conversion des promesses en engagements tenus :

-Fiscalité : promesses tenues à 40% (4 promesses tenues sur 10)

-Famille : promesses tenues à 0% (0 promesse tenue sur 8 )

-Santé : promesses tenues à 25% (2 promesses tenues sur 8 )

-Education : promesses tenues à 29% (2 promesses tenues sur 7)

Pour cela, il aurait fallu que le Nouvel Obs réfléchisse à la visualisation de sa base de données.

Voyons maintenant ce que le Sarkomètre aurait pu être.

Puisque je n’ai ni le temps ni l’équipe nécessaire à la réalisation de ces visualisations (mais il pourrait un jour en être autrement), je vous propose simplement quelques exemples de graphisme.

Le Sarkomètre aurait pu proposer :

  • Une visualisation qui permette d’identifier en un clin d’œil quelle est la proportion des promesses tenues.

Comme sur l’Obameter :

  • Une visualisation représentant la part relative de chaque thématique dans les promesses tenues/en cours de réalisation/abandonnées

Comme pour l’agenda du président Obama analysé par le Washington post :

Ou à la façon de Where does my money go

  • Une visualisation représentant les ratios promesse tenues/promesses formulées pour chaque thématique

Comme sur cette visualisation de l’évolution du pouvoir d’achat des foyers américains sur Flowing Data :

  • Une timeline mettant en évidence le rythme de réalisation des promesses et les priorités de l’équipe gouvernementale

Comme la timeline d’ABC News sur la dernière campagne présidentielle américaine :

  • Une visualisation graphique du champ lexical de la formulation des promesses dans les discours du candidat Sarkozy

Comme sur Capitol Words :

Ou comme dans la rubrique In Obama’s Words du Washington Post :

  • Même un simple petit curseur, comme sur Politifact aurait déjà été plus parlant.

Conclusion : structurer des donnée ne suffit pas, un travail d’éditorialisation est nécessaire pour faire ressortir des idées de la base de données.

Creative Commons License

66 visualisations et exemples de database journalism

Bookmark and Share

Lorsque j’ai lancé ce blog, je pensais avant tout en faire un atelier de travail pour un (éventuel) projet de lancement de site de database journalism. Il me semble naturel d’y publier quelques travaux préparatoires. Voici un premier document, compilation des différentes visualisations repérées depuis trois mois.

Il y a aura une suite et des améliorations. Il y aura aussi, je l’espère, vos commentaires, remarques et suggestions 🙂

Creative Commons License

Le database journalism : à la croisée des grandes tendances du Web

Bookmark and Share


statistique

Comme expliqué dans la page « A propos », mon exploration du database journalism est sensée nourrir un projet de lancement d’un site d’info basé sur du journalisme de données.

Si je voulais faire simple, je pourrais résumer mon projet à un site d’infographies. Evidemment, ça ne serait pas aussi attractif : l’idée de compiler sur des pages Web des dizaines d’infographies telles qu’on a l’habitude de les voir dans les pages de nos journaux ferait même plutôt fuir.

Un petit post s’impose donc pour convaincre d’éventuels réticents que le journalisme de données, ou database journalism, est bien au cœur des dernières tendances du Web, et qu’il résonne de promesses captivantes.

Le database journalism s’inscrit à la croisée de plusieurs grandes tendances :

1/Le Web-design et la 3D : de l’infographie en trois dimensions, animée, percutante, ça change tout ! Ca pourrait même réconcilier nos concitoyens avec les nombres (cf sur ce blog: un problème avec les nombres ?).

2/La personnalisation : la délinéarisation, la fragmentation voire l’individualisation, de la consommation d’information sont désormais caractéristiques des usages du Web. La mise à disposition de bases données via des interfaces graphiques peut justement offrir une personnalisation poussée de l’information. Une infographie interactive peut ainsi être plus ou moins largement paramétrée par l’utilisateur : choix du zoom, délimitation de la zone géographique, sélection des dimensions comparées, personnalisation des critères de visualisation… Chaque infographie devient ainsi unique, parfaitement adaptée aux besoins d’un internaute à un moment précis de son parcours de navigation.

3/La géolocalisation : la personnalisation appliquée à la situation géographique de l’internaute. Cela peut permettre, par exemple, à chaque Internaute d’entrer dans les infographies différemment selon l’endroit où il se trouve. Résultat : un impact bien plus grand des données présentées. La carte du taux de mortalité par accident de la route suscite moins la curiosité si elle est présentée à l’échelle de la France qu’à celle de son quartier.

4/La transparence des données publiques : l’administration Obama a donné une vraie impulsion en janvier dernier en ouvrant l’accès à un catalogue de données brutes de l’Etat américain, sur le site data.gov. Le gouvernement britannique s’y est mis aussi (http://innovate.direct.gov.uk/). Le  mouvement d’ouverture des bases de données est lancé, mais les données brutes restent difficilement lisibles sans médiation graphique. Il ne reste donc plus qu’à s’en saisir pour y greffer des interfaces de visualisation éditorialisées. C’est ici que le database journalism trouve sa place.

5/Le Web social et le crowdsourcing: Non seulement les internautes ont la possibilité de personnaliser les infographies, mais ils peuvent également contribuer à récolter les données. Pour analyser les 458 mille pages sur les notes de frais des députés britanniques, le Guardian a, par exemple, demandé à ses lecteurs-volontaires d’analyser chacun un petit bout du document. La participation des internautes permet à la fois de collecter des données micro-locales et de fédérer des communautés autour des bases de données.

6/L’Internet des objets et le temps réel : l’étiquetage électronique des objets, via des puces Rfid capables de transmettre ou d’enregistrer des données, ouvre la voie à de nouvelles façons de collecter l’information. Un capteur, encapsulé dans une montre ou n’importe quel objet usuel, peut, par exemple, donner des indications géo-localisées, en temps réel, sur la pollution de l’air. La transmission des données entre puces Rfid et espaces de stockages numériques peut se faire automatiquement, et être intégrée à des infographies réactualisées en permanence. (Voir l’article de Daniel Kaplan sur InternetActu.net)

J’essaierai, bien entendu, de développer toutes ces dimensions du database journalism dans mes prochains posts.

Et, promis, je vous donnerai par la suite des exemples commentés de journalisme de données.

Creative Commons License

Illustration : www.photo-libre.fr

Inscrivez votre adresse e-mail pour vous abonner à ce blog et être averti de mes nouveaux posts par e-mail

Rejoignez 25 autres abonnés

Sélection de liens

Contact :

goulard.caroline@gmail.com

Blog Stats

  • 34,226 hits

Visuel d'en-tête : Photos Libres