Toutes les data d’une révolution

La visualisation de données peut offrir des points de vue uniques sur les révoltes sociales. Et les data-artistes n’en sont qu’à leurs débuts…

Geography of Twitter replies / Walkingsf via Flickr CC License By– Geography of Twitter replies / Walkingsf via Flickr CC License By –

Au premier coup d’oeil, vous ne savez pas vraiment ce que vous regardez. Ce pourraient être des brins d’ADN mitochondrial, ou du sperme en train de féconder un ovule, ou peut-être le produit d’une union incongrue entre une créature marine et une boule de poils. Tandis que la chose grossit, elle passe par une série de mutations de plus en plus complexes, pour finir comme une sorte d’Étoile noire en chantier.

Ce que vous êtes en train de regarder, ce sont des données, ou pour être plus précis, une représentation visuelle de tweets et de retweets publiés pendant une période de quelques heures le 11 février 2011, juste après la démission du président égyptien Hosni Moubarak.

Omniprésence des données numériques

Plus que jamais auparavant, nous vivons dans un univers de données. Avec les smartphones et la possibilité de partager publiquement des wagons d’information sur les réseaux sociaux, notre empreinte numérique est partout, de ce que nous likons sur Facebook jusqu’à nos cartes de fidélité en passant par nos virements bancaires viasmartphone.

Cette explosion de données s’est accompagnée de nouveaux moyens de les représenter. Depuis les cunéiformes sumériens jusqu’aux diagrammes en camembert, les symboles visuels transforment l’abstrait en concret, nous aident à voir des structures et des interactions que nous n’aurions pas perçues sans eux. Plus les données sont importantes, plus les images qui les représentent sont utiles, et jamais dans l’histoire humaine nous n’avons eu à faire face à des flots de données aussi importants que ceux qui déferlent sur nous aujourd’hui.

De tous les phénomènes sociaux qui invitent à l’analyse, peu sont aussi complexes ou aussi volatiles que les révolutions. Les petabytesde données issues des réseaux sociaux générés par les soulèvements du Printemps arabe sont un terrain fertile pour les chercheurs en sciences humaines qui étudient ces évènements. Depuis des années, nous prenons des photos de manifestants et de manifestations et maintenant le nouvel univers de données disponibles nous permet potentiellement de cartographier le flux et et le reflux des idées qui les portent, quelque chose comme une technique d’imagerie par résonnance magnétique pour visualiser les mécanismes du changement dramatique.

Au départ, les mouvements sociaux iraniens

L’intérêt pour le rôle des réseaux sociaux a explosé pour la première fois en Iran lors des troubles post-électoraux de 2009. Dans son«Retweet revolution», Gilad Lotan, graphiste et chercheur en informatique, a cherché les sujets de conversation sur Twitter autour de hashtags populaires tels que #iranelection, #ahmadinejad, et #moussavi. En représentant visuellement les flux, Lotan explique que nous pouvons «mettre un visage» sur un public, comme, par exemple,  dans ce projet frappant sur le Printemps arabe réalisé par Lotan et ses collaborateurs.

En 2011, Kovas Boguta a magnifiquement cartographié le «Réseau d’Influence Egyptien», représentant les utilisateurs arabophones et anglophones de Twitter, et peut-être, de façon plus frappante encore, les points nodaux qui s’étendaient au-delà de la barrière de la langue.

Pour les chercheurs en sciences sociales, les grandes bases de données et les visualisations se montrent déjà des outils intéressants. En écrivant sur les diagrammes des tweets sur la crise post-électorale de 2009 en Iran, le chercheur Devin Gaffney a compris qu’en utilisant des nuages de tags, «nous pouvons identifier les termes-clef utilisés dans les tweets», comme il l’écrivait alors:

«En regardant différents nuages de tags dans le temps, nous pouvons peut-être même voir des termes refléter un changement général, de la conscience/le militantisme, vers l’organisation/la mobilisation, et finalement l’action/la réaction.» 

Les chercheurs utilisant les données peuvent aussi cartographier l’évolution des idées au fil du temps. En 2008, John Kelly, deMorningside Analytics, une société spécialisée dans l’analyse des réseaux sociaux, a représenté visuellement la blogosphère iranienne. Lorsqu’il a fait la même chose un an plus tard et comparé les cartes, il a découvert que non seulement le nombre de blogs avait cru, mais également que de nouveaux segments avaient émergé.

Un de ceux-là, qu’il a surnommé «CyberChiisme», a révélé une augmentation très forte du blogging chez des usagers les plus portés sur la religion. Si cela pourrait témoigner d’un effort des milices pro-régime Basij de contenir les discours de la dissidence sur le Web, une autre théorie considère les données comme une preuve témoignant d’un débat de plus en plus intense sur la loi islamique et son rôle dans le système politique du pays.

La blogosphère iranienne en 2009

La blogosphère iranienne en 2008

Le cas du Printemps arabe

De la même façon, en regardant les données issues des réseaux sociaux qui ont émergé du Printemps arabe, il est possible  de voir des idées politiques se figer et prendre forme. En évaluant des données de 2010 à 2011, le Arab Media Influence Report, qui a capturé plus de 10 millions de conversations online par jour, a montré le discours est devenu politisé au début de 2011.

Lors du premier trimestre de 2010, 57% des conversations en arabe sur les réseaux sociaux incluaient des termes socio-économiques (tels que revenu, loyer, salaire minimum). En 2011, ce chiffre était tombé à 37%. En 2010, 35% des conversations sur les réseaux sociaux incluaient frd termes politiques tels que révolution, corruption et liberté). En 2011, le chiffre a bondi à 88%.

Bien sûr, nous n’avons pas vraiment besoin des réseaux sociaux pour apprendre que les sociétés arabes devenaient plus conscientes politiquement pendant la période précédant les révoltes. On peut penser qu’on serait arrivé à une conclusion comparable en s’asseyant dans des cafés du Caire pendant un an ou en suivant les débats dans la presse arabophone.

Visualiser des structures de façon inédite

La visualisation de données prend tout son intérêt lorsqu’elle nous permet de voir des structures que nous n’aurions pu distinguer sans elle, des structures qui peuvent être modélisées et appliquées à d’autres contextes. Si, comme certains sociologues le croient, la structure est prédestinée, alors les graphiques représentant des réseaux pourraient nous permettre de comprendre les cycles de vie des mouvements politiques, leur croissance potentielle et leur chute éventuelle.

Marc A. Smith, le directeur de la Social Media Research Foundation, une ONG californienne, explique:

«Les tenants de la théorie des réseaux, et les sociologues en général, aiment penser que les caractéristiques du réseau d’une personne ont une influence égale, sinon plus importante, sur son succès ou ses échecs.»

Smith cite en exemple deux de ses visualisations du mouvement Occupy et du Tea Party sur Twitter. Dans ses représentations, le Tea Party se révèle un groupe aux liens plus serrés, dont beaucoup des membres se suivent les uns les autres, tandis qu’Occupy est constitué de noyaux moins liés, quelques comptes étant l’objet de nombreux retweets. En bas à droite des visualisations, on trouve une grille, une matrice d’«isolats», des gens qui parlent des idées d’Occupy ou du Tea Party, mais qui n’ont pas de liens avec les autres présents sur le graphique. Le nombre d’isolats est plus important pour Occupy, ce qui pourrait selon Smith indiquer un plus grand potentiel de croissance et une plus grande identification de la marque.

Le Tea Party sur Twitter

Occupy sur Twitter

Lorsque l’on interroge les données, les réponses qu’elles nous donnent sont aussi intéressantes que les questions qu’on leur pose. Observer Twitter ne nous dit pas comment les forces d’Occupy de Zucotti Park se comportent, ni le bruit qu’elles font et quelle est leur odeur. (La twittosphère après tout, n’est pas tout l’univers.)

Mais comme le note Smith, analyser les données montre que la structure du groupe reflète sa propre description de mouvement décentralisé et populaire. «Il ne fait aucun doute que des données importantes peuvent être très utiles, affirme Zynep Tufekci, un sociologue de l’Université de Caroline du Nord. Mais cela est moins utile voire parfois  trompeur si elles ne sont pas analysées par des gens qui en comprennent le contexte.»

Twitter n’est pas le monde

Sans connaître le contexte de la pénétration d’internet ou du segment de la population qui utilise Twitter, les diagrammes représentant les réseaux d’usagers égyptiens de Twitter peuvent donner l’impression que Twitter a joué un rôle démesuré dans les troubles qui ont eu lieu en Égypte. On pourrait aussi avoir une vision exagérée du caractère libéral du Printemps arabe.

Mais plutôt qu’être largement représentatifs de la société égyptienne, ces utilisateurs de Twitter sont plutôt un sous-groupe d’élites éduquées et anglophones, ayant un intérêt pour les idées libérales. Ils témoignent peut-être autant d’une possibilité d’accès à internet que de ce qu’est la société égyptienne. (Gregor Aische, un graphiste allemand, a réalisé sa propre visualisation de la fracture numérique mondiale.)

Mais cela nous aide à nous poser une autre question. Si nous voulons analyser ce qui est à l’oeuvre dans l’esprit des plus influentes élites égyptiennes, alors les données des réseaux sociaux peuvent proposer des réponses intéressantes.  

«C’est peut-être juste un échantillon d’un segment réduit de la population, mais si c’est ainsi qu’ils s’organisent et communiquent, alors c’est un groupe important, affirme Noah Iliinsky, un expert de la théorie et la pratique de la visualisation. Je ne voudrais pas négliger cette population, simplement parce qu’elle n’est pas représentative.»

Des prédictions par les données?

Ce qui a initié l’excitation des entreprises, des gouvernements et des universitaires dans les données et leur visualisation, c’est la possibilité de détecter des structures en temps réel au lieu de cartographier les perceptions après coup, et même d’utiliser ces données pour réaliser des prédictions.

On voit déjà des cas où des données représentées visuellement permettent à des décideurs politiques de réaliser des choix rapides et informés dans le domaine de la santé publique, de la pauvreté ou de l’efficience énergétique. Google Flu Trends, qui évalue l’activité de la grippe dans le monde en temps réel en surveillant les recherches de mots clef, s’est révélé prédire des cas de grippe confirmés avec un niveau d’exactitude comparable à celui des Centers for Disease Control and Prevention. En 2010, des chercheurs ont réussi à prédire avec une précision de 87.6% les évolutions quotidiennes des valeurs de cloture du Dow Jones Industrial Average en analysant l’humeur des utilisateurs de Twitter.

Est-ce que de telles techniques pourraient fonctionner pour prévenir les mouvements sociaux? L’ONU a lancé une initiative, Global Pulse, qui utilise les nouvelles technologies pour collecter, analyser et filtrer des informations pour aider les gouvernements et les organisations à mieux comprendre ce qui est à l’oeuvre dans certains groupes humains exposés à un risque. En 2010 et 2011, le groupe Ushahidi, célèbre pour son logiciel de visualisation en temps réel et de crowdsourcing pionnier, avait créé un site qui suivait les troubles potentiels lors des élections au Libéria.

De façon similaire, Associated Press a rapporté en novembre 2011 que la CIA traitait cinq millions de tweets par jour pour surveiller les changements révolutionnaires. (Bien sûr, ces même données pourraient être utilisées par des gouvernements répressifs qui souhaitent surveiller les oppositions et les troubles.)

Evaluer taux de conversion d’un tweet

L’un des principaux problèmes se posant lorsque l’on tire des conclusions sur les transformations sociales fondées sur des données issues des réseaux sociaux, vient de ce que notre compréhension du taux de conversion pertinent est limitée. Tout comme les publicitaires et les communiquants politiques essaient frénétiquement de comprendre la relation entre les tweets et les dollars ou les votes, le taux de conversion du changement social est encore plus difficile à évaluer.

Quelles conclusions les chercheurs travaillant sur des données peuvent-ils par exemple tirer du volume de tweets pour évaluer la fréquentation potentielle d’une manifestation ? Est-ce que les sentiments exprimés dans les statuts Facebook peuvent être relevés pour produire une indication précise du soutien à Vladimir Poutine?

Étant donné que l’analyse des réseaux sociaux en est encore au stade de l’enfance, les réponses à ces questions restent vagues. La prétendue analyse des sentiments a toujours du mal à distinguer un simple bruit d’un signal d’alarme. Les diagrammes cartographiant les relations entre les utilisateurs de Twitter et les «likers» nous informent qu’il y a une population importante, mais ils ne sont pas d’une grande aide pour nous dire ce que pense la foule et pourquoi. Tandis que les programmes deviendront certainement meilleurs pour traiter des quantités énormes de données, ils restent plus adaptés pour compter que pour analyser. Les ordinateurs ont toujours du mal à percevoir l’argot, le second degré, les allusions.

Prenons par exemple ces tweets de DanielNothing, qui tweetait sur lesémeutes de Londres le 6 août 2011:

«Vers Tottenham pour rejoindre l’émeute! qui en est? #anarchie»

C’est très clair, n’est-ce pas? Si des milliers de personnes avaient retweeté le tweet de Daniel Nothing ou tweeté de tels sentiments, la police aurait été bien avisée de déployer des forces en conséquence. Mais après cela, DanielNothing avait à nouveau tweeté:

«Attendez, il fallait comprendre du dernier tweet: « Posé sur le canapé avec le DVD d’Avengers et ma copine, qui en est? » Quel idiot je fais!»

Seuls les amis de DanielNothing pouvaient saisir à coup sûr ce qu’il voulait dire. Était-il simplement ironique? Ou est-ce que son premier tweet pouvait être pris au premier degré, le second pouvant être lu comme une tentative de masquer sa réelle intention ? Si un homme a du mal à comprendre le sens véritable, comme un ordinateur le pourrait-il ?

L’art complexe des réseaux sociaux

Déconstruire l’art complexe des réseaux sociaux n’est pas une chose facile. Nos émotions que nous exprimons peuvent ne pas toujours correspondre aux émotions que nous ressentons vraiment et nos préférences affichées peuvent ne refléter qu’approcimativement nos réels désirs. La signification culturelle et sociétale d’un retweet ou d’un«like» est plus complexe que l’on pourrait le penser et varie selon les sociétés et les plateformes. «Tout le monde n’évoque pas cela en mentionnant le phénomène», explique Fadi Salem, enseignant en gouvernance et innovation à la Dubai School of Government.

Les gens retweetent régulièrement des liens vers des choses qu’ils n’ont pas lues, pas nécessairement parce qu’elles sont d’accord avec elles, mais parce qu’elles jugent favorablement leur source ou en raison de la pression de leur entourage. «En ce moment, la plupart des analyses (des réseaux sociaux) ne sont pas seulement superficielles, mais également assez primitives, affirme Tufekci. On ne sait même pas si ces tweets étaient positifs ou négatifs, et ce à quoi correspond cette excitation».

En dépit de ces limites, la quantité de données est sans précédent et sera certainement amenée à transformer la recherche sociologique.«Nous recevons à présent des déclarations minute par minute de centaines de millions de personnes dans un format immédiatement lisible par une machine, déclare Smith. Cela n’était jamais arrivé auparavant.»

Trouver des motens plus innovants pour collecter, traiter, gérer et visualiser ces informations sera crucial tandis que des montagnes de données s’amoncelleront. Piers Fawkes, qui dirige PSFK, une entreprise d’analyse de tendances qui a travaillé pour le projet de l’ONU Global Pulse, soutient que le futur, riche en données, pourra témoigner non seulement des données des réseaux sociaux, mais également des (queries) de recherche, des (queries) sur You Tube, et des transactions financières.

Le mouvement open data réclame l’accessibilité au public d’un nombre de plus en plus important de groupes de données afin que chacun puisse en bénéficier. Les notions de vie privée seront certainement amenées à se déliter tandis que nous deviendrons plus à l’aise (ou inconscients), à l’idée de partager des informations nous concernant.

Tandis que de plus en plus de gens accdent à internet de par le monde, notamment grâce à leur smart-phone bon marché (il en existe aujourd’hui environ 4 milliards), des fluxs de données vont proliférer et la plupart des domaines de la société vont se révéler à travers différents types de données issues des réseaux sociaux. (L’an dernier, par exemple, l’utilisateur de Twitter @Arasmus a utilisé des informations venant de comptes Twitter pour cartographier les violences contre les manifestants démocrates en Libye.)

L’avenir de la recherche est-il dans l’open data?

Les défenseurs de l’open data sont excités par ces perspectives, tout comme le sont sans aucun doute certains gouvernements intéressés par des moyens plus sophistiqués de surveiller leurs citoyens. Les téléphones portables nous permettent de devenir des points nodaux dans un réseau de capteurs humains, nourissant ainsi des bases de données sur le temps qu’il fait ou l’état des pompes à eau. Des données importantes visualisées en temps réel peuvent aider à gérer la congestion du trafic ou à permettre au secteur médical de mieux allouer les matériels aux différents hôpitaux.

Pour Iliisnky, «la visualisation de données va nous fournir des connaissances importantes. Elle va nous faire prendre conscience de choses qui ont été trop dépendantes de données pour susciter des réponses satisfaisantes par le passé». Il explique:

«Nous trouverons des réponses plus rapidement si nous pouvons collecter et analyser les données plus rapidement que nous ne le faisions par le passé. Et cela va nous montrer des zones que nous avons pu négliger.»

Prenons le cas de Dataminr, une société d’analyse qui vient d’annoncer un partenariat avec Twitter qui va sans doute donner à la société un meilleur accès aux tweets et aux métadonnées. La société soutient que son système a eu vent de la mort d’Oussama ben Laden plusieurs minutes avant les médias, des minutes qui auraient pu permettre aux clients de la société d’anticiper des évolutions majeures sur les marchés.

Il ne faut pas s’attendre à ce que l’analyse des réseaux sociaux remplace demain les sondages, les réseaux d’alerte existants, ou encore les recherches ethnographiques traditionnelles. Mais si ces outils de visualisation de données peuvent tenir leurs promesses, nous aurons bientôt de nouveaux moyens puissants de raconter des histoires sur notre univers social avec une vitesse et une clarté qu’il aurait été difficile ne serait-ce que d’imaginer il y a quelques années. Si nous voulons saisir un instantané pertinent de la prochaine place Tahrir, utiliser un appareil photo ne sera plus notre seule option.

Luke Allnut

Traduit par Félix de Montety

Publié le 28/04/2012 sur Salte.fr

Publicités
Cet article, publié dans Gestion des connaissances, Normes et standards, est tagué , , , . Ajoutez ce permalien à vos favoris.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s