Avant de se faire connaître avec son blog FiveThirtyEight[1], le statisticien Nate Silver avait fait ses armes dans les prédictions du championnat américain de base-ball. La justesse de ses prévisions lors de l’élection présidentielle américaine de novembre 2008 (il prédit correctement le vainqueur dans 49 des 50 États) l’a fait connaître du grand public. Il est vrai que ses performances sont plutôt remarquables : il prédit correctement le vainqueur dans 49 des 50 Etats et s’est trompé dans l’Indiana d’un seul petit point. Il a également prédit correctement les résultats des 35 élections sénatoriales. A l’époque on ne parlait pas encore vraiment de big data mais seulement de statistiques. Et pourtant, ces prouesses sont indiscutablement liées au volume de données que Nata Silver a été capable de collecter et de traiter.

Mais il ne s’agit pas seulement de prédiction car les candidats, surtout le camp démocrate a utilisé aux mieux les données pour mieux affiner leur stratégie. Car, rappelons-le, les élections américaines sont plutôt compliquées. C’est une élection indirecte dans laquelle il faut conquérir la majorité des grands électeurs et non celles des électeurs. En général, les deux vont de pair mais il est arrivé à plusieurs reprises – comme en 2000 – qu’un candidat soit élu alors qu’il est minoritaire en voix. Ce fut le cas de George Bush en 2000 face à Al Gore, après la décision, très contestée de la Cour Suprême, de lui donner la victoire de l’Etat de Floride et donc de l’élection. Les candidats en lice ont tendance à se concentrer sur les Etats qui font la différence et que l’on appelle les Swing States qui changent assez facilement de camp.

Depuis 2008, le big data a considérablement progressé tout comme la puissance des ordinateurs. Concernant le premier point, la planète hadoop et les logiciels d’analytics d’un côté et les techniques d’intelligence artificielle de l’autre se sont largement étoffées autorisant désormais un traitement beaucoup plus précis. Concernant, le second, le Top500 qui recense les supercalculateurs de la planète enregistre une croissance des performances d’environ 50 % par an, soit une multiplication d’un facteur 25 en deux mandats présidentiels.

« En 2012, les conseillers politiques commençaient à peine à comprendre la puissance des données et leur facilité à façonner et à prédire les résultats des élections. En 2016, l’analyse d’un important volume de données influera sur les millions de dollars dépensés dans le cadre d’une campagne présidentielle », considère Eric Clemenceau, Directeur Général de Rocket Fuel France (voir également l’article en rubrique Avis des fournisseurs Mieux utiliser les First Party Data pour une performance exceptionnelle), une plateforme de marketing programmatique complète qui utilise largement les technologies à l’intelligence artificielle et au big data. Pour l’élection présidentielle 2016, Rocket Fuel travaille avec les partis démocrates et républicains.

L’utilisation de l’intelligence artificielle et du big data pour planifier, exécuter et évaluer l’efficacité des campagnes électorales permettra d’aller au-delà du simple ciblage d’électeurs en déterminant le bon moment pour diffuser une annonce, en fonction de leur propension à faire des choix. Aujourd’hui, la TV et les canaux classiques ont perdu leur prééminence et le Web est un canal qui prend de plus en plus d’importance. Plus du tiers des électeurs américains ont déclaré avoir voté lors d’une élection à la suite d’une publicité électorale en ligne, et environ 60% des indécis choisissent un candidat moins d’un mois avant l’élection, alors que les plus décidés peuvent arrêter le choix de leur candidat plus de trois mois avant le jour du scrutin (pour 26%). L’utilisation de l’intelligence artificielle et du big data montre donc qu’il est préférable d’atteindre les électeurs indécis plus d’un mois avant une élection, et non au cours des derniers jours.

Aujourd’hui, les informations que les internautes laissent sur la toile apportent des informations encore bien plus importantes que leurs simples appartenance ou non à l’un des deux grands partis (Démocrates ou Républicain), poursuit Eric Clémenceau. Il est ainsi possible d’envoyer les bons messages, aux bons moments aux bons électeurs.

Pour présenter la puissance de ses outils, Rocket Fuel a publié une série de 3 livres blancs Preparing for 2016  qui donnent une idée de la richesse des traces laissées par les citoyens-internautes sur la Toile. Pour réaliser ces livres blancs, Rocket Fuel a conduit une enquête auprès de près de 3000 électeurs enregistrés de 5 Etats (Colorado, Florida, Illinois, North Carolina, and Wisconsin) dits Swing States avant les élections de midterm de 2014 et fait la différence entre votants et non votants. Les recherches  révèlent des informations pour le manque surprenantes et inattendues, certaines pertinentes et d’autres plus anecdotique (voir ci-dessous). Les trois livres blancs couvrant les grandes thèmes de l’élection 2016 (avortement, légalisation du mariage homosexuel, légalisation des armes à feu, immigration, éducation…) et le profil des électeurs en fonction de ces sujets.

24 Bigdata 3

 


Voters supporting a continued legalization of assault weapons were more likely to:

  • Go on a family road trip (+66%)
  • Be male (+61%)
  • Be fiscally conservative (+55%)
  • Buy tools for home improvement (+48%)
  • Make home improvements during the summer (+37%)
  • Buy Velveeta cheese, Rotel tomatoes, and canned green chiles to make a spicy cheese dip (35%)
  • Enjoy CBS programming (+29%)
  • Donate to a veterans’ organization (+27%)
  • Be online gamers (+26%)
  • Be a dog owner (+26%)
  • Buy furniture and accessories (+25%)
  • Visit a theme park (+25%)
  • Consider themselves to be patriotic Americans (+14%)

(Source : Preparing for 2016)


 

Si Barack Obama a été le premier candidat a utilisé largement les technologies numériques pour conduire sa campagne, il a été aussi celui que l’on a surnommé le « président big data » avec la diffusion du big data dans de nombreuses agences gouvernementales pendant ses deux mandats. Cette appétence pour les technologies remontait loin. Lorsqu’il a été sénateur de l’Etat de l’Illinois, Barack Obama avait fait passer une loi bipartisane avec le sénateur de l’Oklahoma Tom Coburn en faveur de la création d’une base de données gouvernementale en ligne permettant aux citoyens de suivre l’utilisation faite de l’argent public (USAspending.gov). En 2013, l’administration Obama a mis en ligne une base de données médicale montrant comment plus de 3000 hôpitaux dans tout le pays traitaient une centaine de pathologies. Une politique qui s’inscrit dans un point de vue énoncé par Karl Llewellyn, professeur de droit à l’université de Chicago : « La technique sans morale constitue une menace, mais une morale sans technique génère le chaos ».

__________
[1]
Le nom de ce blog est dérivé du nombre de membres de la Chambre des Représentants américaine