09 juin 2017

Chronique d’une victoire (qui aurait dû être) annoncée 

Il peut se passer beaucoup de choses en une semaine de vie politique. Et il n'est jamais impossible que les sondages se trompent, y compris lourdement (même si c'est beaucoup plus rare en France qu'au Royaume-Uni).

Mais toutes les enquêtes d'opinion (cf. le toujours précieux tableau récapitulatif de Wikipedia ci-dessous) indiquent une probabilité élevée de victoire pour la République en Marche aux législatives. La principale incertitude semble concerner l'ampleur du succès, entre majorité relative et domination écrasante du groupe LREM à l'Assemblée.



Le contraste est saisissant avec les pronostics de la grande majorité des observateurs (journalistes, politiques, sondeurs, commentateurs professionnels) pendant la campagne. Même ceux qui n'avaient pas vu dans la montée d'Emmanuel Macron une bulle prête à éclater ne lui donnaient que peu de chances de l'emporter aux législatives. Un gouvernement de coalition apparaissait comme le scénario le plus favorable pour En Marche, et une cohabitation comme une hypothèse vraisemblable. On parlait souvent d'une "élection à quatre tours", où toutes les cartes seraient complètement redistribuées après le second. 
  
Mon argument ici est que le succès d'En Marche aux législatives en cas de victoire d'Emmanuel Macron à la présidentielle était, sinon entièrement prévisible, du moins le plus probable. Et que les mauvaises prévisions faites pendant la campagne reflétaient trois grandes erreurs d’analyse, qui ont pu ou non se cumuler : l’oubli de la dynamique créée par un succès à la présidentielle, une méprise sur la force des partis traditionnels et une sous-estimation du soutien à Emmanuel Macron.


L’effet de souffle de la présidentielle

La première erreur, à mes yeux la moins pardonnable, est d’avoir raisonné comme si la présidentielle et les législatives étaient deux scrutins indépendants. 

Ce n'est pourtant pas faute de précédents sous la Ve République montrant que le résultat de la présidentielle conditionne largement celui des législatives. Cinq fois depuis 1958 (en 1981, 1988, 2002, 2007 et 2012) les législatives ont eu lieu dans la foulée de la présidentielle (c'était l'inverse en 1958). A chaque fois, le Président fraîchement élu a obtenu une majorité parlementaire à l'Assemblée. Quatre fois sur cinq, la majorité était absolue pour son parti (PS en 1981 et 2012, UMP en 2002 et 2007), seul François Mitterrand n'obtenant qu'une majorité relative en 1988. Quatre fois sur cinq aussi, le parti du Président s'est imposé face à la majorité parlementaire sortante, le seul cas de continuité étant en 2007.

Ce n'est pas faute non plus de facteurs politiques permettant d'expliquer cette prime accordée au Président élu : la majorité d'électeurs ayant voté pour le nouveau locataire de l'Elysée a généralement mauvaise grâce à ne pas lui accorder de majorité à l'Assemblée pour appliquer son programme ; le Président fraîchement élu maîtrise aussi largement l'agenda médiatique dans la période allant de la présidentielle aux législatives : il peut à peu de frais démontrer le renouveau (en nommant un gouvernement), exposer sa vision pour le pays (en annonçant ses priorités législatives), asseoir sa stature internationale (en rencontrant ses homologues), et tout cela sans avoir encore à affronter le débat parlementaire ou les critiques de l'opinion sur le détail de ses réformes ; dans le même temps, les opposants sont sonnés par la défaite à la présidentielle et doivent faire face à des divisions internes.

Ce n'est pas faute enfin d'exemples passés montrant à quel point se baser sur les rapports de force qui prévalent avant l'élection du Président conduit à manquer la dynamique induite par la présidentielle. En 2002, Le Monde avait publié des projections de sièges aux législatives basées sur les résultats du premier tour de la présidentielle : elles montraient une courte défaite de la droite, qui devait gagner 276 sièges contre 297 à la gauche. L'UMP en a en fait obtenu eu 398. En 2007, le quotidien annonçait 469 "triangulaires virtuelles" en raison du score élevé de François Bayrou au premier tour de la présidentielle. Il y en a eu finalement... une seule.


Des vieilles maisons en ruine

Pour être juste, une partie des observateurs sceptiques sur les chances d’En Marche à la présidentielle avaient bien à l’esprit cette dynamique post-présidentielle. Mais elle pensait qu’elle se briserait sur la force des partis traditionnels, le PS et les Républicains bénéficiant des positions (des députés sortants) et des moyens (un appareil, des militants et un budget) nécessaires pour emporter une campagne législative.

Cette erreur d'analyse est un peu plus subtile, mais elle n'en restait pas moins largement évitable. Parce que toute la séquence électorale commencée à l'automne dernier, comme d'ailleurs les sondages d'opinion, montraient la grande faiblesse de la position des partis dominants.

Depuis l'été 2016 en effet, tous ceux qui croyaient que la réussite électorale passait par le contrôle d'un parti ont été démentis par les scrutins : Nicolas Sarkozy a été éliminé au premier tour de la primaire de la droite; les candidats proches de la direction du PS (Valls et Peillon) ont échoué à la primaire de la gauche; de façon plus anecdotique, la primaire des écologistes a vu la défaite de Cécile Duflot, et la confirmation de la règle. Partout, ce sont les candidats qui en ont appelé aux militants contre la direction qui l'ont emporté.

Cette dynamique du sortez les sortants s'est appliquée, à un niveau supérieur, aux partis eux-mêmes. Les candidats des Républicains et du Parti socialiste n'ont pas franchi le premier tour de la présidentielle. Cela reflète bien sûr en partie les faiblesses de leurs candidats, mais aussi l'impopularité profonde des grands partis eux-mêmes. En mars 2017, selon le baromètre Kantar TNS, le PS était proche de son record d'impopularité atteint en 1993 et en 2014 (60 % de mauvaises opinions, seulement 27 % de bonnes). Les Républicains étaient dans une position très similaire (58 % de mauvaises opinions contre 27 % de bonnes), proches eux aussi de leur plus mauvais scores depuis la création de l'UMP en 2002.

Le seul moyen pour de tels partis de gagner des législatives aurait été d'affronter des partis aussi ou encore plus impopulaires qu'eux, comme le Front National (23 % de bonnes opinions contre 68 % de mauvaises en mars). Mais ils se trouvent dans une situation de grande faiblesse face à LREM, qui bénéfice pour l'instant à plein de la popularité qui va avec la nouveauté.


Pas populaire sans raisons

La troisième erreur a consisté à sous-estimer la popularité d'Emmanuel Macron. Ce mauvais diagnostic avait à mon sens deux ressorts principaux : d'une part, la présence de 4 candidats autour de 20 % d'intention de vote dans les sondages de premier tour pouvait laisser croire qu'ils étaient également populaires (ou impopulaires) ; d'autre part, ceux que la personne et le programme du Président hérissent (j'en connais) ont pu en conclure qu'il ne pouvait pas être populaire parmi une majorité des Français. Un exemple fameux de cette dernière position est la "lettre ouverte à un futur président déjà haï" de François Ruffin, publiée par Le Monde dans l'entre deux tours. 

En réalité, Emmanuel Macron était avant la présidentielle un homme politique apprécié des Français. Dans le baromètre politique Ifop d'avril, il obtenait 55 % de bonnes opinions et était la 3e personnalité politique la plus populaire, derrière Jean-Luc Mélenchon et Alain Juppé (Marine le Pen et François Fillon étaient eux très impopulaires). Comme on pouvait s'y attendre, la victoire présidentielle a encore renforcé le jugement positif sur Emmanuel Macron. Il recevait en mai 67 % de bonnes opinions, seulement dépassé par Nicolas Hulot (81 %).

Ce niveau de soutien montre qu'Emmanuel Macron n'est pas (encore?) aussi polarisant que certains avaient pu le croire. Dans les enquêtes d'opinion précédant le 1er tour, il était ainsi souvent le 2e ou le 3e choix non seulement des électeurs de François Fillon et Benoît Hamon, mais aussi de Marine Le Pen et de Jean-Luc Mélenchon, 

Le soutien au candidat (et au Président aujourd'hui) était certes très différenciée sociologiquement : l'enquête Ipsos sur la sociologie des électorats du premier tour fait bien apparaître un gradient selon la catégorie socio-professionnelle (vote Macron à 16 % pour les ouvriers mais 33 % pour les cadres), le revenu ou le diplôme, Mais il l'est nettement moins géographiquement, à rebours de l'image d'une France coupée en deux : Emmanuel Macron obtenait par exemple au 1er tour 21 % des voix en milieu rural, où il n'était devancé que par Marine Le Pen (23 %). 

Comme le notait l'excellent Matthieu Gallard, LREM se trouve donc en position de force aux législatives : à l'inverse du Front National, son soutien est bien reparti géographiquement, ce qui lui permet d'être compétitif dans une grande majorité de circonscriptions; en outre, la position sinon centriste, du moins centrale, du mouvement lui permet de rallier des soutiens venus de gauche comme de droite au second tour. 

Cette martingale, combinée à la dynamique de la présidentielle, devrait ainsi offrir au Président une majorité et les moyens de sa politique. Sans surprise.

05 novembre 2014

Mardi soir en direct (2014 midterms edition) 

00H20 : s'il ne fallait qu'un graphique pour expliquer la spécificité des élections de mi-mandat aux Etats-Unis, ce serait celui-là (piqué à la BBC)

Bar chart on voter turnout

Pour le dire vite : une seule élection vous manque, et les urnes sont désertées. 

L'absence d'une élection présidentielle fait que la participation est toujours beaucoup plus faible à mi-mandat, alors que le reste des élections est le même : renouvellement de l'ensemble de la Chambre des représentants, du tiers du Sénat, d'une partie des 50 gouverneurs (et d'ailleurs de davantage de gouverneurs l'année des midterms : 36 sur 50 cette fois-ci), de la grande majorité des assemblées des Etats fédérés (46 sur 50 en 2014). Sans compter la pléiade d'élections secondaires et de référendums qui font le charme de la démocratie américaine.

Cette moindre participation n'arrange pas les démocrates, car la plus faible participation s'explique surtout par la tendance d'une partie de leur électorat traditionnel (jeunes et minorités) à rester chez eux. Ce qui arrange encore moins les démocrates est que les midterms sont tout aussi traditionnellement des élections défavorables au parti du président en place. Depuis un siècle, seuls Roosevelt (1934), Clinton (1998) et Bush (2002) ont réussi à faire mentir cette règle électorale.

Il est déjà certain qu'Obama ne sera pas le quatrième. Les républicains vont confortablement garder le contrôle de la Chambre des représentants : il comptent 233 sièges sur 435 et devraient augmenter leur total d'une dizaine de sièges. Il est sûr aussi qu'ils vont augmenter leur nombre de sénateurs - il en ont 45 aujourd'hui. L'enjeu essentiel de la soirée est de savoir s'ils attendront le total de 51 qui leur permettrait de prendre le contrôle du Sénat.

Cela semble désormais probable, si l'on en croit les derniers sondages : Nate Silver estime à 76 % et le New York Times à 75 % la probabilité que les républicains remportent le Sénat.

00H45: La situation au Sénat est assez simple. Il y a 10 élections sénatoriales (sur 36 disputées en 2014) où le résultat reste incertain. Il s'agit, dans l'ordre décroissant de probabilité de victoire républicaine des Etats suivants :  Kentucky, Arkansas, Louisiane, Colorado, Iowa, Géorgie, Alaska, Kansas, New Hampshire et Caroline du Nord. Les républicains doivent en remporter 6 pour prendre le contrôle du Sénat, les démocrates 5 pour le conserver.

00H55 : La carte des horaires de fermeture des bureaux de vote de Daily Kos est d'autant plus précieuse que les Etats américains s'évertuent à ne pas respecter la logique géographique. Les premiers dépouillements ont commencé à minuit heure française dans l'Indiana et le Kentucky, alors que ces deux Etats comptent une partie de leur territoire dans le fuseau horaire du Centre des Etats-Unis.

Map of Nov. 4, 2014 poll closing times

01H10 : Les tous premiers résultats du Kentucky (4 % des bulletins dépouillés) vont dans le sens d'une nette victoire du sénateur républicain sortant Mitch McConnell (près de 10 pts d'avance selon les simulations du New York Times). Ce n'est pas une surprise, ce qui est en soi une mauvaise nouvelle pour le camp démocrate. Le vrai test sera le New Hampshire, où la sénatrice démocrate Jeanne Shaheen était donnée favorite face au républicain Scott Brown. Si elle perd, on peut s'attendre à une débâcle pour les démocrates.

01H15 : Ca n'a pas traîné. Toutes les télés américaines annoncent la victoire au Kentucky de Mitch McConnell, qui deviendrait le chef de la majorité au Sénat (Senate Majority Leader) si les républicains en prenaient le contrôle. Il ne leur manque plus que cinq sièges.

01H20 : Les deux choses les plus dures, dans ce exercice de bloguage en direct, c'est de jongler entre 50 onglets ouverts et de trouver un lien vers le flux vidéo d'une télé américaine. Mission accomplie pour la deuxième (ABC).

01H25 : Nate Silver sur ABC : "It could be a pretty good night for the Republicans". C'est une manière diplomatique de le dire.

01H35 : Les républicains reprennent sans surprise la Virginie occidentale. Shelley Moore Capito sera la première sénatrice républicaine de cet Etat depuis 1958. Le fait de tirer avec son fusil lors de rassemblements politiques (sic vidéo) n'a pas suffi pour la démocrate Nathalie Tenant.

01H40 : Ce qui est une vraie surprise, c'est que le sénateur démocrate Mark Warner soit en difficulté en Virginie (538 prévoyait une victoire de Warner avec 9 pts d'avance). Tout cela sent très mauvais pour les démocrates.

01H50 : Il est encore un peu tôt pour dire que Perdue a gagné, mais le candidat républicain semble bien parti pour l'emporter en Géorgie face à la démocrate Michelle Nunn.

02H05 : Au fait, le faible niveau de popularité de Barack Obama qui explique en partie la mauvaise nuit des démocrates est de... 43 %.

02H20 : Encore une élection serrée en Floride. Cette fois pour le poste de gouverneur. Si le sortant républicain Rick Scott l'emporte, son opposant démocrate Charlie Crist aura réussi une performance rare : réussir à perdre une élection à la fois comme candidat républicain (sénatoriale 1998), comme candidat indépendant (sénatoriale 2010) et comme candidat démocrate (2014).

02H30 : Le modèle américain de soirée électorale (pas un seul politique sur les plateaux télévisés) est très supérieur au modèle français (presque uniquement des politiques sur les plateaux télévisés).

02H35 : Plus que 4 pour les républicains. Le républicain Tom Cotton, un ancien militaire qui avait accusé le New York Times de trahison, reprend l'Arkansas au sortant démocrate Mark Pryor.

02H40 : Enfin une bonne nouvelle pour les démocrates! Jeanne Shaheen conserve son siège dans le New Hampshire.

02H45 : L'adversaire de Shaheen, Scott Brown, faisait partie des possibles candidats républicains pour la présidentielle de 2016. Plus maintenant.

02H55 : ABC meuble en attendant la flopée de résultats de 21H heure de Washington. Je me demande gravement si j'ai encore des lecteurs éveillés.

03H00 : Très déçu de la défaite dans le Dakota du Sud du candidat indépendant Larry Pressler, qui avait plaisanté sur ses faibles chances en affirmant qu’il demanderait « un recompte » s'il gagnait l’élection.

03H05 : Pour l'instant, c'est une excellente nuit pour les sites qui prévoient le résultat des élections à partir des sondages. Tous les résultats connus avaient été annoncés par 538 et The Upshot (New York Times).

03H15 ; Les électeurs de l'Illinois votent pour augmenter le salaire minimum de 8,25 à 10 $ (7,25 $ au niveau fédéral). Les économistes du travail qui cherchent à répliquer la fameuse étude de Card et Krueger (pdf) se frottent les mains.

03H35 : Le problème avec les soirées électorales américaines, c'est qu'il y a des moments où il ne se passe pas grand chose. Comme maintenant. Pour patienter, et ceux qui l'ont manqué, LE spot électoral de 2014, de la candidate républicaine dans l'Iowa, Joni Ernst.

03H45 : Il suffisait de demander! Il y aura donc un second tour le 6 décembre en Louisiane, où Marie Landrieu essaye de sauver le siège de sénateur qu'elle occupe depuis 1997. Cela promet une mémorable "Battle on the Bayou" si les républicains n'ont pas réussi à remporter le Sénat dès cette nuit.

03H50 : Marie Landrieu est la fille de Maurice "Moon" Landrieu qui a été le maire de la Nouvelle Orléans dans les années 1970 et a eu 9 enfants : Marie, Mark, Melanie, Michelle, Mitchell, Madeleine, Martin, Melinda et Maurice Jr. 

03H55 : Too late.

04H05 : On a tendance à l'oublier mais il y a une autre chambre que le Sénat au sein du Congrès américain. Elle s'appelle la Chambre des représentants et les républicains vont en garder le contrôle. Oui, on le savait déjà.

04H20 : si l'on reprend les cinq scénarios possibles pour le Sénat décrits par Nate Silver, on est à mi-chemin entre la nette victoire républicaine et la déferlante républicaine - ce serait le cas si les démocrates perdaient la Caroline du Nord et/ou la Virginie.

04H30 : ABC annonce la défaite du sénateur démocrate Mark Udall dans le Colorado. Ceteris Paribus annonce que les républicains vont reprendre le Sénat.

04H35 : Le républicain Rick Scott conserve son siège de gouverneur en Floride. Le républicain Scott Walker conserve son siège de gouverneur dans le Wisconsin. Quand ça veut pas...

04H40 : L'autre grand perdant de la soirée : les commentaires sur les blogs. En tout cas sur celui-là. 

04H45 : La moitié des résultats n'est pas connu que ABC a déjà lancé le débat sur la présidentielle de 2016, et sur les chances de Jeb Bush contre Hillary Clinton. I can't wait,

04H55 : Je peux enfin l'écrire. (David) Perdue a gagné en Géorgie. A supposer que Marie Landrieu soit battue en Louisiane, il serait l'un des deux sénateurs américains avec un patronyme français (Perdue vient de "par Dieu") avec le sénateur de l'Idaho Mike Crapo.

05H00 : le site progressiste Daily Kos titre "Ah, f*uck this night". Kay Hagan est mal partie en Caroline du Nord, Le scénario de la déferlante républicaine est désormais le plus probable. 

05H05 : Ce qui rend les discussions sur ABC sur la façon dont les démocrates pourraient garder le Sénat d'autant plus ridicules.

05H25 : Et le suspense désormais proche de zéro, surtout avec la victoire du sénateur républicain Pat Roberts dans le Kansas. Concluons, puisqu'il est tard : c'est une très bonne nuit pour les républicains, une mauvaise pour les démocrates. A part la (presque?) surprise en Virginie, les sondages ont correctement permis de prévoir le résultat des principales élections sénatoriales, mais ont sous-estimé l'amplitude de la victoire des républicains. Obama devra faire face à un Congrès entièrement acquis aux républicains jusqu'en 2016 mais cela pourrait paradoxalement forcer le GOP à coopérer davantage avec le président. L'élection de 2016 sera très différente, car la participation sera plus forte, et la "carte" des sièges en jeu au Sénat sera beaucoup mois favorable aux républicains. Mais les résultats de ce soir sonnent comme un avertissement pour les démocrates, qui sont en difficulté dans des Etats qu'ils pensaient acquis (Colorado, Virginie à un moindre degré) et n'ont pas réussi à progresser en territoire républicain (notamment en Géorgie, qui semblait démographiquement plus favorable). Et l'hypothèse d'une reprise du Sénat par les démocrates dès 2016 est très compromise au vu de la taille de la majorité républicaine - les républicains pourraient obtenir 54 sièges s'ils l'emportent en Louisiane et dans l'Alaska.

05H30 : Le mot de la fin, pour rappeler que les Etats-Unis sont un pays fascinant, divers et qui n'est pas à une contradiction près.



01 mai 2013

Et les OPA sauveront l'économie française 

Le Wall Street Journal l'affirmait ce matin, et le ministre l'a confirmé cet après-midi : Arnaud Montebourg est bien personnellement intervenu pour bloquer le rachat de Dailymotion par Yahoo!. En se justifiant ainsi :
Nous souhaitons un développement équilibré. Nous sommes pour une solution 50-50 du type de celle qui a existé entre Renault et Nissan, où l'identité des deux entreprises est préservée. C'est l'intérêt de la France et l'intérêt de Dailymotion.
Vu la façon dont Yahoo! a traité les sociétés qu'il a rachetées par le passé, la thèse selon laquelle cette intervention politique était dans l'intérêt de Dailymotion (ou au moins de ses utilisateurs) peut se plaider. Je suis en revanche beaucoup beaucoup plus réservé sur l'idée que les solutions "où l'identité des deux entreprises est préservée" soit dans l'intérêt de la France.

Je suis même persuadé qu'ouvrir très largement la porte au rachat des entreprises françaises par des sociétés étrangères serait l'une des meilleures choses qui puisse arriver à l'économie française. Ou à tout le moins, mais cela revient à mon sens au même, à l'état des relations sociales en France. Et c'est l'économiste Thomas Philippon qui m'en a convaincu.

En 2007, bien avant d’atterrir au cabinet de l'actuel ministre de l'économie et des finances, Philippon avait en effet commis un excellent petit livre sur les relations sociales en France, publié à la non moins excellente République des idées. Le Capitalisme d'héritiers (voir les critiques de Lectures et d'Econoclaste) s'appuyait sur des enquêtes internationales d'opinion pour montrer que :
  1. contrairement à ce qu'affirment régulièrement certains commentateurs et hommes politiques, il n'y a pas de faiblesse ou de déclin post-35 heures de la "valeur travail" en France : la place qu'accorde les Français au travail est en réalité extrêmement élevée, et nettement supérieure à celle que disent lui donner les habitants des autres pays développés ;

  2. l'état des relations sociales en France est en revanche catastrophique : que l'on interroge les patrons ("les relations entre syndicats et patronats sont-elles constructives ou conflictuelles?") ou les salariés ("êtes-vous personnellement satisfait au travail?"), la France se retrouve systématiquement en queue des classements internationaux.
Selon Philippon, et pour le résumer à gros traits, cette singularité française trouve son origine à la fois dans l'histoire du syndicalisme français (développement tardif par rapport à d'autres pays, en raison de la méfiance de l’État à l'égard des corporations) et dans celle du patronat français (caractère paternaliste d'un capitalisme familial beaucoup plus présent en France).

En dehors de toute considération macroéconomique, une telle situation est évidemment néfaste en soi : les salariés préfèrent en général trouver de la satisfaction dans leur travail et l'immense majorité des syndicalistes et des patrons préfèrent entretenir entre eux des relations constructives. Mais Philippon montre en outre, études économiques à l'appui, qu'il est probable que la mauvaise qualité des relations sociales soit aussi un facteur de chômage élevé, sans doute parce qu'elle réduit la probabilité que patronat et syndicats parviennent à se coordonner efficacement pour répondre à un choc sur le marché de l'emploi.

Ce diagnostic le conduit à proposer des réformes pour renforcer la représentativité des organisations syndicales et patronales, revoir la formation des managers ou encore réduire les incitations (par exemple fiscales) à la transmission dynastique des entreprises. Autant de prescriptions intéressantes mais qui laissent à mon sens de côté une solution vers laquelle conduisait logiquement son étude. Pour démontrer que capitalisme familial à la française est bien une des causes des mauvaises relations sociales, Philippon relève en effet que les entreprises qui arrivent en tête des réguliers classements sur "les boîtes où il fait bon travailler" sont souvent en France les filiales de groupes étrangers. Dans les autres pays, au contraire, ce sont des entreprises nationales qui occupent les premières places.

Si tel est bien toujours le cas, la prise de contrôle de sociétés françaises par des groupes étrangers apparaît alors une solution beaucoup plus directe et efficace, parce qu'elle permet de remplacer un management à la française peu performant par un management étranger qui a de grandes chances de lui être supérieur. (d'accord, Mittal est probablement un contre-exemple).

Conclusion : sauf dans des cas limités où des enjeux de souveraineté nationale peuvent se poser (pas Danone), laisser les étrangers racheter librement les fleurons de notre industrie et de nos services nationaux est sans doute une excellente idée. Et la solution de Montebourg consistant à permettre de telles opérations à condition de préserver l'identité de l'entreprise française rachetée pourrait bien être la pire des options.

01 mai 2012

Pourquoi Sarkozy va perdre* 

Je l'avais écrit en 2004 et je n'ai pas changé d'avis depuis : en dépit de mes sympathies partisanes (auxquelles s'ajoute ces jours-ci un haut-le-cœur certain quand j'entends certains propos de l'actuel président), je continue à "trouver François Hollande désespérément médiocre, et Nicolas Sarkozy invariablement impressionnant."

Et pourtant, je suis depuis longtemps persuadé que Nicolas Sarkozy ne sera pas réélu président de la République. Pour une raison fort simple : il est extrêmement impopulaire. Pas juste impopulaire comme un président en fin de mandat, qui a subi la classique usure du pouvoir. Pas seulement impopulaire comme un dirigeant politique confronté à une crise économique grave et à la nécessité de redresser les comptes publics. Mais exceptionnellement et durablement impopulaire, comme on n'en trouve que peu d'exemples à l'étranger ou dans l'histoire politique française.

Une première manière de l'envisager est de revenir sur l'évolution de la cote de popularité de Nicolas Sarkozy depuis 2007. Une manière simple de jauger la popularité d'un homme politique est de considérer si le pourcentage de ceux qui approuvent son action est supérieure à celle qui la désapprouvent. C'est ce que les sondeurs appellent le solde d'opinion, la cote ou l'indice de confiance.

A cette aune (cf. graphique ci-dessous, version grand format en cliquant dessus), le président Sarkozy a été populaire pendant exactement 7 mois, de mai à décembre 2007. Depuis janvier 2008, seuls trois sondages, au tournant de l'année 2009, lui ont donné un indice de confiance (marginalement) positif. Ce qui veut dire que l'action de Nicolas Sarkozy est depuis plus de 4 ans continûment rejetée par une majorité de l'opinion, ce rejet étant massif depuis plus de 2 ans.




Mais cette impopularité n'a-t-elle pas aussi frappé les prédécesseurs de Nicolas Sarkozy à l’Élysée? Non, à une exception près.

Si l'on fait la moyenne des indices de confiance enregistrés pour chaque mandat présidentiel depuis 1981 (données TNS Sofres, retracées dans le graphique ci-dessous), on obtient un résultat de +6 pour le premier mandat de François Mitterrand, de -1 pour son second mandat et de - 1 également pour le premier mandat de Jacques Chirac.

Ledit Chirac a ensuite décidé d'oublier les conditions de son élection en 2002, ce qui lui a permis de battre (largement) le record d'impopularité établi par Mitterrand au début 1993 et à parvenir à une moyenne de -27 sur l'ensemble de son second mandat. C'est à dire que le pourcentage de ceux qui désapprouvaient son action étaient, en moyenne sur 2002-2007, supérieur de 27 points au pourcentage de ceux qui l'approuvaient. Autant dire un gouffre.

Et Sarkozy depuis 2007? -27 points également.




Pour enfoncer le clou de mon argument au-delà des moyennes et des courbes, je m'autorise un petit détour historique.

Pour le meilleur et pour le pire, je suis suffisamment vieux expérimenté pour avoir de vagues souvenirs du climat politique du début des années 1990. François Mitterrand avait alors eu la brillante idée de congédier un premier ministre populaire et de le remplacer par une proche dont la capacité à s'imposer à Matignon était pour le moins discutable. Le PS essayait tant bien que mal de retrouver un semblant d’unité après le désastre du congrès de Rennes de mars 1990. Le ralentissement économique mondial du début des années 1990 et la politique du franc fort allaient finir par précipiter la France dans la récession au printemps 1992, le taux de chômage dépassant les 10 % pour la première fois depuis 1945 un an plus tard. Et les "affaires"se rapprochaient de plus en plus du président de la République.

Le discrédit qui pesait sur les socialistes était tel que certains constitutionnalistes avaient pu se demander à l'époque si la gauche aurait suffisamment de députés après les législatives de mars 1993 pour pouvoir saisir le Conseil constitutionnel (60 députés sont nécessaires). Ce fut le cas. De justesse : 52 députés socialistes, 22 communistes. Contre 458 députés RPR et UDF.

La gauche parlementaire a bien sûr vécu d'autres périodes difficiles depuis 1945 : 1958, 1969, 1983 ou 2002 en particulier. Mais on peut soutenir que celle-là était la pire. Ce qui rend d'autant plus frappant le fait que la cote de popularité de Sarkozy (33 % de popularité, indice de confiance de -30 dans le dernier baromètre TNS Sofres) est aujourd'hui à peine supérieure au pire score de Mitterrand sur la période 1991-1993 (31 % et -36 dans le baromètre de février 1993). Je répète : Sarkozy, même après la remobilisation de ses soutiens depuis son entrée en campagne, est aujourd'hui presque aussi (im)populaire que Mitterrand avant la débâcle socialiste des législatives de 1993.

Dans ce contexte, le fait pour le président de parvenir au second tour en réalisant (au forceps) l'unité dans son camp est déjà une performance politique. Mais compte tenu du rejet massif dont il fait l'objet, la seule voie vers la victoire pour Nicolas Sarkozy était de discréditer irrémédiablement son adversaire auprès de l'opinion. Il n'y est pas parvenu. Il sera donc battu*.

* intervalle de confiance à 95 % (confer)

23 avril 2012

[Sondages] Les sondeurs se sont-ils plantés? 

Sur TF1 ce soir, Nadine Morano a fustigé "le plantage total des instituts de sondage", en mettant en avant le fait que "ce qui est arrivé ce soir, c'est que les deux [premiers] candidats sont arrivés dans un mouchoir de poche".

La ministre chargée de l'apprentissage et de la formation professionnelle ne pouvait pas plus parfaitement se tromper. Une comparaison des derniers sondages des 8 instituts avec les résultats du premier tour (la moyenne des estimations à minuit) montre en effet que la performance des sondeurs a été plutôt bonne.

En 2007, comme je le notais vendredi, l'erreur moyenne de l'ensemble des sondeurs sur les scores des 4 grands candidats avait été de 2,6 pt, le meilleur institut (Ipsos) présentant une erreur moyenne de 2,2 pt. En 2012, comme le détaille le tableau ci-dessous (cliquer pour agrandir), l'erreur moyenne sur les 5 grands candidats n'est que de 1,8 pt, et le meilleur institut (TNS Sofres) est à seulement 1,4 pt.




Certes, comme le montre le graphique ci-dessous, l'écart entre le score final (triangulé) de Marine Le Pen a été de plus de deux point supérieur à la moyenne des dernière enquêtes. Et Jean-Luc Mélenchon se trouve à près de trois points plus bas.




Mais, à l'inverse de 2007, les scores des deux premiers candidats ont été très correctement prévus. Ce qui explique que, contrairement à ce que laisse penser Nadine Morano, l'écart au premier tour entre François Hollande et Nicolas Sarkozy est exactement celui auquel on pouvait s'attendre en suivant la tendance des sondages.




Et le score de Ceteris Paribus, dans tout ça? Il est correct, sans plus : une simulation sur la base des tendances des derniers sondages aurait présentée une erreur moyenne de 1,8 pt. Soit exactement le même score que la moyenne des sondages. Ce n'est pas déshonorant. Mais pas spécialement glorieux non plus. Finalement, la loi de 1977 a peut-être du bon.

Post scriptum (25/04) : avec les résultats définitifs, la performance des sondeurs est encore meilleure. L'erreur moyenne (RMSE) est à 1,6. Les bons élèves : TNS Sofres (erreur moyenne à 1,3), Harris et Opinion Way (1,4 tous les deux). Soit un sondeur par téléphone et deux par Internet. Comme quoi...

21 avril 2012

[sondages] Stupida lex, sed lex 

Les courbes finales de premier tour pour 2012 devront attendre. Et je ne publierai pas de prévision.

La loi n° 77-808 du 19 juillet 1977 relative à la publication et à la diffusion de certains sondages d'opinion, modifiée en particulier par la loi n° 2002-214 du 19 février 2002, m'en empêche. Son article 11 dispose en effet que :
La veille de chaque tour de scrutin ainsi que le jour de celui-ci, sont interdits, par quelque moyen que ce soit, la publication, la diffusion et le commentaire de tout sondage tel que défini à l'article 1er. Cette interdiction est également applicable aux sondages ayant fait l'objet d'une publication, d'une diffusion ou d'un commentaire avant la veille de chaque tour de scrutin. Elle ne fait pas obstacle à la poursuite de la diffusion des publications parues ou des données mises en ligne avant cette date.
L'article 1 définit un "sondage" de la façon suivante :
Sont régies par les dispositions de la présente loi la publication et la diffusion de tout sondage d'opinion ayant un rapport direct ou indirect avec un référendum, une élection présidentielle ou l'une des élections réglementées par le code électoral ainsi qu'avec l'élection des représentants à l'Assemblée des Communautés européennes.

Les opérations de simulation de vote réalisées à partir de sondages d'opinion sont assimilées à des sondages d'opinion pour l'application de la présente loi.
Contra Maître Eolas, je considère, sur la base de la logique élémentaire et de la claire volonté du législateur, que les sondages visés à l'article 1 sont uniquement ceux qui ont un lien direct ou indirect avec l'élection en cours. Autrement dit, le fait d'être à la veille du premier tour de la présidentielle ne m'empêche nullement de commenter des sondages ayant trait à la présidentielle 2007 et a fortiori à d'autres élections passées.

Je suppose, a contrario, qu'un sondage ayant trait aux prochains élections législatives (ou à la prochaine élection présidentielle) pourrait être considéré comme ayant un lien indirect avec l'élection en cours. La Cour de Cassation avait ainsi jugé en 1996 qu'une enquête comportant la question "êtes-vous personnellement très favorable, plutôt favorable, plutôt opposé ou très opposé à la construction de l'Europe?" présentait un rapport indirect avec le référendum sur le traité de Maastricht du 20 septembre 1992 et que sa publication moins d'une semaine avant le scrutin n'était en conséquence pas licite.

La loi du 19 février 2002 a ramené ce délai à une journée avant le scrutin, suite un arrêt de la Cour de Cassation du 4 septembre 2001 jugeant la législation française incompatible avec la Convention européenne des droits de l'homme. Mais elle a également étendu l'interdiction de commenter et de diffuser aux sondages déjà publiés avant la veille du scrutin. Si bien que la législation actuelle se retrouve sur ce point plus restrictive que la loi de 1977, qui avait été élaborée par des ministres dont l'amour des libertés publiques n'était pas la première caractéristique.

Les dispositions ajoutées en 2002 m'interdisent donc publier un graphique présentant de manière synthétique l'évolution du score des principaux candidats (ce qui s’apparenterait à une diffusion de sondages déjà publiés). Tandis que le texte de 1977 m'empêche de m'essayer à une prévision des résultats du premier tour (car "les opérations de simulation de vote réalisées à partir de sondages d'opinion sont assimilées à des sondages d'opinion").

Au cours du débat au Sénat en 2002 sur la modification de la loi de 1977, le toujours sénateur socialiste Jean-Pierre Sueur notait fort justement :
il est probable que le nombre de personnes ayant accès aux informations diffusées soit par la presse étrangère, soit par Internet, soit par les deux, ira croissant. Monsieur le ministre, il sera par conséquent utile, à l'avenir, de réfléchir, peut-être à la faveur de l'expérience, sur l'article 2 et de nous interroger sur l'interdiction faite de commenter les sondages existant depuis six mois, depuis quatre mois, depuis huit jours, alors que pourront toujours être diffusés les commentaires et informations publiés avant le vendredi. C'est une question délicate, car il n'est pas facile de trouver le bon équilibre. Il faudra sans doute revenir sur certaines dispositions pour tâcher de les améliorer, étant entendu que ce n'est pas là chose aisée.
Cette amélioration nécessaire a failli avoir eu lieu. Une proposition de loi sur les sondages visant à mieux garantir la sincérité du débat politique et électoral a été déposée le 25 octobre 2010. Elle prévoyait en particulier de "modifier le droit en vigueur en autorisant le commentaire de sondages publiés avant la veille du scrutin". Elle a été votée à l’unanimité par le Sénat le 14 février 2011. Le Gouvernement avait jugé bon de s'opposer à ce que l'Assemblée nationale lui emboîte le pas.

Il ne serait pas stupide que la nouvelle majorité à l'Assemblée nationale, quelle qu'elle soit, inscrive ce texte à l'ordre du jour et l'adopte rapidement.

20 avril 2012

[sondages] Retour sur 2007 

Le premier tour approchant, certains camarades en lecture de courbes ont eu la bonne idée de s’intéresser à la performance prédictive des sondages avant le premier tour des présidentielles précédentes. C’est en particulier le cas de Thomas Wieder du Monde, qui rappelle fort justement que les sondeurs se sont plantés grave en 2002, au moins sur l’essentiel, et que leur performance était beaucoup plus respectable en 2007, à un swap Sarkozy (plus haut) et Le Pen (plus bas) près. Tout en démontrant qu’il est encore possible en 2012 de faire des tableaux sous DOS.

Comme d’habitude, je pense qu’on peut affiner l'analyse. Au moins sur 2007, dans la mesure où je n’ai pas (encore ?) pris la peine de rassembler les données de sondage de 2002. Il y a 5 ans, donc, les 3 derniers mois de campagne considérés au prisme des sondages ressemblaient à ça (cliquer sur l'image pour l'agrandir, tendance calculée comme dans les notes précédentes, résultats électoraux triangulés).




Vu de 2012, l’élément le plus frappant est la relative stabilité des rapports de force. Certes, il y a la très spectaculaire percée de François Bayrou, qui part de très bas (6 % dans un sondage CSA du 6 janvier 2007), parvient à rattraper Ségolène Royal (au moins selon Ifop, qui les place tous les deux à 23 % dans un sondage du 9 mars), avant de voir sa courbe piquer du nez jusqu’à la présidentielle. Mais la tendance des intentions de vote en faveur de Jean-Marie Le Pen selon les sondeurs était quasiment constante de janvier à avril 2012, entre 12 et 14 %.

Surtout, comme le montre le zoom ci-dessous, la tendance de l’écart entre Nicolas Sarkozy et Ségolène Royal est aussi restée très stable, entre 3 et 4 points de janvier à avril 2007, même si quelques rares sondages pouvaient faire croire à un croisement des courbes (2 points d’avance pour Royal dans une enquête Ifop du 5 janvier, 1 point dans un sondage CSA du 20 février).



Si bien que la dernière présidentielle apporte un démenti cinglant (version hollandaise) / une exception qui confirme la règle (version sarkozyste) à l’adage selon lequel « le favori de janvier n’est pas le vainqueur de juin ».

Comment s’étaient comportés alors les sondeurs ? Une façon frustre de le faire est de calculer une moyenne sur les derniers sondages publiés par les différents instituts et de la comparer ensuite avec les votes effectifs du premier tour. Une manière plus élaborée consiste à calculer une erreur moyenne pour chaque institut de sondage. Le tableau ci-dessous donne l’erreur moyenne (plus précisément la racine carrée de l'erreur quadratique moyenne, RMSE en anglais, qui permet de surpondérer les erreurs importantes) de chaque institut pour les 4 candidats arrivés en tête en 2007 : je pars du principe que la bonne prévision du score des petits candidats est moins importante. On constate qu'Ipsos avait eu la meilleure performance, LH2 et surtout CSA les moins bonnes.



Est-ce que mes outils permettaient de prévoir de façon satisfaisante les résultats du premier tour ? Pour le savoir, j’ai regardé ce que donnait la tendance des sondages, calculée sur les 7 derniers jours, au samedi 21 avril 2007. Et j’ai comparé le résultat à ceux du premier tour et à une prévision naïve (la moyenne des dernières enquêtes des différents instituts). La bonne nouvelle est que mon modèle aurait obtenu un bon classement : s’il était en compétition avec les autres instituts, il aurait été deuxième derrière Ipsos, avec une erreur moyenne de 2,5 pts. La moins bonne nouvelle est qu’il n’est que légèrement plus performant (0,1 pt) qu’une prévision consistant à faire la moyenne des différents instituts.



Est-il possible d'améliorer la prévision pour faire mieux ? Ma méthode actuelle permet de sous-pondérer des prévisions datées, ce qui était utile en 2007 pour diminuer le poids accordé à l’enquête LH2, achevée une semaine avant le premier tour, et qui s’est avérée loin du compte. Mais elle ne permet pas d’écarter les mauvaise prévisions récentes, ce qui était le cas de l’enquête CSA du vendredi 20, qui avait considérablement surestimé le score de Jean-Marie Le Pen et sous-estimé celui de Nicolas Sarkozy.

Une idée serait d’utiliser les résultats passés pour pondérer de manière différente les instituts en fonction de leur performance. Par exemple, je pourrais faire une prévision 2012 à la lumière des erreurs de 2007. La difficulté est que les méthodes et les équipes ont pu beaucoup changer en 5 ans. Sous les probables sarcasmes de certains de mes lecteurs, j'affirme qu'on peut ainsi espérer que les sondeurs dont les résultats ont été décevants ont cherché à améliorer leurs outils depuis. L’idéal serait de pouvoir juger de la performance des sondeurs dans les mois précédant l’élection. Outre-Atlantique, la tâche est facilitée par l’organisation de primaires dans 57 50 Etats l’année de la présidentielle. Primaire socialiste mise à part, il n’existe rien de tel en France pour l’instant.

Une solution plus créative est de tenter d’évaluer la performance des instituts en calculant un RMSE correspondant à l'écart entre le résultat de leurs enquêtes et la tendance moyenne, qui dépend de l'ensemble des résultats publiés par les sondeurs. L’intérêt de la méthode est de pouvoir pénaliser les instituts qui ont tendance à publier des résultats suffisamment éloignés de la tendance (des outliers, en bon angliche), pour qu'on puisse douter de leur validité. Une telle approche part du principe que la moyenne des sondeurs a plus de chance d’avoir raison qu’un sondeur unique, pris au hasard. Et que les outliers ne sont pas distribués totalement au hasard, mais nous disent quelque chose sur la valeur intrinsèque des méthodes employées par les différents sondeurs.

C’est un principe qui peut être discuté. Mais la méthode donne des résultats intéressants sur 2007 : l’écart à la tendance moyenne (calculée sur 7 jours, de début janvier 2007 au premier tour) permet ainsi de bien prévoir la capacité prédictive des différents instituts. En particulier, l’institut le plus proche de la tendance (Ipsos) était celui qui était le moins éloigné des résultats et l’inverse était également vrai pour CSA. La seule exception à la règle concerne LH2 mais on peut arguer qu’il était pénalisé par une enquête précoce par rapport au premier tour.



Si ça intéresse encore quelques lecteurs, je reviendrais demain sur 2012. Avec des courbes finales de premier tour. Et, si je trouve le temps et que mes camarades économètres n’ont pas démoli mes analyses d’ici-là, une prévision argumentée des résultats du premier tour.

09 avril 2012

[sondages] Croisement(s) de courbes 

Les sondeurs se risquent rarement à faire des enquêtes le week-end. Et encore moins les week-end de trois jours, au cours desquels les sondés potentiels ont une fâcheuse tendance à déserter leur domicile. Raison pour laquelle, sauf livraison surprise d'une enquête BVA pour Orange/RTL ce lundi, la trêve pascale est une période idéale pour faire un point sur les sondages, à tête reposée et à deux semaines du premier tour.

Douze sondages ont été publiés depuis ma dernière note. Une fois passés à la double moulinette d'Excel et de Loess, les nouveaux points permettent de prolonger les courbes de tendance et d'affiner le diagnostic.




Le premier enseignement, qui ne surprendra pas même les fidèles de l'Hebdo des socialistes, est que le croisement des courbes entre François Hollande et Nicolas Sarkozy a bien eu lieu. Aux alentours du 20 mars, si l'on se fie à la tendance (cf. graphique ci-dessous). C'est-à-dire au moment de l'affaire Merah, mais sans que cet événement ait semblé modifier la dynamique en faveur de Nicolas Sarkozy perceptible depuis le début mars. Il reste que l'écart entre Hollande et Sarkozy est encore faible à ce stade (entre 1 et 2 points, d'après mes calculs). Rien qui ne puisse être remis en cause par une semaine de campagne électorale. A fortiori par deux.




Le deuxième fait saillant est la progression de Jean-Luc Mélenchon. Progression qui s'observe de façon quasiment continue depuis le début de l'année mais s'est brusquement accélérée un peu avant la mi-mars, comme le montre le graphique ci-dessous. C'est-à-dire pile au moment où Mélenchon a reçu le soutien de Didier Porte. Depuis, Mélenchon a clairement doublé Bayrou, dont le soufflé sondagier commence à furieusement ressembler à celui qu'il avait déjà connu en 2007. Les espoirs crédibles de second tour en moins.




Les positions relatives de Jean-Luc Mélenchon et de Marine Le Pen sont moins claires. La dynamique est clairement du côté du candidat du Front de gauche, mais les sondages récents sont contradictoires concernant son accession à la 3e place. Sur les 6 enquêtes réalisées depuis la fin de semaine dernière, 3 voient ainsi Mélenchon devant et 3 autres placent Marine Le Pen en tête.



Comme pour le duel Hollande-Sarkozy, on retrouve des écarts assez nets en fonction de la méthodologie des sondages : Mélechon est plus haut que la moyenne, et Le Pen plus basse, dans les enquêtes réalisées par téléphone depuis le début de l'année 2012. L'inverse est vraie pour les sondages effectués par Internet.



Hors la piste d'un simple artefact statistique, je n'ai toujours pas d'explication convaincante au phénomène. Et l'analyse des données de 2007 n'est pas d'un grand secours, dans la mesure où toutes les enquêtes étaient réalisées par téléphone il y a 5 ans. Le retour sur la présidentielle précédente n'est cependant pas inutile. Ne serait-ce que pour vérifier que ma méthode a un intérêt réel. Ce sera l'objet de la prochaine note.

25 mars 2012

[Sondages] Hollande et Sarkozy à égalité au 1er tour 

Dans ma première note sur les sondages de la présidentielle, j'écrivais que "la jonction des courbes [entre Hollande] et Sarkozy sur la période récente [est nette]" et que je considérais Sarkozy comme le favori pour le premier tour. Avant d'ajouter une phrase qui précisait que la vie politique est pleine de rebondissements inattendus et que mes pronostics ne valent pas tripette.

A la réflexion, j'aurais mieux fait de mettre cette dernière phrase en gras. Ou de garder pour moi mes jugements définitifs. Parce que le point sur les sondages qu'on peut réaliser aujourd'hui ressemble étrangement à celui qu'on pouvait faire la semaine dernière. En tout cas concernant le duel pour la première place - la progression très rapide de Mélenchon et la baisse de Le Pen sont des informations nouvelles. 

Et à la différence graphique près que l'ensemble des données de sondage est désormais visible, y compris quand plusieurs sondages sont réalisés au même moment. C'est peut-être un détail pour vous mais pour moi ça veut dire beaucoup (de boulot).



 

Comme la semaine dernière donc, la dynamique est clairement du côté de Sarkozy alors qu'Hollande marque le pas (je rappelle qu'un clic sur le graphique permet d'avoir la version full HD). Et comme la semaine dernière, le croisement des courbes apparaît imminent. Preuve qu'il ne l'était pas il y a 8 jours.

Comment expliquer ce paradoxe que Zénon n'aurait pas renié? La réponse simple est que les sondages publiés dans la semaine sont venus tempérer l'image qu'on pouvait avoir avec les enquêtes rendues publiques jusqu'au samedi 17 mars. L'histoire globale n'est pas fondamentalement remise en cause mais la progression de Sarkozy apparaît un peu plus lente, alors que les intentions de vote en faveur de François Hollande semblent désormais se stabiliser autour de 28% alors que la tendance paraissait baissière la semaine dernière.

On le voit beaucoup mieux avec une avancée technologique que j'ai piquée aux retransmissions footballistiques de Canal+ : la loupe.



 

Depuis la retentissante enquête Ifop donnant Sarkozy en tête au premier tour, 9 sondages ont été publiés : cinq voient Hollande devant (TNS, LH2, Ipsos, Harris et BVA), deux montrent une égalité (CSA et Opinion Way) et deux autres penchent pour Sarkozy (un 2e sondage Ifop et un 2e sondage CSA). Un élément qui me semble potentiellement intéressant est que 4 des 5 enquêtes plaçant Hollande en tête ont été réalisées par téléphone, tandis que 2 des 3 sondages (les deux enquêtes Ifop) affichant une avance de Sarkozy ont été fait en tout ou partie par Internet.



Pour essayer d'étayer la thèse d'une influence de la méthodologie sur les résultats, il est intéressant de comparer les résultats des différents sondeurs à la tendance globale des intentions de vote telle que je la calcule. Pour les sondages publiés en 2012 et la tendance pondérée sur les 7 derniers jours, on obtient les résultats affichées ci-dessous. Je précise que j'ai fait le choix de classer Ifop dans la catégorie "Internet" (l'institut utilise une méthode mixte Internet + téléphone dans des proportions qui ne sont pas connues) et BVA dans la catégorie "téléphone" même si trois enquêtes de cet institut ont été réalisées par Internet en janvier et février.



Ce qui me frappe est que les écarts concernant Sarkozy sont relativement bien distribués entre sondeurs, sans qu'un impact de la méthode employée apparaisse nettement. Par contre, pour Hollande, l'influence de la méthode semble claire
: les 3 sondeurs qui procèdent par Internet voient tous le candidat socialiste plus bas que la tendance et sont en outre plus bas que les 4 autres qui sondent par téléphone. Le constat est le même en prenant les sondages depuis la primaire socialiste (64 sondages au lieu de 44) et la tendance pondérée sur les 20 derniers jours.

Cela ne veut pas dire qu'une méthode de sondage soit nécessairement meilleure que l'autre (le téléphone est par contre incontestablement plus cher). On peut juste dire qu'elles semblent donner des résultats différents, pour des raisons qui ne sont pas évidentes : après le "shy Tory factor", y-a-t'il un "shy socialist traitor factor", c'est-à-dire que certains sondés, en particulier les sympathisants socialistes, n'oseraient pas reconnaître par téléphone qu'il ne voteront pas pour Hollande (au moins au premier tour) mais le font plus volontiers si on les interroge par Internet?

NB : Un mot d'avertissement, en particulier pour les journalistes qui me lisent : il est tentant de considérer les écarts moyens à la tendance comme le biais, volontaire ou pas, des différents sondeurs. Ainsi, LH2 serait plutôt pro-Hollande alors que Opinion Way favoriserait Sarkozy. Tentant mais faux. Un biais n'a en effet de sens que si l'écart est mesuré par rapport à une grandeur objective qu'on cherche à prévoir. On peut ainsi parler du biais des prévisions de croissance d'un gouvernement ou d'un institut de recherche par rapport au chiffre tel qu'il a été mesuré a posteriori. Par définition, la tendance que je construis n'est que le reflet de la moyenne de l'ensemble des données de sondage publiées. Elle est utile pour synthétiser visuellement l'information publique disponible mais elle n'a pas de réalité objective. Le seul juge de paix est l'élection : c'est à ce moment-là qu'on verra si la tendance centrale était la meilleure prévision ou bien si un sondeur dont les résultats s'écartent de la moyenne avait raison contre les autres.

18 mars 2012

925.fr 

Les lecteurs historiques de ce blog se rappelleront peut-être une époque où j’avais entrepris, graphiques pourris™ sous Excel à l’appui, de démonter le discours sur la prétendue popularité de l’alors Premier ministre Dominique de Villepin dans les sondages. Alors que Villepin était en fait extrêmement impopulaire pour un chef de gouvernement en début de mandat.

Un quinquennat sarkozien après, il serait absurde de ne pas reconnaître les progrès faits par les médias français, qui proposent désormais en série des comparateurs de sondages et en option des décryptages des méthodes des sondeurs. L'analyse quantitative reste toutefois minimale, surtout quand on la compare avec ce qui existe aux Etats-Unis, le blog de Nate Silver sur le site du New York Times étant l'exemple le plus remarquable.

Et ce retard français s'avère particulièrement dommageable dès que les résultats de différents instituts apparaissent contradictoires. La polémique de la semaine sur le "creusement des courbes" d'intentions de vote de premier tour entre Hollande et Sarkozy l'illustre bien : faute de disposer d'outils adéquats, le commentaire médiatique s'est enferré dans une logique binaire (croisement ou pas) qui n'aura réussi qu'à embrouiller le public et à renforcer la suspicion à l'égard des sondages.

Je pense qu'il est possible de faire mieux, grâce à des méthodes quantitatives (relativement) simples.

La première étape consiste à présenter en même temps l'ensemble des données des différents instituts de sondage. C'est ce que fait le graphique ci-dessous, pour tous les sondages parus depuis le 2e tour de la primaire socialiste et pour les cinq principaux candidats (et modulo une petite perte d'information liée à des raisons techniques - cf. infra).




Outre la confirmation que la trêve des confiseurs n'est pas propice aux sondages, le graphique rappelle qu'il n'est pas toujours aisé de dégager des tendances à l’œil nu, surtout quand on considère plusieurs nuages de points en simultané.

Il faut donc une seconde étape pour déterminer statistiquement une tendance. Je m'inspire ici des méthodes utilisées sur les blogs américains, en particulier de ce que fait Nate Silver. Dans un premier temps, on calcule pour chaque candidat une moyenne des intentions de vote de l'ensemble des sondages parus sur une période déterminée (les 15 derniers jours par exemple). Pour ne pas qu'un sondage paru il y a deux semaines compte autant qu'un sondage publié le jour même, on attribue des poids différents aux sondages en fonction de leur nouveauté. Dans un deuxième temps, on lisse cette série en utilisant un filtre statistique (une régression locale) qui permet de déterminer quelle est la trajectoire sous-jacente la plus probable compte tenu des données dont on dispose.

Voilà ce qu'on obtient graphiquement après quelques bonne heures de manipulations sous Excel.



On retrouve beaucoup plus facilement des éléments connus de la campagne : le dégonflement des intentions de vote pour Hollande après l'euphorie de la primaire, avant un rebond en janvier au moment du meeting du Bourget ; la montée rapide de Bayrou au mois de décembre ; ou encore la lente progression de Mélenchon depuis le début 2012. Et les tendances confirment le tassement récent de François Hollande et la légère progression de Nicolas Sarkozy depuis le début de l'année.

Le graphique ne montre toutefois pas de croisement des courbes. Faut-il en conclure que le sondage Ifop de cette semaine, qui donnait Sarkozy en tête au premier tour, est un point aberrant? Pas nécessairement. Le graphique est en effet construit sur des tendances de moyenne période, avec la prise en compte des sondages sur les 20 derniers jours : la prime donnée à la nouveauté ne suffit pas à compenser le stock des sondages qui donnaient Hollande en tête, parfois nettement.

L'analyse est différente si l'on choisit des paramètres plus agressifs, par exemple en ne considérant que les sondages réalisés au cours des 7 derniers jours (depuis le début de l'année 2012).



Le rebond temporaire d'Hollande après le discours du Bourget est net. La jonction des courbes avec Sarkozy sur la période récente aussi. Si le premier tour avait lieu ce dimanche, cela m'inciterait à placer Nicolas Sarkozy en favori du premier tour. Dans la mesure où il reste plus d'un mois avant le vote, je préfère ranger mes pronostics au placard et rappeler que les semaines en politique se suivent et ne se ressemblent pas.

J'ajoute que ma méthode est encore loin d'être parfaite, à cause des limitations d'Excel et des miennes. Sur le plan graphique, je n'ai pas réussi à régler simplement le problème de sondages réalisés le même jour : pour l'instant, un seul point est affiché, représentant la moyenne des sondages du jours au lieu d'un point pour chaque sondage. Cela n'influe en rien sur le calcul de la tendance mais la perte d'information graphique est réelle. De même, j'adorerais pouvoir construire des graphiques dynamiques à la TPM. Mais cela supposerait que mes connaissances en programmation web aillent plus loin que la maîtrise de 3 balises html et demi.

Sur le plan statistique, j'aimerais pouvoir faire varier le poids lié à la nouveauté des sondages selon leur demi-vie plutôt qu'avec une fonction linéaire. Mais c'est très complexe à faire sous Excel. Idéalement, je voudrais aussi faire varier le poids attribué aux sondages en fonction de la méthode utilisée (Internet ou téléphone), de la taille de l'échantillon, de la fréquence de publication des sondeurs et de leur performance passée, comme le fait Nate Silver. Et qu'on m'offre un poney.

Ces limitations ne m'empêcheront pas de renouveler l'exercice d'ici au 22 avril si mon lectorat y trouve quelque intérêt. Et si je trouve moi-même un peu de temps.

Add. : j'ai ajouté la possibilité de cliquer sur les graphiques pour voir la version grand format.

Re-add. (19/03) : toujours pas de poney mais des articles élogieux de Ioana Doklean du Lab d'Europe 1 et d'un anonyme rédacteur de Slate.fr. Merci! J'aimerais actualiser la note avec les sondages publiés hier et ce soir mais, comme prévu, je manque cruellement de temps (et de détails sur le dernier Ipsos). Allez donc lire Arthur Charpentier prolonger l'analyse, démontrer qu'il suffit de prendre d'autres paramètres pour que les courbes ne se croisent pas et illustrer au passage la supériorité de R sur Excel.