Introduction
Pour les chercheurs développant l'analyse économique de la politique, la prévision du vote en tant que révélation des préférences des citoyens dans les choix collectifs est essentielle. L'évaluation précoce des chances de réélection des sortants ou d'accession au pouvoir de l'opposition permet en effet d'anticiper les politiques publiques futures. Conformément à Anthony Downs (Reference Downs1957), on considérera que le vote est en partie un choix économique. Voter revient en effet à choisir parmi les propositions des partis en compétition, un programme, une politique économique déterminée, voire, corrélativement, le poids désiré de l'État. Cependant, si l'on considère que le vote constitue un véritable référendum sur la qualité estimée de la gestion des sortants (Niskanen, Reference Niskanen1975), voter c'est aussi punir ou récompenser les responsables de la politique économique (Key, Reference Key1964, Reference Key1966). Lorsque les électeurs reconduisent les sortants, ils expriment leur satisfaction en ce qui concerne le niveau actuel de bien-être et attendent qu'il soit maintenu (au moins) constant. Au contraire, s'ils votent pour l'opposition, ils recherchent pour le futur une amélioration de leur bien-être.
Les principaux outils de prévision du choix des électeurs sont les sondages d'intention de vote, les projections des panels d'experts, les marchés électroniques comme celui de l'Iowa, les paris et enfin, les modèles scientifiques, parmi lesquels on retrouve les modèles politico-économiques dont les fonctions de vote font partie (Jones, Reference Jones2007). Dans cet article, nous utilisons les fonctions de vote pour donner une prévision de l'élection présidentielle de 2007 en France. Nous proposons notamment un modèle utilisant des données sur panel régionalisées et départementalisées afin de mieux capter l'influence de la dynamique économique et politique des territoires sur une élection a priori purement nationale.
1. Les fonctions de vote : de l'explication des choix électoraux à la prévision
On attribue généralement aux modèles politico-économiques de vote trois fonctions principales. Ces modèles sont :
(1) un outil d'explication des choix électoraux; (2) un outil d'évaluation des politiques économiques et de la gestion des gouvernements (en complément des fonctions de popularité); et (3) un outil opérationnel de prévision et de simulation du choix des électeurs.
Les fonctions de vote sont nées des travaux théoriques et empiriques développés à la fois par les économistes et politologues de l'école des Choix publics (Grofman, Reference Grofman2004) et par la science politique des comportements électoraux, qualifiée par James Buchanan (Reference Buchanan1999) de science politique «scientifique».
1.1. Soubassements théoriques des fonctions de vote
Quatre familles de modèles fournissent les principaux soubassements théoriques.
— Le modèle de Downs (Reference Downs1957) avec l'électeur-consommateur rationnel sur un marché politique de concurrence entre les partis et l'approche spatiale du vote.
— Les modèles de cycle économique électoral, opportuniste pour Nordhaus (Reference Nordhaus1972, Reference Nordhaus1975) ou partisan pour Hibbs (Reference Hibbs1977, Reference Hibbs1982, Reference Hibbs1987), voire rationnel et partisan pour Alesina (Reference Alesina1987).
— Les modèles d'évaluation-réaction de la politique économique de l'école de Zurich (Frey, Reference Frey1978) ou de l'Institut de recherche et d'analyse politico-économique (IRAPE) de Poitiers (Aubin et al., Reference Aubin, Berdot, Goyeau and Lafay1985) introduisant la crédibilité (popularité) accordée par les agents aux gouvernements.
— Les modèles de la science politique des comportements électoraux (le modèle de la responsabilité gouvernementale de Key (Reference Key1964, Reference Key1966), les modèles géographiques électoraux de Goguel (Reference Goguel1969, Reference Goguel1981), ou les modèles psychosociologiques de Columbia (Reference Lazarsfeld, Berelson and Gaudet1944) ou du Michigan (Reference Campbell, Converse, Miller and Stokes1960)).
Conformément au cadre d'analyse «Downsien», le comportement de l'électeur est d'abord analysé au niveau microéconomique. Chaque électeur recherche une place optimale dans l'espace politico-économique. Chaque parti politique recherche aussi une localisation optimale dans ce même espace. L'électeur va évaluer l'utilité dérivée de la position qu'il occupe dans l'espace politico-économique durant le mandat. Au moment des élections, l'électeur votera pour les sortants si son utilité est supérieure à une certaine borne U+. En revanche, il votera pour l'opposition si son utilité est inférieure à un certain niveau U-. Entre U+ et U-, il choisira l'abstention. On construit ensuite des fonctions de vote agrégées dans lesquelles on fait l'hypothèse que les électeurs ont la même fonction d'évaluation et la même perception de l'horizon temporel (Borooah et Van der Ploeg, Reference Borooah and Van der Ploeg1981; Kirchgässner Reference Kirchgässner1986).
Les premiers modèles de cycle économique électoral (Political Business Cycle) ont offert une présentation élégante de la modélisation du vote «économique» (Nordhaus, Reference Nordhaus1972, Reference Nordhaus1975). Ils ont surtout tenté de montrer que les hommes politiques avaient intérêt à manipuler l'économie de manière «opportuniste» pour maximiser leurs chances de réélection face à des électeurs myopes au comportement peu sophistiqué. Même si de manière plus réaliste, les hommes politiques ne peuvent aisément contrôler la courbe du chômage ou de l'inflation, et même si les électeurs sont moins naïfs qu'attendu, toute amélioration ou dégradation de l'économie aura néanmoins un impact sur le choix de vote. Dans son modèle «partisan» Hibbs (Reference Hibbs1977, Reference Hibbs1982, Reference Hibbs1987) montre que les hommes politiques n'ont pas les mêmes priorités de politique économique selon qu'ils sont de gauche (socio-démocrates) ou de droite (libéraux-conservateurs). Les hommes politiques ne cherchent pas l'élection ou la réélection en tant que telle, ils souhaitent l'emporter pour appliquer leurs programmes partisans. Plus récemment, Alesina (Reference Alesina1987) a complété l'analyse en montrant que dans le «jeu» de la politique économique, les électeurs, comme le gouvernement, sont non seulement partisans, mais aussi rationnels. En conséquence, ils choisiront le parti qui a le plus de chances d'appliquer la politique (par exemple, baisse du chômage ou maîtrise de l'inflation) qui améliorera leur niveau de bien-être. Les fonctions de vote peuvent ainsi intégrer que les agents-électeurs évaluent les performances économiques en tenant compte des politiques préférées des partis qui se succèdent au pouvoir.
La notion d'évaluation des politiques par les électeurs est au cœur des travaux de l'école de Zurich (fin des années 1970 et début des années 1980) et de l'IRAPE de Poitiers (milieu des années 1980). Les électeurs accordent de la crédibilité à l'équipe en place lorsque celle-ci gère convenablement l'économie. Ceci se traduit par une augmentation du stock de popularité. Or, on sait que la crédibilité est une donnée essentielle permettant de minimiser les coûts induits des politiques économiques (le coût «chômage» des politiques de désinflation, par exemple). Dans le modèle de Zurich, tout fléchissement de la popularité en cours de mandat peut être corrigé par les gouvernants en agissant sur les instruments de la politique économique (dépenses publiques, fiscalité, entre autres). Le gouvernement maximise ainsi ses chances de reconduction au pouvoir. En cas de surstock de crédibilité, il aura les mains libres pour appliquer des politiques plus partisanes. Le modèle de l'IRAPE est moins systématique au sens où le gouvernement se comporte aussi en gestionnaire pragmatique lorsque l'élection est encore éloignée. Enfin, comme le souligne Goyeau (Reference Goyeau1985), chercher à restaurer sa crédibilité en manipulant l'économie n'a pas de sens face à des électeurs rationnels. La baisse de crédibilité provient de la sanction par les agents-électeurs d'une situation économique dégradée. Mais en cas de surstock de crédibilité, si manipuler l'économie est aisé, cela s'avère inutile puisque l'excédent découle d'une bonne gestion (paradoxe de la manipulation).
Il devient alors pertinent d'inclure le stock de crédibilité de l'exécutif dans la fonction de vote. Le caractère endogène de la popularité peut néanmoins poser problème. L'idéal est d'élaborer une équation simultanée où l'on explique d'abord la popularité avant d'en faire un facteur exogène du vote. Cette construction présente toutefois l'inconvénient de ne pas toujours fournir un bon outil de prévision. On inclura donc directement la popularité en tant qu'indicateur de crédibilité du côté des facteurs explicatifs du vote. La colinéarité avec la variation du taux de chômage sur un an ne devrait pas être forte dès lors que la popularité est avant tout dépendante des fluctuations quasi immédiates de l'économie. Par ailleurs, l'économie n'explique qu'environ 50 pour cent de la popularité de l'exécutif (Lafay et Lecaillon, Reference Lafay and Lecaillon1990).
Par rapport aux modèles de cycle, les fonctions de vote et de popularité ont pour originalité d'endogenéiser le comportement de l'électeur dans un environnement où sphères économique et politique interagissent. Mais au-delà, elles soulignent que les électeurs rendent le gouvernement responsable de la situation économique, conformément aux hypothèses développées par Key (Reference Key1964, Reference Key1966). Pour ce dernier, il faut certes s'intéresser aux électeurs «stables» formulant un vote sociologique ou idéologique systématique comme dans le modèle de Columbia ou celui du Michigan, mais il faut aussi considérer ceux qui sont «mobiles», autrement dit, ceux qui sanctionnent de mauvaises performances sans préjugés partisans.
Finalement, aucun des modèles vus précédemment ne peut prétendre à lui seul représenter l'ensemble des comportements électoraux (Rosenstone, Reference Rosenstone1983). La fonction de vote aura donc une forme hybride, sans renier la méthode de l'économie (pour reprendre l'idée de Mueller, Reference Mueller2003) et empruntera à chacun des grands modèles politico-économiques. Elle réunira les comportements de quatre types d'électeurs : l'électeur opportuniste Downsien, l'électeur «juge» du bilan (au sens de Key), l'électeur partisan de Hibbs ou partisan et rationnel d'Alesina, et l'électeur qui évalue la crédibilité du gouvernement en comparant l'écart entre annonces et réalisations.
1.2. Les hypothèses sur le comportement des électeurs
Les dix faits stylisés des fonctions de vote et de popularité synthétisés par Lewis-Beck et Paldam (Reference Lewis-Beck and Paldam2000) permettent de préciser les hypothèses faites sur les comportements électoraux. Parmi les dix grands problèmes posés par les fonctions de vote, le débat a été particulièrement fourni sur deux questions majeures :
— quel est le poids respectif de la perception globale de l'économie et de l'appréciation de la situation économique personnelle dans le vote?
— le vote des électeurs est-il principalement de nature prospective ou rétrospective?
La théorie prospective est directement compatible avec ce que les économistes définissent comme la théorie des «choix rationnels». Celle-ci implique, en effet, un calcul «prospectif» en termes de coût d'opportunité, c'est-à-dire la comparaison entre l'utilité espérée de la reconduction du sortant et celle de la venue au pouvoir du ou des candidat(s) concurrent(s) (Chappell et Keech, Reference Chappell and Keech1985). Selon Fiorina (Reference Fiorina1981), les agents anticipent la situation économique en fonction de l'idéologie des partis. La théorie «rétrospective» du vote indique que les variations dans les choix électoraux dépendent directement de la qualité des résultats du gouvernement sortant. Certaines études empiriques (Nannestad et Paldam, Reference Nannestad and Paldam1994) montrent que l'intensité de la punition tend à être plus forte que celle de la récompense : on parle alors d'asymétrie du blâme (grievance asymmetry).
En général, l'attitude sociotropique (fondée sur une appréciation globale de l'économie) s'accommode aisément de l'hypothèse de vote rétrospectif. En ce qui concerne le vote prospectif, les choses sont plus complexes. Les évènements personnels servent d'indicateurs globaux du futur. Ainsi, les agents ne votent pas contre le gouvernement parce qu'ils ont été touchés personnellement par le chômage dans le passé, mais parce qu'ils projettent leur propre expérience comme un indicateur du taux de chômage futur.
Que le vote soit prospectif ou rétrospectif, le degré de responsabilité attribué au gouvernement sortant dans la situation qu'il lègue à ses successeurs reste une variable déterminante (Lafay et Jérôme, Reference Lafay and Jérôme1991).
Pour apprécier le degré de responsabilité du gouvernement, chaque électeur doit tenter de mesurer l'écart entre son utilité effective passée et celle que lui aurait procurée le meilleur des gouvernements possibles, c'est-à-dire celui qui aurait choisi les «bons» objectifs et employé efficacement les instruments dont il dispose. Le problème avec un tel exercice mental est qu'il suppose une information considérable, dont aucun électeur rationnel n'est prêt à supporter le coût, étant donné l'infime probabilité que sa voix change le résultat. En d'autres termes, les électeurs ont intérêt à être «rationnellement ignorants»Footnote 1 et à adopter des modes d'appréciation très simplifiés de la responsabilité gouvernementale.
Incapables d'apprécier correctement les conséquences du maniement des instruments sur les objectifs, les électeurs peuvent adopter un comportement de «rationalité limitée» à la Herbert Simon (Reference Simon1957). Les nombreux chercheurs ayant mené des études empiriques font le même constat (Kirchgässner, Reference Kirchgässner1985; Alesina, Reference Alesina1987). Alesina et Rosenthal (Reference Alesina and Rosenthal1989) soutiennent eux aussi que les électeurs sont en situation de rationalité limitée puisqu'ils ne savent pas si le parti pour qui ils votent appliquera son programme en cas de victoire. Enfin, les électeurs doivent souvent se contenter de juger les gouvernements sur la base de leurs seuls résultats apparents, en les comparant éventuellement à la performance des gouvernements étrangers (Jérôme, Jérôme-Speziari et Lewis-Beck, Reference Jérôme, Jérôme-Speziari and Lewis-Beck2001).Footnote 2
1.3. Les études empiriques et la prévision des élections en France
Les premières fonctions de vote ont été testées sur les élections nationales aux États-Unis par Kramer (Reference Kramer1971), Niskanen (Reference Niskanen1975), Tufte (Reference Tufte1978) et Fair (Reference Fair1978). En France, les premières tentatives empiriques remontent à Rosa et Amson (Reference Rosa and Amson1976) et Lewis-Beck (Reference Lewis-Beck1985) sur les législatives. Toutes ces études ont porté sur des données nationales agrégées, sauf celles de Rosenstone (Reference Rosenstone1983), Holbrook (Reference Holbrook1991) et Campbell (Reference Campbell1992), qui ont utilisé des données sur panel dans le cas américain. En ce qui concerne la France, la première fonction de vote utilisant des données régionales sur panel a été construite par Jérôme, Lewis-Beck et Lafay (Reference Jérôme, Lafay, Lewis-Beck and Lafay1993).
Ainsi que nous l'avons vu, les fonctions de vote ont été élaborées initialement pour expliquer les comportements électoraux. Cependant, elles sont utilisées pour la première fois en 1985 dans le cas français, au niveau agrégé, pour prévoir avec succès le résultat des élections législatives de 1986 (Lewis-Beck, Revue française de science politique). À l'occasion des législatives de 1993, Jérôme, Lewis-Beck et Lafay prévoient le «raz de marée bleu», pour la première fois à l'aide d'un modèle en données sur panel (Le Figaro économie, mars Reference Jérôme, Lafay, Lewis-Beck and Lafay1993). En 1997, deux modèles concurrents tentent de prévoir l'issue de la dissolution de l'Assemblée nationale. La simulation du modèle de Jérôme, Jérôme et Lewis-Beck lancée en décembre 1996 (avant l'annonce de la dissolution) prévoyait la défaite de la droite en 1998 (terme normal de l'élection). Malheureusement, le résultat de la simulation ne trouvera pas de débouchés dans la presse à cette période. Le modèle complet paraîtra en Reference Jérôme, Jérôme-Speziari and Lewis-Beck1999 dans l'International Journal of Forecasting. Le modèle «de l'Iowa» de Fauvelle-Aymar et Lewis-Beck paru dans Libération (23 mai Reference Fauvelle-Aymar and Lewis-Beck1997) après l'annonce de la dissolution prévoira également la défaite de la droite sortante. Enfin en 2002, les chercheurs ont eu la possibilité de tester leurs modèles sur une double consultation électorale (présidentielle et législatives). Plus tôt en 2000, alors que le président et le premier ministre s'affrontaient sur l'inversion du calendrier électoral, Jérôme, Jérôme-Speziari et Lewis-Beck élaborent un modèle de vote à équations simultanées, en données sur panel, permettant de tester deux hypothèsesFootnote 3 : la présidentielle avant les législatives et la situation inverse, initialement prévue dans le calendrier électoral. Les simulations montrent que Lionel Jospin a intérêt à ce que la présidentielle devance les législatives. Cependant en novembre 2001, dans L'Expansion, la simulation précoce du modèle de la présidentielle (en données sur panel) de Jérôme et Jérôme-Speziari indique que Jacques Chirac serait réélu face à Lionel Jospin dans un second tour «classique» droite-gauche. La simulation indique que la droite remporterait également les législatives. Les autres simulations générées par le modèle confirmeront cette tendance jusqu'en mars 2002.Footnote 4 Néanmoins, le modèle, dans sa conception d'alors, était incapable de prévoir que la gauche serait éliminée du second tour par Jean-Marie Le Pen. À cette fin, en 2003, le modèle de la présidentielle sera complété par une équation de vote du Front national (FN) (Jérôme et Jérôme-Speziari, Reference Jérôme and Jérôme-Speziari2003).
2. Le modèle politico-économique de la présidentielle
2.1. Le modèle de vote présidentiel pour 2007
Le modèle de vote présidentiel de 2007 s'inspire de nos travaux antérieurs en insistant sur les points suivants :
Le modèle tente de représenter le comportement de quatre types d'électeurs : l'électeur opportuniste, l'électeur «juge» du bilan, l'électeur partisan ou partisan et rationnel, ainsi que l'électeur «évaluateur» de la crédibilité gouvernementale. On notera que le modèle retient l'option de la responsabilité gouvernementale en posant que la variable endogène est le vote pour les sortants (et partis idéologiquement proches). Nous suivons ainsi les recommandations de Mueller (Reference Mueller2003) pour qui les meilleurs modèles sont «hybrides», même si on s'éloigne quelque peu d'un cadre harmonieux et unique du comportement de l'électeur.Footnote 5 Ceci rejoint Rosenstone (Reference Rosenstone1983), pour qui aucun modèle pris séparément ne peut avoir la prétention de représenter le comportement de l'ensemble des électeurs.Footnote 6
Le modèle est agrémenté de variables politiques indispensables à la stabilité d'ensemble de la fonction de vote, conformément aux prescriptions de Nannestad et Paldam (Reference Nannestad and Paldam1994). Il s'agit ici de prendre en compte des données institutionnelles (règles de vote, calendrier électoral, type d'élection, cohabitation et autres) ainsi que le rôle de certaines forces politiques protestataires au sein d'une équation (le FN par exemple) ou charnière (les écologistes, le centre).
L'ajout de «bonnes» variables politiques est dicté par la volonté d'obtenir un bon modèle explicatif pour prévoir, même s'il s'agit là d'une condition nécessaire, mais non suffisante (Lewis-Beck, Reference Lewis-Beck2005). Enfin, on notera que les modèles purement économiques donnent des prévisions largement surévaluées ou sous-évaluées par rapport au résultat réel.Footnote 7
Le modèle poursuit la démarche des modèles écologiques ou géographiques des politologues français en utilisant des données désagrégées et des données sur panel (pooled time series).
Dans la tradition de Siegfried (Reference Siegfried1913), les modèles «écologiques» décrivent l'étude du milieu où vivent les être vivants et les rapports de ces êtres avec le milieu. Le territoire (au sens géologique du terme) façonne l'habitat, la propriété, la structure sociale, la religion et in fine, l'orientation politique des unités territoriales d'un pays.Footnote 8 L'analyse écologique sera perpétuée, mais dépassée par les travaux de Goguel (Reference Goguel1969Footnote 9, Reference Goguel1981, Reference Goguel1983) sur la géographie électorale. À chaque territoire correspond une distribution d'électeurs mise en relation avec l'évolution démographique, les changements socio-économiques, les mutations urbaines, l'action de l'État et des collectivités, le rôle des partis, celui des syndicats et celui des élus.
Les modèles géographiques ne sauraient servir uniquement à dépister ce qui est permanent.Footnote 10 Ainsi, un changement de distribution dans l'espace politico-économique local peut traduire un déplacement de l'électeur médian (ou du groupe médian) «downsien». Mais la distribution des votes dans le temps peut aussi traduire une mobilité résidentielle accrue. Cette mobilité est soit engendrée par les élus qui modifient la démographie urbaine à dessein (Mingat et Salmon, Reference Mingat and Salmon1988), soit dérivée des agents eux-mêmes, qui mécontents de la situation économique locale «votent avec les pieds» (Tiebout, Reference Tiebout1956). Enfin, la distribution du vote local permet d'évaluer et de mesurer l'impact local des politiques publiques nationales.
Les données sur panel augmentent le nombre de degrés de liberté et aident à mesurer l'impact de la dynamique des territoires sur le vote national. Cette méthode a de grands avantages. On mesure le poids réel des disparités territoriales dans le résultat électoral, et ce au cours du temps. De surcroît, on augmente le nombre de points d'observation et de degrés de liberté, alors même que les fonctions de vote étaient souvent délaissées faute de données suffisantes. Enfin, une telle méthode permet d'envisager une prévision du vote à tous les niveaux du maillage territorial. Il est ainsi intéressant de prévoir les scores électoraux département par département ou région par région avant de les agréger.
La méthode du pooling favorise ainsi la recherche de la «dynamique du changement» (Baltagli, Reference Baltagli1995).Footnote 11 Un plus grand nombre d'observations garantit aussi a priori une minimisation des biais dus à l'agrégation des individus. La méthode a néanmoins l'inconvénient de cumuler les problèmes d'estimation et d'inférence, car elle est exposée aux risques de l'hétéroscédasticité de la coupe instantanée et aux problèmes de l'autocorrélation des résidus des séries temporelles.Footnote 12 Enfin, en France, six régions «critiques» rassemblent un peu plus de la moitié des électeurs (Île de France, Rhône-Alpes, Provence-Alpes-Côte d'Azur, Nord Pas de Calais, Pays de la Loire, Aquitaine). La prévision des résultats territoriaux de ces six régions et leur comparaison par rapport aux scrutins présidentiels passés permettent d'inférer la tendance nationale.
Le modèle comporte une équation spécifique de transfert des voix du premier tour au second tour, opérant ainsi la synthèse entre le vote «partisan» et le vote «opportuniste». Nous considérons ici l'hypothèse de Hibbs selon laquelle le premier tour de la présidentielle en France est plutôt de nature «partisane» dans la mesure où il convient de rassembler son camp autour d'un programme plus «idéologique». Le second tour est de nature plus «opportuniste», car en moyenne, les programmes sont rajustés pour capter les voix de l'électeur ou du groupe médian (en cas de qualification des candidats des partis de gouvernement, exception faite de 1969 et 2002).
2.2. Structure du modèle et spécification des variables
Le modèle général de la présidentielle comporte trois relations. La première équation (1) exprime le vote pour les sortants (lato sensu) au premier tour auquel on ajoute les forces d'appoint idéologiquement proches.Footnote 13 La seconde équation (2) estime le potentiel électoral de l'extrême droite, ce qui permet de déduire (en approximant) le score de la droite classique et du centre. La troisième équation (3) estime le transfert de voix au sein du bloc de droite (lato sensu) entre les deux tours de 1974 à 2002. Le score de la gauche est déterminé par défaut (100 – droite – FN).
La définition des variables est donnée dans les tableaux qui suivent (1 à 3). Leur spécification est donnée dans l'annexe.
Équation (1) : fonction de vote des sortants (lato sensu) au premier tour de la présidentielle
![$$
\displaylines{
\text{VP1}_\text{t}^\text{j} \text{ = C + a}\text{.LG1}_{\text{t} - \text{i}}^\text{j} \text{ + b}\text{.}\mathop \text{\Delta }\limits_{\text{t,t} - \text{i}} \text{CHO + d}\text{.ZFDG}^\text{j} \text{ + e}\text{.POPEXE}_{\text{t} - \text{i}} \cr
\text{ + f}\text{.COPMPT + g}\text{.DUMG + \varepsilon }_\text{t}^\text{j} \cr}
$$](https://static.cambridge.org/binary/version/id/urn:cambridge.org:id:binary:20160203084645703-0459:S0008423909990874jra_eqn001.gif?pub-status=live)
Équation (2) : fonction de vote pour l'extrême droite au premier tour de la présidentielle (*)
![$$
\displaylines{
\text{VFNP1}_\text{t}^\text{j} \text{ = C + a}\text{.VFNLG}_{\text{t} - \text{i}}^\text{j} \text{ + b}\text{.}\mathop \text{\Delta }\limits_{\text{t,t} - \text{i}} \text{CHO + d}\text{.ZFFNDG}^\text{j} \cr
\text{ + e}\text{.FNFAIB}^\text{j} \text{ + f}\text{.BORDER}^\text{j} \text{ + g}\text{.CORS88} \cr
\text{ + h}\text{.CORS02 + \varepsilon }_\text{t}^\text{j} \cr}
$$](https://static.cambridge.org/binary/version/id/urn:cambridge.org:id:binary:20160203084645703-0459:S0008423909990874jra_eqn002.gif?pub-status=live)
(*) Une variante est proposée dans le Tableau 2. Dans le modèle en données régionales déjà testé en 2002, le taux de chômage est croisé avec les zones de force partagées entre le FN et la droite classique ou le FN et la gauche.
Équation (3) : fonction de transfert des voix de droite (lato sensu) entre le premier et le second tour de la présidentielle
![$$
\displaylines{
\text{VPTD2}_\text{t}^\text{j} \text{ = C + a}\text{.VPTD1}_{\text{t} - \text{i}}^\text{j} \text{ + b}\text{.COHAB + d}\text{.ZFFND}^\text{j} \cr
\text{ + e}\text{.ZFFNG}^\text{j} \text{ + f}\text{.SITULOC + g}\text{.ATYP + \varepsilon }_\text{t}^\text{j} \cr}
$$](https://static.cambridge.org/binary/version/id/urn:cambridge.org:id:binary:20160203084645703-0459:S0008423909990874jra_eqn003.gif?pub-status=live)
2.3. Résultats empiriques et prévisions du modèle politico-économique
Les différentes équations du modèle ont été testées en données sur panel, sur la période 1974–2002 (l'équation du Front national est testée sur 1988–2002), avec la méthode des moindres carrés ordinaires. Nous avons testé le modèle déjà utilisé en 2002, cette fois en données départementales (soit 480 observations) moyennant quelques modifications et simplifications. Les simulations ainsi générées sont comparées au modèle régional (sur 88 observations).
Globalement, les coefficients de détermination des équations ont un niveau satisfaisant, tous les paramètres ont le signe attendu et sont significatifs au seuil de 5 pour cent (voir t de Student). L'écart-type de la régression donnant l'erreur moyenne des valeurs estimées de la variable endogène, est de 2,5 points pour l'équation de vote du premier tour, de 2 points pour le vote FN et de 1,3 point pour le vote de droite au second tour. On notera que les variables indicatrices contrôlant certains points ou certains groupes de points aux caractéristiques similaires (comme les zones de force, par exemple) n'altèrent pas les variables lourdes comme la variation du chômage, les élections législatives passées ou la crédibilité de l'exécutif. On notera la proximité des paramètres des fonctions de vote départementale et régionale (Tableaux 1, 2 et 3). Un degré plus important de désagrégation n'entame donc pas la stabilité des paramètres.
Table 1. Présidentielle : Premier tour
![](https://static.cambridge.org/binary/version/id/urn:cambridge.org:id:binary-alt:20160707083529-83656-mediumThumb-S0008423909990874jra_tab001.jpg?pub-status=live)
Table 2. Presidentielle : Premier tour
![](https://static.cambridge.org/binary/version/id/urn:cambridge.org:id:binary:20160203084645703-0459:S0008423909990874jra_tab002.gif?pub-status=live)
Table 3. Présidentielle : Second tour
![](https://static.cambridge.org/binary/version/id/urn:cambridge.org:id:binary-alt:20160707083529-03993-mediumThumb-S0008423909990874jra_tab003.jpg?pub-status=live)
En affectant les paramètres estimés des relations (1), (2) et (3) aux données économiques et politiques disponibles de décembre 2005 à mars 2007, on effectue cinq vagues de simulation, dont les trois dernières ont été conduites en données régionales et départementales (septembre 2006, décembre 2006 et mars 2007).
La dernière simulation départementale effectuée en mars 2007 pour le premier tour montre que :Footnote 14
— la droite parlementaire réalise ses meilleurs scores du premier tour dans la France de l'Ouest, le Massif central, la partie ouest de l'Île-de-France, la Marne, le Bas-Rhin, la Haute-Savoie et la Corse-du-Sud. En moyenne, la droite parlementaire réalise un score compris entre 42,9 pour cent et 52,1 pour cent dans 25 départements.
— la gauche lato sensu réalise ses meilleurs scores dans le Nord de la France, la Bretagne et de nombreux départements du Centre au Sud-Ouest. On notera un score élevé en Haute-Corse. Au total, la gauche réalise un score compris entre 47,9 et 56,6 pour cent dans 21 départements.
— le Front National réalise ses meilleurs scores dans l'arc traditionnel Nord-Ouest Sud-Ouest (Mayer et Perrineau, 1996). Le FN réalise un score compris entre 19,6 pour cent et 28,7 pour cent dans 22 départements.
À partir du poids démographique électoral des départements, il est possible de calculer le potentiel électoral des grands blocs politiques au niveau départemental, au niveau régional et enfin au niveau national.
Ainsi, au premier tour de 2007, le modèle indique que la droite parlementaire recueillerait 40,26 pour cent des suffrages exprimés (+ 0,64 par rapport à décembre 2006), la gauche lato sensu 43,77 pour cent (−0,63) et le FN 15,97 pour cent (=).
Au second tour, le modèle départemental indiquait que la droite réaliserait ses meilleurs scores sur un axe Ouest / Nord-Ouest / Grand Est. À cela s'ajoute le quart Sud-Est du territoire. La droite est majoritaire en voix dans 71 départements. On note qu'elle réalise un score compris entre 50 pour cent et 53,1 pour cent dans 25 départements.
La gauche réalise ses meilleurs scores dans un grand quart Centre / Sud-Ouest, en Bretagne et dans le Nord de la France. Elle résiste en Rhône Alpes. Au final, le modèle donne la gauche majoritaire dans 25 départements.
Au niveau national, en cas de duel droite / gauche, la droite parlementaire obtiendrait 53,52 pour cent des voix (+ 0,57 par rapport à la vague de décembre 2006) contre 46,48 pour cent (− 0,57) pour la gauche.
Au regard des résultats réels, le modèle ne parvient pas à estimer avec acuité les voix du premier tour. Notamment, le modèle prévoit 43,7 pour cent des voix pour la gauche, soit une surestimation de 7,2 points. Le score prévu du FN est de 15,9 pour cent contre un score réalisé de 10,44 pour cent. Enfin, le score de la droite parlementaire (et du centre) est estimé à 40,7 pour cent contre un score réel de 53,12 pour cent.
Si l'on compare les voix de gauche simulées en données régionales (très proches des simulations départementales) aux intentions de vote pour la gauche révélées par les instituts de sondageFootnote 15 (Graphiques 1 et 2), on observe une certaine convergence jusqu'en décembre 2006. Au cours du premier trimestre 2007, les estimations des instituts de sondage s'écartent de celles du modèle. La raison principale en est la ponction opérée par F. Bayrou sur l'électorat de gauche, socialiste notamment. Dans le même intervalle, Nicolas Sarkozy capte environ un tiers de l'électorat FN de 2002, ce que ni les sondages, ni le modèle n'ont pu anticiper précocement.
![](https://static.cambridge.org/binary/version/id/urn:cambridge.org:id:binary:20160203084645703-0459:S0008423909990874jra_fig001g.gif?pub-status=live)
Figure 1. Présidentielles 2002 et 2007 – Voix de gauche au premier tour
Simulations de la fonction de vote et moyenne des intentions de vote des sondages
![](https://static.cambridge.org/binary/version/id/urn:cambridge.org:id:binary-alt:20160707083529-05611-mediumThumb-S0008423909990874jra_fig002g.jpg?pub-status=live)
Figure 2. Présidentielles 2002 et 2007 – Voix de gauche au second tour
Simulations de la fonction de vote et moyenne des intentions de vote des sondages
En revanche, le modèle est plus performant que les sondages en ce qui concerne l'estimation du second tour (Graphique 2). Les simulations de décembre 2006 et de mars 2007 sont extrêmement proches du résultat final de 53 pour cent obtenu par la droite. Dans le détail, le modèle départemental donne la bonne tendance dans 74 départements sur 96. Parmi les erreurs, dans treize cas le modèle prévoit à tort une majorité à droite (Gironde, Pyrénées-Atlantiques, Puy-de-Dôme, Finistère, Ile-et-Vilaine, Indre, Corrèze, Tarn, Val-de-Marne, Loire-Atlantique, Charente, Deux-Sèvres et Vienne). Dans neuf autres cas, le modèle n'anticipe pas la percée de la droite (Territoire de Belfort, Pyrénées-Orientales, Meurthe-et-Moselle, Tarn-et-Garonne, Nord, Seine-Maritime, Somme, Isère et Haute-Corse).
En effectuant une comparaison avec les intentions de vote du second tour révélées par les sondages (graphique 2), le modèle politico-économique en données régionales apparaît plus performant. Les instituts placent en effet S. Royal gagnante (en moyenne) en juin 2006 et en décembre 2006. Le modèle, quant à lui, indique clairement une tendance décroissante pour la gauche au second tour, au-dessous de la barre des 50 pour cent, de mars 2006 à mars 2007. On notera que le modèle avait envoyé un signal précoce à l'occasion des élections de 2002 (graphique 2) en montrant que L. Jospin n'était pas en mesure (en cas de qualification) de l'emporter au second tour face à J. Chirac. Dans le même temps, les instituts de sondage donnaient L. Jospin vainqueur (en moyenne) en mars 2001, puis «coude à coude» avec J. Chirac deux mois avant l'élection.
Conclusion et pistes de réflexion pour 2012
Lors de la présidentielle de 2002, les fonctions de vote avaient permis d'approcher avec une certaine acuité les résultats électoraux des grands blocs de gauche, de droite et d'extrême droite au premier tour (graphique 2). Simultanément, sans toutefois prévoir l'éviction de L. Jospin au second tour par J.-M. Le Pen, les simulations du second tour indiquaient que le gouvernement sortant de gauche risquait de perdre la présidentielle face à J. Chirac. En 2007, le modèle de vote testé en données départementales et régionales s'est montré relativement performant pour prévoir la victoire de N. Sarkozy au second tour. Or, on sait que les simulations du second tour découlent en grande partie de la prévision effectuée au premier tour. Pourtant, la fonction de vote a eu quelques difficultés à approcher avec précision les résultats réels du premier tour. Le bloc de gauche est surestimé de sept points, le bloc de droite et du centre est sous-estimé de treize points, et l'extrême droite est surestimée de six points. On note que les principaux instituts de sondage surestiment la gauche et le FN dans les mêmes proportions que le modèle de vote jusqu'au dernier trimestre 2006. En réalité, au premier trimestre 2007, les estimations des sondages s'écartent des simulations politico-économiques sous l'effet de la conjugaison de deux phénomènes : la ponction opérée par F. Bayrou sur la gauche (environ huit points de plus par rapport au socle «normal» du centre) et celle qu'a opérée N. Sarkozy sur l'électorat FN (environ six points par rapport au potentiel électoral de l'extrême droite en 2002). En un mot, le modèle politico-économique permet d'annoncer très tôt et bien avant les sondages les grandes tendances. Néanmoins, des améliorations et innovations évidentes doivent être apportées à la prévision des candidats et des courants politiques à l'intérieur des grands blocs. Pour 2012, le modèle politico-économique devra intégrer les comportements purement stratégiques d'une partie des électeurs. Au sens de Blais et al. (Reference Blais, Nadeau, Gidengil and Nevitte2001), voter stratégiquement consiste à voter pour un candidat de second choix dans le but de peser sur le résultat du vote. En 2007, certains électeurs ont voulu résolument qualifier les partis de gouvernement pour le second tour pour effacer 2002. Une autre partie, surtout située à gauche, incitée par les sondages de second tour effectués sur un hypothétique duel Bayrou-Sarkozy, a spéculé sur le fait que F. Bayrou avait plus de chances de battre N. Sarkozy que S. Royal, réduisant ainsi d'environ huit points le potentiel électoral de la gauche totale. On en déduit que la gauche aurait dû recueillir autour de 43 ou 44 pour cent des voix au premier tour, soit le score simulé par le modèle et celui qu'ont donné les sondeurs jusqu'en décembre 2006. On remarquera enfin que S. Royal progresse de dix points entre les deux tours par rapport au total de la gauche au premier tour. Ceci démontre que les fonctions de vote constituent un outil de prévision à côté des intentions de vote révélées par les sondages, permettant ainsi d'estimer le poids électoral des électeurs stratèges.Footnote 16 Il s'agit ici d'un cinquième type d'électeur, au comportement purement politique, dont il faut tenir compte pour 2012. Cette prise en compte semble être indispensable pour améliorer les prévisions des modèles au premier tour de la présidentielle. Par exemple, en intégrant les intentions de vote pour les candidats en utilisant finement les matrices de report et le rang des préférences dans les sondages. Enfin, en privilégiant au premier tour les modèles à équations simultanées prenant en compte les déterminants du vote pour toutes les familles politiques (Jérôme et Jérôme-Speziari, Reference Jérôme and Jérôme-Speziari2010).
Annexe
Spécification des variables
Équation (1)
Variable expliquée :
VPT1 : cumul des voix par région exprimées par les électeurs proches de la majorité sortante (%). La droite est sortante en 1974, 1981, 1988, 1995 et 2007. La gauche est sortante en 2002.
Variables explicatives :
ΔCHO : variation du taux de chômage (source Insee) dans la juridiction j (département ou région), un à deux trimestres avant l'élection, en glissement sur une année.
LG : voix obtenues par les candidats idéologiquement proches de la majorité sortante aux législatives qui ont précédé (1973, 1978, 1986, 1993, 1997, 2002).
ZFDG : variable codée 1 ou −1 (0 sinon) dans chaque zone de force départementale (ou régionale). On affecte une valeur −1 aux fiefs de l'opposition et une valeur 1 aux fiefs de la majorité au pouvoir.Footnote 17
On considère que l'on a une zone de force absolue, lorsqu'à la date de l'élection en 1981, 1988, 1995 et 2002, le département (ou la région) n'a pas changé de couleur politique depuis 1974.
À la veille de l'élection de 2007, 25 départements ont toujours choisi la gauche depuis 1974, 30 ayant toujours choisi la droite. En partant de ce constat, on peut formuler l'hypothèse selon laquelle dans 41 départements, une forte proportion des électeurs est plus «mobile» qu'ailleurs. Par comparaison, on notera qu'en 1981, seuls 27 départements sur 96 étaient «instables». À la veille de la présidentielle de 1988, la proportion de départements instables est passée à 39. Cette situation restera inchangée jusqu'en 2002.
COPMPT : écart entre la popularité (IFOP) trimestrielle du premier ministre et le président de la République mesurée six mois avant l'élection en cas de cohabitation (1988, 1995, 2002).
POPEXE : popularité trimestrielle (IFOP) du chef de l'exécutif (premier ministre en cas de cohabitation) mesurée six mois avant la date de la présidentielle lorsque celle-ci a lieu à la date prévue. En 1974, la présidentielle est anticipée en raison du décès de G. Pompidou, cette variable vaut 0 en 1974.
DUMG : variable valant 1 lorsque la gauche est sortante (0 sinon). Seule l'année 2002 est concernée.
Équation (2)
VFNP1 : voix (%) obtenues par le Front national, au premier tour de l'élection présidentielle dans chaque juridiction j (département ou région).
VFNLG : voix (%) obtenues par le Front national au premier tour des élections législatives qui ont précédé la présidentielle dans chaque juridiction j (département ou région).
VARCHO : variation du taux de chômage, un à deux trimestres avant l'élection, en glissement sur une année (dans la zone d'emploi où le bureau de vote j est situé).
ZFFND : zones de force du Front national partagées avec la droite classique depuis 1988, variable indicatrice valant 1 (0 sinon). Sont concernés le Bas-Rhin, le Haut-Rhin, l'Eure-et-Loir, le Cher, le Loiret, le Meuse, la Moselle, la Savoie et la Haute-Savoie.
ZFFNG : zones de force du Front national partagées avec la gauche depuis 1988, variable indicatrice valant 1 (0 sinon). Sont concernés la Meurthe-et-Moselle et l'Isère.
FNFAIB : zones de faiblesse du Front national partagées, variable indicatrice valant 1 (0 sinon). Trente-cinq départements sont concernés (scores systématiquement inférieurs à la moyenne nationale).
BORDER : variable indicatrice valant 1 (0 sinon) pour les départements frontaliers. La crainte de l'ouverture des frontières peut favoriser le FN.
CORS : variable indicatrice valant 1 (0 sinon) pour les départements de Haute-Corse et de Corse-du-Sud en 1988 et 2002. La Corse se distingue des autres départements de par ses traditions politiques propres, dont le poids électoral important des indépendantistes qui peuvent en passant d'un camp à l'autre faire basculer la majorité.
Équation (3)
VPTD2 : voix (%) obtenues par la droite au second tour de l'élection présidentielle dans chaque niveau de juridiction j.
VPTD1 : voix (%) obtenues par la droite au premier tour de l'élection présidentielle dans chaque niveau de juridiction j.
ZFFND : zones de force partagées par le FN et la droite classique.
ZFFNG : zones de force partagées par le FN et la gauche.
COHAB : variable indicatrice valant 1 (0 sinon) lorsque le président est de gauche et le premier ministre à droite.
ATYP : territoires votant systématiquement à l'opposé de la tendance nationale (variable indicatrice valant 1 pour les territoires concernés, 0 sinon).
Indicatrices diverses (voir Tableau 3) : variables indicatrices (codées 1; 0 sinon) prenant en compte des situations locales particulières ou pointant les fiefs électoraux des candidats.