mercredi 4 juin 2014

SOS statistiques maltraitées

L'INSEE a récemment publié les résultats d'une enquête d'opinion auprès du public, concernant les publications d'indicateurs, de statistiques et entre autres la confiance que les français ont en l'INSEE. Les résultats sont les suivants : 61% des français ne font pas confiance aux chiffres publiés par l'INSEE, la raison avancée étant principalement que "les hommes politiques leur font dire ce qu'ils veulent". 



Evidemment, pour un statisticien-économiste, ces résultats sont déprimants. Pas parce qu'il est difficile de se faire comprendre, mais parce que les français ont raison : on peut faire dire n'importe quoi aux chiffres. Les hommes politiques le font, les journalistes aussi, votre voisin également. Cependant il n'est pas nécessaire de connaître tout sur tous les chiffres (leur construction, les méthodologies employées, les sources de données, leur rythme de publication...) pour reconnaître les situations où quelqu'un fait dire n'importe quoi à un chiffre. Le but de cet article est d'offrir un florilège d'exemples de falsifications, pour que chacun puisse se dire en reconnaissant la manœuvre : "je suis en train de me faire empapaouter". 

1) Ne jamais croire quelqu'un brandissant un classement. 

Les classements révèlent très rarement une vérité intéressante. En particulier, si on ne connaît pas la façon dont est construit l'indicateur servant de fondement au classement, celui-ci ne donne aucune information sur la significativité des écarts. Prenons par exemple des lycées et des taux de réussite au baccalauréat. L'escroc classera systématiquement les lycées par taux de réussite et dira que le lycée X est premier, devant le lycée Y et le lycée Z. Le statisticien dira que le lycée X a un taux de réussite de 81%, le lycée Y de 80.8% et le lycée Z de 80.4%. A lire l'escroc, le lycée X domine, mais à en croire le statisticien, les lycées X, Y et Z ont des taux de réussite proches. 

2) Se méfier des indicateurs uniques.

Si on continue avec les taux de réussites, un lycée X recrutant les meilleurs élèves de 3ème aura probablement de meilleurs résultats au bac qu'un lycée Y recrutant des élèves de 3ème représentatifs. Pour les parents, raisonner en se disant : "je vais essayer d'envoyer mon enfant dans tel lycée car ainsi il aura 80% de chance d'avoir son bac au lieu de 60%" paraît logique. Mais c'est exactement ce que l'escroc veut vous faire croire. Si le lycée X n'a pas de méthode pédagogique particulièrement révolutionnaire, un élève donné étant à la limite aura probablement autant de chance d'avoir son bac s'il est dans les meilleurs du lycée Y que s'il est dans les moins bons du lycée X. Peut-être qu'être au milieu de bons élèves est plus stimulant. C'est peut-être stressant aussi. Il faut tester, et ça dépend certainement des enfants. Je vois cependant un avantage à croire des bêtises : si les parents croient qu'être admis dans le lycée X accroît les chances de leur enfant et qu'ils le pousse à travailler pour avoir de meilleures notes en 3ème, alors ça augmente sûrement ces chances de réussite au lycée et au bac. In fine, être admis dans le lycée X est l'information importante, pas le fait de passer par le lycée X. 

3) Se méfier de la profusion de chiffres.

Ca semble un peu contradictoire avec le point précédent, mais en fait non. Souvent, quelqu'un qui cherche à vous embrouiller va vous sortir tout un tas d'indicateurs différents, pris à endroits du temps et de l'espace (par exemple le taux de croissance en 2012, la dette en 2013, le déficit commercial moyen depuis 2005 et le différentiel de taux chômage avec l'Allemagne). Si les concepts étudiés sont différents, il y a peu de chance que ça réponde à la même problématique. En plus, il y a de fortes chances que l'auteur ait choisi des indicateurs qui lui conviennent (tous positifs ou tous négatifs, ce qui devrait vous mettre la puce à l'oreille), à des dates qui lui permettent d'accentuer son argument fallacieux. 

Par contre à problématique donnée (par exemple l'emploi), c'est bien d'avoir plusieurs indicateurs, et de regarder leurs évolutions dans le temps et l'espace. 


4) Si on étudie un pourcentage, connaître le numérateur et le dénominateur. 

Là, on entre un tout petit peu dans le détail du chiffre, mais rien qui ne soit plus compliqué que la vie de tous les jours. Si c'est un pourcentage, de quoi par rapport à quoi? Par exemple, le chômage est le pourcentage de gens sans emploi parmi ceux souhaitant travailler (population active). Donc déjà, le taux de chômage est un indicateur complexe. Il résume deux informations en une seule : combien de gens souhaitent travailler, et parmi eux, combien ne travaillent pas. Il peut varier pour l'une ou l'autre raison. L'exemple ci-dessous est très parlant. 

Millions de personnes
Si on est contre le gouvernement en place à la période 2 voici ce qu'on va dire dans chacun des cas : 
cas 1 : Le nombre de chômeurs augmente de 10%. 
cas 2 : Hausse du taux de chômage de 12,5% à 15,3%
cas 3 : Le gouvernement détruit 2 millions d'emplois. 

Si on est pour le gouvernement, 
cas 1 : L'économie a créé en 7 millions d'emplois en période 2. 
cas 2 : Le taux d'emploi augmente de deux points, à 72% de la population. 
cas 3 : Le taux de chômage passe sous la barre des 10%. 

Il ne faut jamais se limiter au titre. Si on est intéressé par le sujet, on cherche le tableau ci-dessus et on l'analyse. Le cas 1 est le cas d'une économie sur un sentier équilibré de croissance, où toutes les grandeurs croissent à la même vitesse : population, emploi, nombre de chômeurs. Ainsi, les ratios restent stables (taux d'emploi, taux de chômage). 

Le cas 2 est le cas d'une hausse du chômage due à l'entrée sur le marché du travail de personnes inactives auparavant. Par exemple, une économie encore déprimée et contrainte par une demande faible mais où des signes de reprise se font sentir (l'emploi augmente), ce qui pousse certaines personnes ayant auparavant abandonné leur recherche d'emploi à revenir sur le marché du travail. En gros, ça peut aller moins bien avant d'aller mieux. Mais ça peut aussi vouloir dire autre chose. 

Le cas 3 est le cas inverse, où l'emploi diminue, ce qui décourage beaucoup de chômeurs longue durée, pousse les étudiants à poursuivre leurs études et pousse les séniors à partir à la retraite un peu plus tôt. Mais ça peut être autre chose aussi. 

Le taux de chômage est utile pour les macroéconomistes, car il détermine le degré de fiction moyen sur le marché de l'emploi. Il permet de savoir si l'inflation est proche ou non, il permet d'ajuster les politiques monétaires et fiscales. Il est également utile pour les spécialistes du marché du travail qui analysent le chômage frictionnel. Au plein emploi, le taux de chômage sera plus élevé dans une économie où on change souvent de travail, ou dans une économie où on met deux mois à retrouver un emploi plutôt qu'un mois. Les implications ne sont pas les mêmes selon les cas. Par exemple, il peut être souhaitable d'accepter un chômage frictionnel plus élevé si cela laisse le temps aux chômeurs de trouver une meilleure adéquation entre leurs compétences et leur travail. 

Mais le taux de chômage (ou le nombre de chômeurs) est presque sûrement inutile pour tout un chacun parce qu'on le calcule rarement par secteur, ce qui est le seul indicateur utile pour prendre des décisions professionnelles (si je démissionne vais-je retrouver facilement un emploi? quel est mon pouvoir de négociation pour une augmentation? dois-je accepter ce travail pour lequel je suis sur-qualifié?). 


5) Si on étudie une grandeur économique, savoir si on parle de flux ou de stock. 

Le PIB, c'est la somme des revenus des gens. C'est un flux qui arrive chaque année. La dette, c'est un stock. Tout le monde sait ce que cela veut dire "j'ai eu une augmentation de 10% cette année". Cela veut dire que la croissance du PIB de l'économie "moi" est de 10%. De la même manière, si je gagne 20 000 euros annuels et que je suis endetté pour 150 000 euros auprès de la banque, mon ratio de dette est de 150/20 = 750%. Je sais, ça a l'air bête, mais vous n'imaginez pas le nombre d'articles qui ont l'air de confondre flux et stocks.  

6) Pour les comparaisons dans le temps et l'espace, préférer les indices aux taux de croissance. 

Partons de ce tableau recensant les taux de croissance dans les 28 pays de l'Union Européenne depuis 2006. 

Source : Eurostat (base 2005). 
C'est indigeste et si je suis journaliste, il faut que j'en résume la substantifique moelle. On peut faire dire beaucoup de choses à ce tableau. Que la France a connu une des plus faibles récessions en 2008/2009. Que la France stagne depuis 2012. 

Finalement, que veut savoir le français? D'abord si ça va bien, ensuite comment se sentent les copains, et enfin si ça va aller mieux. Pour les deux premières questions, ce n'est pas la peine de chercher à comparer des taux de croissance, il suffit de regarder la croissance cumulée du PIB/hab depuis la crise : 

Source : The Economist
Donc ça ne va pas mieux en France, puisque le revenu moyen est encore plus bas qu'en 2007. Les copains ne sont pas en forme, sauf l'Allemagne. Le Royaume-Uni est à peu près au niveau de l'Espagne mais commence à sortir de l'ornière, l'Italie décroche depuis 2012 et l'Irlande s'est stabilisée plus de 10% plus bas qu'en 2007. Pour l'avenir, bien malin celui qui le devinera. 

PS : si je gagne 1000 en 2012, 2013 et 2014, mon revenu stagne pendant trois ans. Si mon voisin gagne 1000 puis 800, puis 1000, son revenu baisse de 20% et augmente de 25%. Sa croissance moyenne (arithmétique) est de 2.5% par an, la mienne de 0%. Lequel des deux est dans la meilleure situation? 






Aucun commentaire:

Enregistrer un commentaire