Wasmer Séance 2 - Exhaustif


Economie – Cours d’Etienne Wasmer – n° 2
Les méthodes empiriques :
Cours sur les méthodes empiriques par lesquelles on peut aborder l’économie ; alors que d’habitude on l’aborde avec des courant classique, keynésien, hétérodoxe éventuellement. On incorpore en réalité des éléments d’autres sciences comme la psychologie : différents courants de pensée qui forment une approche main stream.
Comprendre à quel point l’économie est une discipline qui fait des allers-retours entre l’empirique et la théorie, entre les faits et le décryptage de ces faits.
D’abord aperçu de quatre questions complexes qui font intervenir un grand nombre de phénomènes ; puis on réalisera une analyse statistique ; nous verrons enfin deux applications à l’analyse économique (prix/quantité puis prix hédoniques). Partie finale avec un résumé des concepts.
-
Que demande-t-on à un économiste ? (du travail par ex)
1ère question : est-ce que le salaire minimum crée du chômage ?
Théories assez diverses sur la question :
Approche classique qui prédit qu’une hausse du salaire minimum engendre du chômage car tout ce qui contribue à augmenter le coût du travail dissuade les employeurs d’embaucher
Approche keynésienne : si on augmente le salaire minimum, cela donne du pouvoir d’achat aux salariés, lequel se répercute sur la consommation, donc augmente la demande de travail avec celle de biens et services. Résultat inverse de la première approche.
Troisième grille d’analyse néo-classique plus récente qui insiste sur la théorie du monopsone : les entreprises ont un pouvoir de marché sur les salariés et dans ce contexte, augmenter le salaire minimum desserre les contraintes qui pèsent sur les salariés et augmente l’emploi.
Pas de théorie dominante car ceci est une question empirique : seule l’observation des données permet de trancher entre les différentes prédictions…
2ème question : Peut-on relancer l’activité économique par la consommation ? (ou l’inverse, la consommation est-elle déterminée par la production)
A nouveau dialectique entre keynésien et classiques) Approche classique : les gens ne consomment que ce qu’ils ont produit.
La première approche est la keynésienne : si les gens ont plus d’argent, ils consomment plus.
C’est à nouveau l’observation des données qui nous permet de trancher : c’est une question de dynamique des données (si on introduit une dynamique dans l’approche des données) et les deux approches sont justes dans une certaine mesure.
3ème question : La productivité (l’employabilité) dépend-elle du niveau d’étude et si oui, de combien ?
Là encore deux approches plutôt dans le courant néo-classique.
La première est celle de la théorie du capital humain : si les gens font des études, c’est pace que chacun des années d’étude qu’ils font les rend plus employables, plus productif donc plus désirables pour les employeurs. On investit dans les études et ça forme du capital exploitable, du capital humain : il faut encourager un certain nombre d’individu à prolonger le plus longtemps possible ses études.
Une théorie alternative, dite « du signal », celle de Spence (prix Nobel essentiellement pour cette théorie) : en réalité, l’éducation n’apporte rien en terme productif, mais ce qu’elle fait en revanche, c’est qu’elle sert de signal pour les employeurs pour qu’ils sachent si les individus qu’ils ont en face d’eux sont plus travailleurs, plus intelligents, plus productifs et performants. Ils sont donc plus fiables pour les employeurs : il suffirait d’organiser un test à 18 ans pour savoir si les gens sont fiables ou non.
Les deux sont vrais, mais il est important de déterminer la capacité d’augmentation productive de l’éducation.
4ème question : Le stress au travail peut-il être expliqué, voire diminué ?
A nouveau question empirique donc on va observer les données.
Coût énorme du stress à la société, en terme d’arrête maladie et simplement de bien-être.
-
Analyse statistique des données :
Phrase de George-Edward Box, économètre célèbre : Tous les modèles sont faux, mais certains sont utiles » ou “ All models are wrong but some are useful”
Certaines représentations seront très utiles, d’autres seront héroïques au sens où elles ne permettront pas de travailler.
Deux variables, différents pays :
Huit pays, et on place des points de façon tout à fait agnostique : on appelle cela un nuage de points. Il semble avoir une certaine structure, à savoir une relation positive entre X et Y. Le moyen le plus simple de la mettre en évidence est de tracer une droite de régression, cad une droite qui passe au plus près de tous les points des pays. Elle a une pente positive : les corrélations entre les deux variables semble être positives (plus X est grand, plus Y est grand).
Ex. du stress au travail : l’indicateur de stress est la fraction des employés interrogés qui se déclarent souvent ou tout le temps en état de stress. Corrélation positive qui semble montrer que plus le chômage est élevé, plus le stress l’est. La droit de régression permet de voir les pays qui sont au dessus de ce que prédit la droite de régression, et ceux qui sont en dessous de ce qu’indique le modèle.
Définitions :
Méthode de régression linéaire simple : elle est obtenue avec une droite et porte sur une seule variable. C’est la méthode privilégiée.
La droite de régression est la relation linéaire qui approche au mieux toutes ces informations. Elle s’écrit dans l’exemple d’avant : a + b*chômage.
Une droite se décrit toujours avec deux paramètres a et b : b est la pente et a est la constante. On va retrouver a et b pour construire la droite à partir des données.
Il faut se donner un critère précis pour ajuster au mieux la droite par rapport aux points : définir ce qui est « le mieux ».
Méthode graphique : minimiser les écarts verticaux entre la droite et les différentes observations. On fait apparaître des distances dont les sommes me renseignent sur la qualité d’approximation de la droite.
Méthode statistique : pour retrouver les coefficients de la droite quand on possède un grand nombre d’observations. On utilise la technique des moindres carrés : somme de toutes les distances élevées au carré. D’un point de vue calculatoire, c’est plus simple de calculer avec des carrés. Développée dès la fin du XVIIIème siècle par le mathématicien Gauss à l’âge de 18 ans et publiée par le Français Legendre.
Le numérateur traduit la covariation entre x et y : elle peut être positive, négative ou nulle (s’il n’y a pas de corrélation entre les données).
Stress et chômage : stress = 0 .28 + 0.02*chômage
Qualité de la régression :
Coefficient de détermination : R²
C’est un nombre compris entre 0 et 1 et qui traduit la qualité de la régression ; pour 1, la régression est parfaite et tous les points sont sur la droite, pour 0, la corrélation est nulle et il n’y a pas de structure particulière dans la disposition des points.
Il permet d’apprécier la part de la variabilité (variance) du stress qui est expliquée par le chômage. Ici, avec un R² de 0,38 on peut dire que près de 40% du stress est expliqué par le chômage.
On a jamais de nombre exacts : a et b sont des estimations et on fait apparaître des écarts-types sous les nombres a et b afin de préciser le degré de la confiance que l’on peut avoir dans ces coefficients.
Trois généralisations :
-
La même formule peut être étendue à plus d’observations.
-
On peut transformer les variables dans notre modèle à savoir les élever au carré, les prendre en logarithme : log y = a + *log x
On estime une élasticité notée . C’est un nombre qui donne la variation en pourcents de y lorsque x augmente de 1%. peut être négatif : il traduit la pente et la façon dont la variable x va avoir un impact sur la valeur de y.
NB : si on prend uniquement x en log, on estime une semi-élasticité.
-
Régression multiple : il suffit de rajouter des variables explicatives. SI on est insatisfait du modèle précédent, on rajoute des variables alternatives : degré de protection de l’emploi par ex. pour expliquer le stress plus précisément. On a un troisième paramètre à estimer. y va s’exprimer sous forme linéaire : y = a + b*x + c*z
Régression multiple :
On s’aperçoit que la protection de l’emploi contribue à rassurer les salariés quand elle est faible, et parfois, quand elle devient trop élevée, elle détériore les relations employeur-employé, et fait augmenter le niveau de stress. On n’a donc une relation non linéaire mais une sorte de courbe en U, qui traduit l’influence du paramètre « protection de l’emploi » sur le niveau de stress.
Autre ex. de régression multiple : on veut expliquer le nombre de médailles de chaque pays aux J.O. 2008. On réfléchit aux variables explicatives qui peuvent avoir un impact sur cette variable. L’intérêt est d’essayer de prédire : on peut ensuite utiliser cette méthode pour parier ensuite sur les performances sur la base de modèles.
La population et la richesse semblent deux bons indicateurs ; si on avait des données sur plusieurs années, on pourrait utiliser le facteur « pays organisateur ». En réalité un très bon prédicteur du nombre de médailles est le PIB, qui combine richesse (ou PIB par tête) et population.
La relation est croissante et on peut procéder à cette analyse de régression : en ignorant la présence de nombreux « 0 » dans les variables, on obtient la relation
N médailles = -76 + 3,37*log PIB
(10) (0,13)
R² = 0,27
On explique presque 1/3 du nombre de médailles avec la seule variable du PIB.
On ajoute une seconde variable : être membre permanent du conseil de sécurité de l’ONU. Cette variable vaut 1 si on est membre permanent, et 0 si on ne l’est pas. On obtient la relation :
N médailles = -37 + 1,67*log PIB + 63*ONU
(6,1) (0,27) (3,5)
R² = 0,75
Etre membre du Conseil de Sécurité équivaut à ajouter 63 médailles par rapport à ceux qui ne le sont pas.
Pourquoi être membre du Conseil de Sécurité est une variable : c’est un indicateur d nationalisme, de la puissance militaire, etc. qui correspondent à d’autre facteurs come les investissements dans les infrastructures sportives, etc.
Conclusion partielle :
On a des techniques pour construire des modèles statistiques et « expliquer » au mieux.
Mais cela ne règle aucunement la question de la causalité, c’est une façon de tracer une droite de régression, de se figurer les choses.
Impact causal : ex de la régression stress/chômage
Peut-on réellement prédire que le stress au travail diminuerait nécessairement de ce qui est indiqué par la droite si on ramenait en France le stress au travail au niveau du Danemark ? Non. Il y a d’une part des facteurs manquants qui peuvent à la fois générer du stress et u chômage. Ex : période de croissance qui fait diminuer les deux variables. Les facteurs manquants sont un risque dès que l’on réalise une régression et il faut faire attention à ne pas surinterpréter. Il y a aussi des causalités : le niveau de stress peut être en lui-même un facteur qui incite les employeurs à ne pas embaucher auquel cas il faudrait jouer sur le stress pour faire baisser le taux de chômage et pas l’inverse. En général, toutes les causalités se trouver entremêlées et l’impact causal est de fait difficile à estimer.
-
Première application à l’analyse économique
Lien entre prix d’un bien et quantités :
Les quantités dépendent-elles positivement ou négativement des prix ? Si le prix du baril de pétrole se met à augmenter, quelle va être la variation de la production ? Le pétrole est un bien qui, une fois qu’on a investi dans l’infrastructure est assez facile à produire. La corrélation entre prix et quantité va être positive.
Prix du tabac : lorsqu’on augmente le prix du tabac, sa consommation baisse de façon assez importante.
En Angleterre : Price and consumption of tobacco (Joy Townsend in 1996).
Tous les exemples suivants viennent de publications médicales qui utilisent les méthodes évoquées plus haut.
La corrélation négative est presque parfaite entre le prix du tabac et sa consommation.
On va calculer des élasticités : si j’augmente le prix de 1% ou de 10%, de combien la consommation va-t-elle baisser ? L’élasticité prix de la consommation de cigarette est systématiquement entre -0,4 et -0,7 : une augmentation du prix du tabac de 10% baisse historiquement la consommation de 5%. L’income-elasticity : si on augmente le revenu des gens de 10%, ils vont consacrer 4% de leur revenu en plus à la consommation de tabac.
On peut séparer cette analyse par groupes avec cinq catégories socioprofessionnelles : l’élasticité au prix est à peu près nulle pour les catégories supérieure. L’impact est plus grand pour les catégories intermédiaires. Plus on descend sur l’échelle des données, plus l’élasticité au prix est négative, ce qui est assez intuitif.
Pour l’Espagne (ils ont distingué les cigarettes blondes, des brunes) : on a une élasticité de -1,25 pour les cigarettes blondes et une plus faible pour les cigarettes brunes, les gens semblant donc plus dépendants de ces cigarettes.
En Europe : la consommation diminue de 4,6% pour une augmentation de 10% du prix pour les cigarettes locales, et l’élasticité semble plus marquée pour les cigarettes étrangères.
Les agents ne sont pas totalement irrationnels et réagissent au prix, mais d’autant moins qu’ils sont riches.
-
Deuxième application à l’analyse économique :
Théorie des prix hédoniques : les prix des biens ou services échangés dépendent de leurs caractéristiques (que l’on va pouvoir quantifier : voir la valeur qu’attribuent les gens à ces caractéristiques).
Quand on consomme un bien particulier, vous avez un certain plaisir à le faire selon ses caractéristiques et ce plaisir se reflète dans ce que l’on est prêt à payer pour consommer ce bien.
Autre facteur du prix : la difficulté ou le coût à produire ces caractéristiques. On doit tenir compte de cet impact de coût de production sur le prix.
D’où la combinaison offre-demande : demande du point de vue de ce que les gens sont prêts à payer et offre du point de vue de la difficulté de la production de ce bien.
On peut utiliser le principe de la régression multiple : les coefficients que l’on obtient reflètent la valorisation par le marché de tel ou tel bien.
Ex. du prix des logements, qui dépend de :
La présence de bonnes écoles dans un quartier : montre indirectement que la carte scolaire qui est en principe égalitaire, ne l’est pas du tout. Le prix d’un studio dans le 5ème est bien plus élevé que tout ce que l’on pourrait prédire au regard des caractéristiques objectives de cet arrondissement, simplement parce que les lycées Henri IV et Louis le Grand y sont situés.
Parc de transport, d’une terrasse, d’une exposition au sud…
La qualité du bien et du voisinage : on peut calculer l’impact en pourcents sur le prix du mètre carré de différents facteurs. La décote au mètre carré d’habiter dans un HLM est en moyenne de 23%, et le R² de cette régression est de 0,40 !
Autres applications :
-
Prix du forfait des stations de ski : dépend du nombre de pistes de chaque catégorie, nombre de jours d’enneigement et d’ensoleillement. On peut ensuite calculer l’écart entre le prix réel et le prix prédit par le modèle : on peut voir si la station est surévaluée dans son prix par rapport à ce que l’on serait en droit d’en attendre.
-
De même, certains restaurants sont 40% plus chers que ce qu’ils devraient être en fonction de leurs caractéristiques.
-
Prix du vin de Bordeaux : on explique 80% de la variance du prix d’un Château-Latour sur 30 années avec trois variables : la température moyenne en avril-septembre, les précipitations en hiver, ancienneté du vin (2 à 3 % par an).