Les Cahiers pédagogiques sont une revue associative qui vit de ses abonnements et ventes au numéro.
Pensez à vous abonner sur notre librairie en ligne, c’est grâce à cela que nous tenons bon !
,

La note, une pratique scolaire aléatoire

Avant d’aborder l’actualité récente de la notation (conférence nationale de décembre 2014) et les débats qu’elle provoque encore, il nous faut regarder dans le rétroviseur du temps pour voir que ce n’est pas d’aujourd’hui qu’elle a été observée, étudiée et critiquée comme outil de communication de l’évaluation.

 

 

 

Nous résumerons ici quelques-unes des certitudes qu’avec le temps la communauté des chercheurs et des formateurs est parvenue à établir sur cette pratique qui chiffre la réussite de 0 à 10 ou de 0 à 20, en faisant le choix ou non des demis, quarts ou encore millièmes de point.

La docimoloqie, ou l’étude des examens, des systèmes de notation et du comportement des examinateurs et des examinés, l’a prouvé depuis longtemps : noter est une pratique aléatoire, voire impossible, car elle alimente la représentation selon laquelle une note chiffrée permettrait d’évaluer un élève (compétence 7 de l’ancien référentiel de compétences des enseignants en vigueur jusqu’en juillet 2013).

Et cependant, nous notons…

Des fluctuations de grande amplitude

En 1967 le CRDP de Lyon1avait mesuré les écarts entre 150 professeurs corrigeant les mêmes 3 copies et les notant sur 20. En français on obtient de 9 à 12 points d’écart. En maths de 8 à 11. Le devoir de maths est donc aussi difficile à noter « juste » que la composition française…

La double correction serait-elle une solution ?

Certainement pas. En 1934 puis en 1962, Henri Piéron2avait montré que si aucune mesure stricte d’harmonisation n’était prise pour accorder les notateurs, alors il fallait pour stabiliser la note :

  • 127 en philosophie
  • 78 correcteurs en composition française
  • 28 en anglais
  • 16 en maths
  • 13 en physique…
Pourquoi ces divergences entre notateurs ?

L’explication peut être recherchée dans trois directions.

  • Et d’abord, l’impossibilité de donner des notes justes et certaines aux tâches complexes qui constituent les épreuves les plus valorisées aux examens et concours : dissertations, commentaires, résumés, synthèses, études de cas, démonstrations, montages, traductions, etc. G. De Landsheere3conclut à « l’impossibilité presque générale d’utiliser des échelles de mesure mathématiquement parfaites ». Il affirme « qu’on ne peut rendre analytiquement compte de la valeur réelle d’une performance scolaire complexe ».
  • Ensuite l’absence de directives opératoires d’harmonisation des critères pour la correction aggrave les divergences.
  • Enfin il convient d’étudier les fluctuations d’un même correcteur. Et nous allons nous arrêter sur les phénomènes qui déterminent ces variations. Ils ont été étudiés par les docimologistes et synthétisés par De Landsheere :
    • Effet de contagion ou stéréotypie : La connaissance des résultats antérieurs d’un élève influence l’évaluateur. S’installe alors une immuabilité plus ou moins accusée dans le jugement porté sur l’élève. C’est la contagion des résultats ou stéréotypie.
    • Effet de halo : C’est l’influence qu’exercent sur l’évaluateur les paramètres subjectifs, voire affectifs du produit : écriture, lisibilité, présentation, apparence de l’élève, sa conduite, sa façon de s’exprimer, la profession et le statut des parents, etc.
    • Effet de contamination : les notes portées successivement pour différents aspects d’un même travail s’influencent mutuellement. Cet effet est de nature plus mécanique.
    • Effet de grande indulgence et de grande sévérité : certains correcteurs sont systématiquement trop indulgents ou trop sévères dans toutes leurs évaluations. Les élèves et les parents les connaissent et en parlent. Surtout des sévères… Les rectorats aussi qui évitent d’en convoquer certains comme examinateurs !
    • Effet de tendance centrale : C’est un peu l’effet inverse du précédent : par crainte de surévaluer ou de sous-évaluer un élève, le professeur groupe ses appréciations vers le centre de l’échelle.
    • Effet de relativation : plutôt que de juger intrinsèquement d’un travail, des professeurs jugent ce dernier en fonction de l’ensemble des travaux dans lequel il est inséré. On rencontre ce cas en « contrôle continu » par exemple.
    • Effet d’ordre des corrections : On sait que passer après un candidat brillant se révèle défavorable ; de même que succéder à plus faible que soi peut être avantageux. Jean-Jacques Bonniol4a mis en évidence ce phénomène pour la correction de l’écrit (expérience des « ancres »).
    • La fluctuation du niveau d’exigence : Un même évaluateur, au cours de la correction d’un contrôle, d’un examen, peut varier ses exigences sur le produit attendu. On remarque que plus la séance de notation se prolonge, plus les fluctuations prennent de l’amplitude. La fraîcheur évaluatrice est donc inversement proportionnelle au temps qu’on y passe…
    • La fluctuation à l’intérieur d’une même copie : Georges Noizet et Jean-Paul Caverni5écrivent : « Il est probable que les premiers indices recueillis, qu’ils soient positifs ou négatifs, vont provoquer des inférences et que ces inférences vont guider le recueil des indices. C’est ainsi qu’à une recherche ouverte en début de lecture peut succéder progressivement une recherche sélective, l’évaluateur cherchant davantage à recueillir des indices susceptibles de confirmer ses premières inférences que des indices susceptibles de les remettre en question. »

Alertez les élèves : s’ils ont des fautes à faire, que ce soit plutôt dans la seconde moitié de leur copie !

La courbe de Gauss ou la « constante macabre » d’Antibi

Noter c’est aussi éliminer, supprimer, barrer. Gestes de rageuse « justice ». L’élève « fautif » est « corrigé ». Infliger une « bonne correction », bien rougeoyante à un « devoir », stigmatiser les « fautes » fait du correcteur un redresseur de torts, un justicier social. C’est hautement moral et tout le vocabulaire employé l’atteste.

Cette fonction diffuse, implicite de la notation fait que les acteurs du système éducatif obéissent à la prégnance de la courbe de Gauss : les bons résultats n’ont de valeur que parce qu’il y en a de mauvais, le paradis n’a de sens que si l’enfer existe. Toute classe est alors rapidement distribuée à peu près en un tiers de très bons et bons élèves, un tiers de médiocres et un tiers de mauvais. Tests, évaluations, contrôles, examens sont des machines à fabriquer cette constante du tiers exclu qu’André Antibi6a appelée constante macabre. Mettez dans une prépa d’un grand lycée les meilleurs bacheliers avec mentions TB, B, ceux qui ont toujours appartenu au tiers élu. Dès la fin du premier trimestre, vous les retrouverez distribués selon l’archaïque courbe gaussienne. Et on aura fabriqué de l’échec scolaire avec d’excellents élèves…

André Antibi : « Par « constante macabre », j’entends qu’inconsciemment les enseignants s’arrangent toujours, sous la pression de la société, pour mettre un certain pourcentage de mauvaises notes. Ce pourcentage est la constante macabre. »

La « reproduction », une pratique sociale

Jean-Claude Passeron7avait montré en 1970 comment et pourquoi les examens étaient un instrument d’immobilisme social. Ils accordent plus une certification sociale, fixant le niveau auquel il sera socialement exigible de payer les lauréats, qu’une vraie garantie de compétence professionnelle. Ils enregistrent les effets profonds de la première éducation et reproduisent ainsi les inégalités sociales nées du capital culturel, comme l’ont montré la même année Bourdieu et Passeron8

.Rejoignant ainsi les thèses de Durkheim, de Weber, de Clausse, Passeron montre que les examens français les plus cotés sont moins des épreuves de connaissance que des épreuves de manière ou des exercices d’usage lettré du langage. Ainsi de la dissertation dont le formalisme rhétorique permet d’échapper aisément à une notation objective et technique. Cette indéfinition formelle exerce une fonction de fermeture au profit du groupe social qui a 1’usage de la langue exigée.

Harmoniser ?

Depuis le début du siècle les docimologistes désespèrent les notateurs. Toutes leurs expériences montrent les désaccords entre évaluateurs et le manque de fidélité d’un même correcteur.

Mais dans ces expériences on a systématiquement omis d’inviter les notateurs à s’accorder sur des critères de correction, à les harmoniser. Les docimologistes ont donc souvent enregistré surtout les résultats d’une politique anarchique, irrationnelle des examens.

Pour tenter de corriger quelque peu ces effets négatifs et de pallier l’influence de certains défauts qui entachent la correction, on instaure ici ou là des techniques particulières : corriger anonymement, corriger toutes les réponses à une question avant d’aborder la suivante, varier l’ordre de correction des copies, corriger collectivement en un même lieu, le même jour, etc. Et bien sûr, adopter une démarche plus fondamentale : définir en commun les objectifs de l’épreuve, mettre au point les critères d’évaluation de ces objectifs, les barèmes, etc.

Cette « harmonisation » se pratique désormais depuis de nombreuses années aux sessions du baccalauréat sans cependant faire disparaître les phénomènes qui affectent la notation et que nous avons résumés ici.

Mais si introduire une raison évaluatrice dans les procédures de correction des examens n’est certes pas la panacée qui permettrait d’aboutir à la mythique note « juste » et « objective », cela met cependant sur le chemin d’une plus grande cohérence.

Origine de la note sur 20

C’est le ministre de l’Instruction publique, Léon Bourgeois, qui, en 1890, par arrêté institue la notation chiffrée de 0 à 20 dans l’enseignement secondaire (pour les « compositions », mensuelles et trimestrielles) et de 0 à 10 dans l’enseignement primaire.

Mais celui-là même qui imposait cette échelle de notation semblait n’avoir qu’une piètre opinion de cette fonction et il appelait les professeurs à ne pas trop s’attacher à la lettre (aux chiffres en fait…) de cette opération peu digne de leur attention ! Lisons ce que Léon Bourgeois affirme dans ce même arrêté du 5 juillet 1890 :

« De toutes les manières dont un professeur consciencieux peut perdre son temps et sa peine, la plus évidente n’est-elle pas de passer des heures à relire des copies d’enfants en s’ingéniant à trouver des degrés où il n’y en a point, à mettre en balance, comme s’il s’agissait d’une affaire d’État (c’en est une en effet pour les rivaux et quelquefois leurs familles) des mérites qui souvent sont d’ordre différent, et par suite sans commune mesure ? Combien ce temps serait mieux employé en lectures et en travaux personnels par lesquels le professeur renouvellerait sa provision d’idées ; combien même il serait plus utilement donné au repos, source de bonne humeur et de fraîcheur d’esprit ! ».

Traduisons… Le ministre invitait alors les professeurs à canoter en bords de Marne, à enfourcher leur draisienne ou leur vélocipède, à ne rien faire du tout, à musarder, lire, rêver, caresser leurs femmes, plutôt que de perdre leur temps et leur belle jeunesse à corriger et noter des copies indigestes…

Voilà une institution, la note, qui a en France une longévité surprenante ! Et les Cahiers gardent la trace des débats qui ont eu lieu à son sujet et qui se poursuivent encore aujourd’hui.

Richard Etienne et Raoul Pantanella

Notes
  1. CRDP, « Docimologie et Examens », Lyon IPN, 1969
  2. Henri Piéron, Études docimologiques sur le perfectionnement des examens et concours (avec Henri Laugier, Mme H. Piéron, Dr Edouard Toulouse et Mlle D. Weinberg), Paris, Conserv. Nat. des Arts et Métiers, 1934. Étude reprise dans : Henri Piéron, Examens et docimologie, Paris, PUF, 1969
  3. G. De Landsheere, « Évaluation continue et examens. Précis de docimologie », éd. Labor. Éducation 2000, 1980
  4. IJean-Jacques Bonniol (Thèse de 3e cycle. Aix-en-Provence 1972), puis repris dans : Jean-Jacques Bonniol et Michel Vial, Les modèles de l’évaluation, De Boeck, Portefeuille, 2009
  5. IGeorges Noizet et Jean-Paul Caverni, Psychologie de l’évaluation scolaire, Paris, PUF 1978
  6. André Antibi, La constante macabre, édition Math’Adore, 2003
  7. ean-Claude Passeron, « Sociologie des examens », Éducation et Gestion n° 20, avril 1970.
  8. ierre Bourdieu et Jean-Claude Passeron, La Reproduction. Éléments pour une théorie du système d’enseignement, Editions de Minuit, 1970.