Pas de précipitation - Les Cahiers pédagogiques

Le bac, le moins mauvais des systèmes d’évaluation des connaissances ? Peut-être. Par rapport au contrôle continu qui désavantage les élèves les plus faibles et renforce presque fatalement « l’effet-établissement ». Par rapport à un système plus décentralisé qui ne peut que renforcer des tendances particularistes et concurrentielles dans le système éducatif. Commençons par former les enseignants à la notation et les présidents de jury à la décision.

La cause semble entendue et a priori perdue. Les résultats de la première étude (1936 !) portant sur l’équité des épreuves du bac sont en effet accablants. Étant donné la place occupée à l’époque par le baccalauréat « comme régulateur de l’accès aux professions libérales¹», il s’agissait de connaître la pertinence des modalités de sélection de l’élite sociale. Les auteurs ont montré l’étonnante instabilité des jugements professoraux : une même copie de bac peut faire l’objet de notations très variées quelle que soit la discipline. À titre d’exemple, indiquons que les écarts maximaux pour une même copie de bac corrigée par six correcteurs différents sont de neuf points en mathématiques, treize en français, douze en philosophie… Au-delà de ces situations exceptionnelles, les écarts les plus fréquents entre correcteurs vont de quatre points (maths et physiques) à sept points (français et philo.). Laugier et Weinberg concluaient, statistiques en main, que « dans la dispersion des notes, la diversité propre des correcteurs intervient pour une part plus importante que la diversité des copies».

Accablant.

Malgré les barèmes, les écarts de la notation demeurent

Tout a bien changé depuis ces temps reculés et quasi préhistoriques pense-t-on souvent. Sur cette question, et peut-être sur d’autres, il n’en est rien. Les études plus récentes ont confirmé ce premier résultat. En mathématiques, l’analyse d’une notation de huit copies de terminale S par douze correcteurs de mathématiques permet de montrer la proximité des modalités de la correction dans les disciplines littéraires et scientifiques. Alors même que les douze professeurs sollicités dans cette recherche disposaient du barème détaillé de notation utilisé au baccalauréat (quatorze sous-questions notées de 0.5 points à trois points), leur évaluation diffère sensiblement : l’écart minimal entre les correcteurs est de trois points, l’écart maximal est de 5.5 points. Et ces écarts de notes sont à multiplier par le coefficient important de cette épreuve. Aussi troublantes, des différences de correction existent également selon les académies. Au milieu des années quatre-vingt, le recteur de l’académie de Lille s’est inquiété des résultats assez moyens de son académie et demande à ce qu’un échantillon des copies de bac soit corrigé par des correcteurs d’autres académies. Le résultat est édifiant : pour l’épreuve de sciences économiques et sociales, les correcteurs lillois sont effectivement plus sévères que les correcteurs poitevins ou nancéiens… Les écarts de notes entre correcteurs peuvent aller par ailleurs jusqu’à dix points !

Encore accablant.

Un petit réconfort toutefois : une étude récente vient de montrer que les correcteurs lillois ont perdu leur sévérité d’antan… La connaissance tirée de la première recherche aurait-elle guidé l’action administrative, l’élaboration de consignes de correction plus explicites en commissions d’harmonisation et d’entente, et favorisé une notation plus juste ?

Le bac semble donc le pire des systèmes d’évaluation. Et pourtant, il est sans aucun doute le moins mauvais. Étrange paradoxe. Pour l’expliquer, il faut avoir à l’esprit trois données.

Le bac : le système d’évaluation le moins injuste

La première, tout simple, tient au fait que le bac ne repose pas sur une seule épreuve mais sur plusieurs. Or, les incertitudes de la notation sont pour une part aléatoires : les corrections plutôt sévères sont donc compensées par des corrections plutôt indulgentes. Bref, l’addition des incertitudes et des injustices est une source de traitement équitable conformément à un principe simple : quand la mesure est imprécise mieux vaut procéder à plusieurs mesures et de façon différente. Encore qu’il ne sert à rien de multiplier les épreuves à l’infini. Bien que le nombre d’épreuves à retenir varierait selon les séries de bac, environ cinq épreuves, bien choisies, devraient permettre l’équité.

Deuxièmement, la thèse récente de David Oget²a montré que la suppression du bac serait une source d’injustice très particulière. Les notes en classe, dans un contexte où les élèves sont socialement et scolairement bien identifiés (âge, redoublement, sexe, voire origine sociale), sont classiquement marquées par des « biais » de notation, c’est-à-dire des erreurs systématiques discriminant les élèves selon les caractéristiques précitées. Un des intérêts de la thèse de D. Oget est de montrer que ces biais de notation sont aussi présents en classe terminale : le remplacement du bac par le contrôle continu aboutirait globalement à avantager les filles par rapport aux garçons, les élèves non redoublants et les enfants d’origine aisée. Autrement dit, l’anonymat des épreuves est une source d’équité. Une nouvelle fois le même principe élémentaire s’applique : dans une situation d’incertitude mieux vaut deux mesures qu’une seule.

La troisième donnée tient au fait que pour les candidats tangents — ceux qui, après les épreuves obligatoires, ont une moyenne générale comprise entre 8 et 10 — il est mis en place des oraux de rattrapage qui accordent une place non négligeable, bien que très variable, aux résultats obtenus par le candidat pendant l’année de terminale. Lors de ces oraux, et plus encore lors des délibérations finales, les membres du jury sollicitent plus ou moins implicitement, à partir de critères variés d’appréciation des candidats, des règles de justice. Celles-ci résultent d’arrangements entre les professeurs sur la place qu’il faut notamment accorder aux notes du contrôle continu, aux appréciations littérales, à l’avis du conseil de classe (de « très favorable » à « doit faire ses preuves ») et aux notes des épreuves du bac

. Le résultat de ces arrangements internes aux jurys, cette sorte de « cuisine évaluative », est connu de tous : les « bons élèves » ont très généralement leur bac et les « accidents » sont rares. En revanche, la non-obtention de la moyenne pendant l’année ne prédit pas forcément l’échec. Les données statistiques disponibles confirment cette perception de l’examen. Bref, le bac fonctionne généralement comme une seconde chance.

Le système actuel est finalement plus juste qu’un système d’évaluation qui serait fondé uniquement sur le contrôle continu ou sur un système d’évaluation qui serait réalisé à la carte par chaque établissement d’enseignement supérieur. Dans ce dernier cas, les réputations des établissements qui influencent déjà dans le système actuel les délibérations des jurys joueraient un rôle encore plus déterminant. Il en serait de même des caractéristiques scolaires et sociales des candidats sources de « biais de notation » pendant l’année et potentiellement de biais de sélection à l’entrée d’un enseignement supérieur qui s’effectuerait sur dossier. Il faut donc impérativement préserver l’anonymat des candidats.

D’un point de vue pédagogique, le bac est aussi une norme nationale de compétences qui oriente sensiblement les contenus des cours et les pratiques des professeurs. Carcan inadmissible poulies uns, c’est aussi une façon efficace d’éviter l’éparpillement des objectifs et le maintien d’exigences scolaires communes à chaque filière. Le bac introduit en effet une force centripète dans une institution scolaire menacée d’éclatements et de dérives particularistes.

Le bac : un système perfectible

Tout serait donc pour le mieux dans le meilleur des mondes ? Nullement. Il reste au contraire beaucoup à faire. Premier point : la formation des correcteurs. Trop d’entre eux refusent d’envisager le caractère imprécis de leur notation : à trop penser détenir la vérité sur la compétence des élèves, ils oublient que toute notation est tributaire d’un contexte défini notamment par le lycée dans lequel ils enseignent, leurs exigences spécifiques, leur propre formation

. Des pratiques de multicorrections, dans le cadre de formations continues proposées dans les IUFM, permettraient à une partie des correcteurs de manifester davantage de prudence et de réserve à l’égard de leurs jugements.

Second point, la formation et l’information des présidents et présidents adjoints de jury. Ils ont un rôle spécifique à jouer : celui de l’harmonisation des moyennes des différents jurys. À partir du moment où chaque jury est composé d’élèves choisis de façon pratiquement aléatoire, les moyennes des élèves dans chaque discipline et chaque jury devraient être très voisines. Dans le cas contraire, il faut admettre que tel ou tel jury a été plus sévère ou plus indulgent en prenant en compte l’écart à la moyenne académique. Or, de telles comparaisons sont trop rarement réalisées faute de saisir l’importance d’une certaine harmonisation des moyennes afin de parvenir à davantage d’équité et faute de règles bien claires sur le rôle effectif des présidents et présidents adjoints de jury. Les élèves ont raison : certains jurys « saquent » véritablement. Or, tout se passe comme si, faute de connaître ou d’admettre la possibilité de ce type d’injustices, l’administration et les enseignants se repliaient trop souvent, en cette circonstance, dans l’inaction. Ce renoncement à un devoir de justice est-il digne de l’institution éducative et des efforts des candidats ?

(Cahiers pédagogiques n° 387, octobre 2000, « Les examens »)

Pierre Merle

Professeur de sociologie, IUFM de Bretagne.

Notes

Weinberg D., Commission française pour l’enquête Carnegie sur les examens et concours. La correction des épreuves écrites au baccalauréat, Paris, Maison du livre, 1936, p. 71
IOget David, Efficacité et coûts du baccalauréat général et technologique : quelle alternative à l’organisation des épreuves ?, IREDU, 1999, 408 p. (Direction J.-P. Jarousse).

Vous aimerez peut-être aussi