Accueil > L’actualité vue par le CRAP > Évaluations CE1 : pièges, vigilance et embarras


Évaluations CE1 : pièges, vigilance et embarras

Par Bernard Devanne et Valérie Neveu

15 juin 2011

Deux textes réunis ici pour dénoncer d’une part la « perversion » des modalités de passage et d’évaluation d’un exercice de production de français et pour témoigner d’autre part d’un véritable travail d’équipe au sein de deux écoles, lequel soulève de nombreuses interrogations quant au degré de confiance à accorder à ces évaluations.


Un exercice de l’évaluation nationale au CE1... ou comment piéger élèves et enseignants

L’exercice 17, proposé aux élèves de CE1 le vendredi 20 mai 2011 [1], est la reprise de l’activité de production d’écrit proposée aux élèves de CE2 au mois de septembre 1998 [2]. Le retour d’un exercice vieux de 13 ans, appuyé à cette date sur les programmes de 1995, permet d’apprécier au prix de quels dévoiements l’évaluation de 2011 a été recomposée pour la rendre conforme aux programmes de 2008.

L’objectif est à priori le même : produire de manière autonome un texte cohérent (ici, un texte de type narratif) ; au vu des items de correction analysés ci-dessous, on appréciera en quoi, en 2011, la validation d’une production textuelle met fortement l’accent sur la maitrise formelle de la grammaire et de l’orthographe – évidemment en cohérence avec les programmes de l’école primaire de 2008.

Le document remis aux élèves :
- est identique dans son principe : un début imposé, le lanceur narratif (avec un titre, « La grande peur de Petit Jules », et une situation initiale, « Petit Jules était plongé dans ses pensées. Il était installé en haut d’un vieux marronnier d’où il guettait l’arrivée des dragons. Tout à coup,... ») puis un large espace ligné ;
- mais de fait relativement différent : en 1998, après le lanceur, 11 lignes suffisamment espacées ; 20 lignes serrées en 2011 – ces lignes supplémentaires se substituent au « Guide d’écriture » proposé en partie inférieure de la page en 1998 : « Quelque chose arrive qui va faire peur à Petit Jules, imagine quoi. Raconte ce que va faire Petit Jules. Dis comment l’histoire finit. »

Les conditions de la passation sont profondément différentes (livret de l’enseignant 1998, p. 54-55 ; livret 2011, p. 20-21) :
- quant à la présentation de l’exercice : en 1998, l’élève de CE2 lit silencieusement le début de récit proposé, puis l’enseignant le lit lui-même à haute voix et pose 4 questions, « Quel est le titre de l’histoire ? Quel est le personnage principal ? Où est-il ? Que veut dire : “il est plongé dans ses pensées ?” » ; en 2011, après une seule lecture magistrale qui omet le titre « La grande peur de Petit Jules » (aucune seconde lecture n’est explicitement prévue) et sans la moindre question de compréhension, l’enseignant continue « Maintenant c’est à vous : vous allez écrire la suite de cette histoire. Vous écrirez au moins 5 lignes. Présentez correctement et soigneusement votre texte ; pensez aux majuscules et aux points. Faites attention à l’orthographe. »
- quant à sa durée et à la gestion qui en est proposée : en 1998, après le renvoi explicite et la lecture à voix haute du « guide d’écriture », l’enseignant poursuit « Maintenant vous avez 25 minutes pour écrire votre texte, vous avez le temps, vous pouvez corriger quand vous pensez pouvoir mieux faire. N’oubliez pas les majuscules et les points. Soyez également attentifs à l’orthographe », et ajoute au bout de 20 minutes « Vous avez encore 5 minutes, ce qui vous laisse le temps de terminer votre texte. » ; en 2011, sans avoir indiqué au préalable le temps accordé (l’information sur le temps de passation, 15 minutes, est donnée pour l’enseignant seulement), il intervient au bout de 12 minutes pour dire « Il vous reste 3 minutes. Vous pouvez utiliser ce temps pour relire votre histoire et corriger vos erreurs ».

À ce stade s’esquissent déjà des représentations pour le moins contrastées du travail scolaire et des « élèves en apprentissage » :
- en septembre 1998, l’évaluation vise un élève de CE2 qui s’est remis en route après 2 semaines de révisions, à qui l’on donne un document encourageant, pour lequel on cadre le travail, que l’on accompagne d’un « guide » disponible sous ses yeux, à qui l’on accorde un temps suffisant (à l’expérience, d’ailleurs tout juste suffisant pour beaucoup d’élèves) ;
- en mai 2011, c’est un élève de CE1 à 6 semaines de la fin de l’année scolaire, « au milieu du gué » en quelque sorte, à qui l’on donne une page lignée qui peut le décourager (tout en acceptant de lui une production de 5 lignes), que l’on lance sans préalables en activité, à qui l’on demande au bout d’un court moment de s’arrêter pour relire et corriger... en 3 minutes (même, dans le cas tout à fait irréaliste où il aurait noirci l’essentiel de la page !). Voudrait-on générer un échec massif que, dès le moment de la passation, on ne s’y prendrait pas autrement.

Les items de correction sont eux aussi profondément révélateurs :
- en 1998, les 5 items prennent en compte l’adéquation de la réponse « - L’élève tient compte des héros, du lieu, de l’évènement. - L’élève a effectivement imaginé ce qui fait peur à Petit Jules. », la cohérence narrative « - L’élève a raconté ce qu’a fait Petit Jules. - L’élève donne une fin cohérente avec le reste de l’histoire, qu’il revienne au réel ou qu’il reste dans l’imaginaire. » et la grammaire de texte « Utilisation des temps du passé (ou utilisation cohérente des temps du récit). » ;
- en 2011, sur les 7 items retenus, 4 sont consacrés à la présence de la ponctuation, à la précision lexicale, à la maitrise de l’orthographe grammaticale et lexicale... À ce stade, il est nécessaire d’entrer dans les détails.

  • Le 1er item (n°48 sur l’ensemble du cahier d’évaluation) : « Code 1, La ponctuation (points et majuscules) est respectée. Un oubli est toléré. Code 4, La ponctuation (points et majuscules) est respectée dans les 5 premières lignes. L’élève écrit un texte plus long et oublie (points et majuscules) : 2 oublis sont tolérés. » Tout enseignant connaissant la classe de CE1 (et bien au-delà) sait pertinemment qu’un élève qui se concentre sur l’histoire racontée laisse plus ou moins aller, au moins dans une première phase, le « texte racontant ». On peut imaginer que, le temps imparti étant de 12 minutes (+ 3 minutes de révision), beaucoup d’adultes seraient dans la même situation. L’évaluation sanctionne donc, dès ce premier item, l’élève de 7 ans et demi qui, ayant sous les yeux 20 lignes généreusement offertes, se lance et tente de raconter, pour de vrai, l’histoire de Petit Jules.
  • Le 2e item (n°49) : « Code 1, L’élève a écrit au moins 5 lignes. » Eh oui, 5 lignes pourraient suffire... tout dépend de ce que l’on appelle un texte narratif. Même à 7 ans et demi, l’élève peut avoir une redoutable intuition du schéma narratif minimal : il fait alors surgir les dragons (1 ligne), prononce par exemple une formule magique (1 ligne) qui met les agresseurs hors d’état de nuire (1 ligne) ; restent 2 lignes qui obligent à épaissir un peu la situation finale... Mais pour la majorité des CE1, les 20 lignes vierges invitent évidemment à l’expansion fantaisiste, à la digression, bref, à une gestion du temps imparti tout à fait aberrante.
  • Le 3e item (n°50) : « Code 1, Les personnages de l’histoire initiale (Petit Jules et les dragons) sont repris ; l’action imaginée est compatible avec le début du récit et l’histoire racontée a une fin. » On ne retrouve pas l’item de 1998 « L’élève a effectivement imaginé ce qui fait peur à Petit Jules. » puisque, bien que l’élève ait ce titre sous les yeux, on n’a pas jugé utile que l’enseignant le leur lise à voix haute (il commence sa lecture en ignorant le titre, ce qui, dans une situation supposée exemplaire, ne manque pas de piment). L’éviction du titre sera, consciemment ou non, une manière de priver beaucoup d’élèves d’une orientation narrative forte qui leur aurait été d’un précieux secours : ils partent en aveugle et ignorent « la grande peur de Petit Jules ».
  • Le 4e item (n°51) : « Code 1, Les éléments de l’histoire imaginée s’enchainent bien, les idées sont correctement organisées. » Il s’agit de deux plans différents qu’on ne peut évaluer en les confondant : l’histoire peut être tout à fait cohérente (grammaire narrative), la mise en texte (grammaire de texte) peut être très approximative – ce qui est le cas dans les récits oraux, par exemple de type « témoignage ». En principe, tout enseignant sait repérer chez l’enfant la compétence à organiser logiquement son histoire oralement, même si celui-ci est incapable de la mettre en texte de façon normée – surtout à 7 ans et demi ! Il ne semble pas que ces subtilités soient envisagées par le ministère.
  • Le 5e item (n°52) : « Code 1, L’élève a employé un vocabulaire approprié en évitant les répétitions. » Il y a peu d’années, la capacité à varier les reprises lexicales et à recourir aux reprises pronominales était évaluée à l’entrée en 6e, au moment où les élèves sont censés avoir travaillé ces composantes de l’écriture. Anticipée au mois de mai du CE1, l’évaluation de cette compétence peut sembler un rien prématurée... surtout après une année de CP pendant laquelle la pratique intensive de la plupart des méthodes de lecture donne plutôt à penser que la règle est la reprise à l’identique, comme ritualisée, de la plupart des groupes nominaux rencontrés !
  • Le 6e item (n°53) : « Code 1, L’élève a utilisé ses connaissances grammaticales pour les accords dans le groupe nominal ainsi que dans la relation sujet/verbe (une erreur est tolérée). Code 4, [...] L’élève a écrit un texte supérieur à 5 lignes. Il n’y a pas d’erreur dans les 5 premières lignes. Dans la suite de son texte, l’élève oublie une fois l’accord dans la relation sujet/verbe ou bien l’accord dans le groupe nominal. »
  • Le 7e item (n°54) : « Code 4, L’orthographe est respectée dans les 5 premières lignes ; l’élève écrit un texte supérieur à 5 lignes (une dizaine de lignes). On accepte 2 erreurs sur des mots courants. On n’accepte pas d’erreur sur les mots invariables. » Nous y voilà donc ! L’essentiel des compétences attendues, même dans une activité supposée d’invention narrative, même dans un dispositif aussi drastiquement écourté, est la conformité de l’orthographe grammaticale (6e) et lexicale (7e). On aura une pensée émue pour l’élève de 7 ans et demi qui, tout entier pris dans son élan de production d’un texte qui court de ligne en ligne, n’a pas, entre la 13e et la 15e minute, la possibilité matérielle de tout mettre aux normes. À ce sujet, on peut noter qu’en 1998, il était précisé pour l’item évaluant l’usage des temps du passé, « On acceptera des incorrections portant sur l’emploi ou sur la forme ». On mesure encore mieux le chemin parcouru.

Dans les « commentaires pour aider à l’analyse d’autres réponses », p. 21, on explique les défaillances parce que l’élève « ne réussit pas à canaliser son imagination pour séquencer son récit » (item 51), « n’a pas conscience de la nécessité d’éviter les répétitions » (item 52), « ne sait pas “relire son texte” » (item 53) – pour ne citer que 3 exemples. Or, depuis 2007, les ministères De Robien puis Darcos ont insisté lourdement pour que la scolarité maternelle soit dévolue à l’enseignement massif de la phonologie et aux exercices de découverte du code alphabétique ; qu’au CP la priorité soit donnée à l’identification des correspondances phonèmes-graphèmes et à l’entrainement systématique au déchiffrage. C’est donc seulement à partir du CE1 que les élèves apprennent, dans les béances ménagées entre l’enseignement du vocabulaire, de la conjugaison, de l’orthographe, à « concevoir et écrire de manière autonome une phrase simple cohérente, puis plusieurs, puis un texte narratif ou explicatif de 5 à 10 lignes ».

Une brève comparaison avec l’évaluation correspondante de 2010 (en ligne à la même adresse) est elle aussi tout à fait édifiante. Si la situation d’écriture est différente (il s’agissait l’an passé d’écrire une séquence supplémentaire à l’histoire Polly la futée et cet imbécile de loup, qui avait fait les jours précédents l’objet de plusieurs exercices de compréhension), les termes de l’évaluation sont strictement identiques à ceux de 2010 : les 7 mêmes items évaluent successivement les mêmes composantes textuelles et linguistiques. Cependant, en 2010, le codage distinguait seulement, et sans doute insuffisamment, les réponses attendues (code 1) d’autres réponses (code 9) ou d’absence de réponse (code 0). En introduisant en 2011 le code 3, et plus encore le code 4, le ministère affine l’évaluation comme d’autres affutent une lame : le couperet tranche d’autant plus dans le vif que l’élève a écrit un texte plus long – qu’il a strictement répondu à la consigne d’imaginer une histoire.

Une telle perversion délibérée des formes de l’exercice, de ses conditions de passation et de son évaluation, dans le contexte d’une politique scolaire particulièrement agressive par ailleurs, conduit sans doute les enseignants, dans le respect le plus élémentaire de leurs élèves, à assouplir les conditions de passation, à infléchir l’évaluation des productions autant qu’il leur semblera judicieux une fois qu’ils ont ces textes en main. Faire autrement, ce serait évidemment condamner des classes entières à des résultats catastrophiques à cet exercice, sans rapport avec les performances réelles de chaque élève patiemment construites au fil des mois précédents. À qui profiterait donc ce crime ?

Bernard Devanne
Professeur honoraire à l’IUFM de Basse-Normandie et ancien membre du groupe Lecture-Écriture de l’Orne


Évaluations sous surveillance

Dès la première séquence des évaluations 2011, il est apparu suffisamment d’interrogations pour que soit rendu nécessaire un temps d’échanges entre enseignants de CE1 [3] afin de préciser et d’harmoniser le traitement des codes des items.
L’objectif était de relever les difficultés et interrogations des élèves et des enseignants, dans un souci de rigueur, d’équité et de formation éventuelle et non de remise en cause des évaluations nationales. Certains ont exprimé leur étonnement, leur incompréhension, parfois leur refus de suivre le protocole, d’autres ont pointé des incohérences ou apporté des réponses aux collègues déroutés. En fin de compte, tous ont ressenti la difficulté de construire des évaluations efficaces, justes et respectueuses des acquis des élèves.
Florilège ou cahier de doléances, les constats regroupés ici, sont la synthèse d’une réflexion pédagogique partagée et toujours en « éveil »…

Les critères de réussite

- Six codes pour analyser les réponses, mais seulement un (code 1) pour valider une réussite ou plus exactement « la réponse attendue ». Les codes 3 et 4 qui indiquent une réussite partielle, n’ajoutent rien au calcul final des points. Certes, le bilan individuel permet de mesurer les acquis en repérant les réussites partielles, mais lors du traitement informatique qui rend compte des résultats de l’école, ceux-ci ne sont pas pris en compte. Est-ce la meilleure façon de « donner de la valeur » aux acquis réels d’un élève de 7 ans ?
- Le code 3 n’est pas toujours en phase avec ce qui est annoncé « réussite partielle ». Il peut s’agir d’une reformulation de la réponse.
Le traitement des réussites varie en fonction des exercices. Un exercice, qui requiert, par exemple, quatre actions, peut être évalué par deux items (donc 2 points) ou par quatre items (donc 4 points). De nombreux exercices subissent le même traitement. Comment justifier ces regroupements, si ce n’est par une simple logique comptable qui attribue 60 points au français et 40 aux mathématiques pour atteindre les 100, facilitant des résultats en pourcentage.
- Ces mêmes regroupements, non justifiés dans le cahier de l’enseignant, peuvent entrainer des comptages surprenants, au détriment des réussites réelles des élèves. Par exemple, lors d’une liste de 6 mots (baratin chaton naviguer // mirliton clignotant topinambour) à orthographier, présentée en deux colonnes, selon la position des erreurs dans l’une ou l’autre colonne, l’élève obtiendra plus ou moins de points, indépendamment du nombre de mots bien orthographiés.
Le seuil de tolérance des réussites n’est pas identique dans tous les exercices et dépend trop de la situation proposée. Il arrive qu’un élève se retrouve pénalisé pour avoir fait plus qu’un autre, ou parce qu’il a répondu là où un autre a préféré une absence de réponse.
- La validation de la réussite reste problématique dans un grand nombre d’exercices. Parfois, les élèves infèrent et optent pour la réponse la plus « évidente », parfois les consignes écrites n’indiquent qu’insuffisamment l’exigence attendue, ou bien les consignes orales et écrites diffèrent, ou encore la réponse attendue s’avère trop restrictive... Il peut arriver qu’elle accorde une place trop grande au jugement de l’enseignant. Qu’est-ce qu’une « assez bonne fluidité », un texte « oralisé sans trop de difficulté », une lecture expressive ?

La capacité évaluée, la tâche à réaliser

- Certaines capacités sont évaluées à travers des exercices qui ne ciblent pas précisément ce qui est annoncé ou bien que très partiellement. Parfois, les capacités sont si proches que les dissocier ressemble plus à un souci excessif du détail qu’à une recherche pertinente d’informations.
- Certaines actions sont liées à la précédente entrainant un « éventuel échec » en cascade ; une double peine en quelque sorte.

La lecture

- La lecture (21 items/60) fait, à juste titre, l’objet d’une attention privilégiée. Néanmoins, les compétences de lecture sont systématiquement évaluées à partir d’un exercice de type « question/réponse » qui sollicite à la fois des qualités de lecture et des qualités rédactionnelles. Il faut savoir dissocier les deux si l’on veut cerner exactement la difficulté.

L’écriture

- L’écriture, activité complexe, apparait faiblement avec quatre items pour la copie et seulement six pour la production d’écrit dans un unique exercice aux items problématiques (degré d’exigence des réussites) alors même que les programmes 2008 annoncent « les élèves apprennent à rédiger de manière autonome un texte court : rechercher et organiser des idées, choisir du vocabulaire, construire et enchaîner des phrases, prêter attention à l’orthographe » et le palier 1 du socle commun ajoute « écrire de manière autonome un texte de 5 à 10 lignes ».
L’écrit mériterait une évaluation attentive et ciblée. Lors de l’unique production écrite (trouver la suite d’une histoire), l’évaluation montre un haut niveau d’exigence en six items prenant en compte la ponctuation, l’écriture d’au moins 5 lignes, la reprise des personnages et la compatibilité de la suite de l’histoire, la rédaction d’une fin, l’enchainement des évènements, l’organisation des idées, l’emploi d’un vocabulaire approprié sans répétitions (au moins 8 points d’exigence).
Enfin, le début du texte est au passé, ce qui a entrainé pour certains élèves des difficultés dans la rédaction au niveau de la concordance des temps. Était-ce bien nécessaire d’autant que cette capacité qui sollicite de nombreuses connaissances ne fait pas l’objet d’une évaluation ? Le présent était suffisant.

L’étude la langue

Les trois domaines (orthographe, grammaire, vocabulaire) représentent quasiment la moitié des items. Les critères de réussites, les regroupements de mots autour de deux items, les seuils de tolérance varient d’un exercice à l’autre et nécessiteraient une meilleure lisibilité des choix faits. Dans l’état actuel, beaucoup de questions et peu de réponses. On sait pourtant que la situation peut influer sur la réussite de l’activité.

Les mathématiques

- Les calculs attendus qui demandent parfois un certain niveau de compétences sont traités à l’identique. Il n’y a pas de reconnaissance de l’expertise requise pour le calcul mental, par exemple ou encore pour le problème qui nécessite une division (les programmes 2008 annoncent que « les problèmes de groupements et de partage permettent une première approche de la division pour des nombres inférieurs à 100 ». Le palier 1 du socle commun, l’exigence de « diviser par 2 et par 5 des nombres entiers inférieurs à 100 ») ou demande une résolution en deux étapes.
- Les recherches et calculs effectués par l’élève dans les résolutions des problèmes sont insuffisamment pris en compte alors même que ce travail d’élaboration permet de comprendre et d’attester du raisonnement effectué. Le nombre attendu est trop souvent validé au détriment du reste (raisonnement, calcul, phrase réponse, indication de l’unité de mesure…).
- Certaines consignes écrites dans le cahier de l’élève différent des consignes annoncées dans le cahier de l’enseignant. D’autres ont des exigences qui ne seront pas prises en compte lors de l’évaluation des réussites, alors pourquoi les demander ? Des items sont liés, des regroupements sont faits, des réponses attendues s’avèrent bien restrictives (Riri et non 260 g)…

En guise de conclusion

Si l’évaluation s’impose désormais comme outil indispensable dans le pilotage des écoles, pour décider et entreprendre des actions en vue d’améliorer la qualité de l’enseignement alors elle se doit d’être méthodologiquement irréprochable et claire dans ses choix (normes, finalités, outils et interprétations), au risque d’affecter les trois caractéristiques essentielles et complémentaires de toute évaluation :
- la pertinence : correspond-elle aux objectifs visés en fin de CE1 ?
- la validité : évalue-t-elle bien ce qu’elle a annoncé évaluer ?
- la fiabilité : l’utilisation des critères est-elle la même pour tout le monde ? [4]

Autrement dit, quelle confiance accorder aux résultats observés cette année encore ?

Valérie Neveu
Directrice d’école à Paris


Quelques travaux d’élèves…



[1Les cahiers du maitre et de l’élève sont disponibles sur le site éduscol.

[3Deux écoles ont participé à cette analyse, à l’initiative des directrices.

[4Se référer aux nombreux articles et ouvrages de Jean-Marie de Ketele, Vincent Carette, Xavier Rogiers, Bernard Rey pour ne citer qu’eux.