Les Cahiers pédagogiques sont une revue associative qui vit de ses abonnements et ventes au numéro.
Pensez à vous abonner sur notre librairie en ligne, c’est grâce à cela que nous tenons bon !
,

Maths : les fondements scientifiques de l’évaluation s’effondrent (1ère partie)

Dans une interview sur France-Info, le 16 janvier 2019, Jean-Michel Blanquer mettait une nouvelle fois en avant le caractère scientifique des évaluations CP-CE1 : «[elles] ont été conçues par des scientifiques et des professeurs de terrain, sont faites pour donner des outils à chaque professeur et (pour) que chaque professeur puisse ainsi faire progresser son élève». Or, une recherche publiée fin 2018 invalide les fondements scientifiques de l’item de l’évaluation CP-CE1 ayant suscité le plus de rejet chez les professeurs : apparier points et nombres sur un segment numéroté à ses extrémités. Le ministre se trompe : dans ces évaluations, les épreuves qualifiées de «cognitives», n’auront pas d’utilité pour les professeurs ; de plus, elles risquent de les fourvoyer vers des interventions pédagogiques contreproductives.

Franck Ramus, chercheur en psychologie cognitive et membre du Conseil supérieur de l’Éducation nationale, a rédigé pour son blog un article intitulé «À quoi servent les nouvelles évaluations de CP et CE1». Le ministère se réfère souvent à ce texte pour justifier le dispositif. On y lit : «Bien sûr, tous les enseignants évaluent leurs élèves régulièrement avec des outils variés. Il s’agit ici de leur offrir des tests cognitifs plus complets et plus précis que ceux qu’ils utilisent la plupart du temps.» Ainsi, les «nouvelles» évaluations CP-CE1 sont les premières à être qualifiées de «cognitives».

On comprend mal pourquoi une évaluation scolaire, dans sa forme classique, ne pourrait pas être également qualifiée ainsi. C’est pourquoi on soupçonne que l’emploi de l’adjectif «cognitif» renvoie à l’usage que ferait cette «nouvelle évaluation» de résultats issus des sciences cognitives. En fait, ni le site Éduscol, ni celui de Franck Ramus ne permettent de comprendre de façon précise les ressorts de l’élaboration de l’évaluation en mathématiques et il faut se tourner vers la vidéo d’une conférence (5 novembre 2018 – à partir de la 31ème minute) d’une jeune personne qui semble avoir été la cheville ouvrière de l’opération : Cassandra Potier-Watkins. Elle est doctorante dans le laboratoire de Stanislas Dehaene et se présente comme la correspondante privilégiée de la DEPP et de la DGESCO, les organismes ministériels travaillant sur l’évaluation et les programmes d’intervention pédagogique pouvant s’ensuivre.

Des items classiques et deux qualifiés de «prédictifs»

Cassandra Potier-Watkins permet de mieux comprendre en quoi consiste cette référence au «cognitif». Elle distingue deux sortes d’items. Il y a ceux correspondant à une évaluation scolaire «classique» : dictée et lecture de nombres, calcul proposé par oral ou par écrit, résolution de problèmes arithmétiques… et deux autres items qu’elle qualifie de «prédictifs», ce qui est évidemment plus précis que «cognitifs». Ce sont ces derniers items qui font l’originalité de la nouvelle évaluation.

Le premier item «prédictif» est celui qui a été évoqué dans l’introduction : l’enfant est face à un segment dont chaque extrémité est numérotée avec, par exemple, 0 et 10 et on lui indique une position; parmi plusieurs propositions d’écritures chiffrées, il doit choisir celle qui correspond à cette position.
-41.jpg

Le deuxième item « prédictif » est une comparaison de nombres. Il confronte l’élève à de très nombreux couples de nombres, 8 et 9 par exemple, et les enfants doivent barrer le plus grand des deux (ils sont avertis qu’il s’agit d’un exercice de vitesse). Le temps est limité à deux minutes, de sorte qu’en début de CP la plupart des élèves n’ont pas le temps de finir et il est possible d’évaluer leur niveau de compétence à partir du pourcentage de couples de nombres qu’ils ont eu le temps de traiter correctement.
.png

Le caractère prédictif de ces deux items a été mis en évidence dans une recherche de Lyons et collègues[[Ian M. Lyons, Gavin R. Price, Anniek Vaessen, Leo Blomert and Daniel Ansari, « Numerical predictors of arithmetic success in grades 1-6 », Developmental Science 17, 714–726, 2014.]] : les performances des enfants en CP permettent de prédire leur niveau en mathématiques au CE1. Commençons par présenter le cadre théorique général que Stanislas Dehaene utilise pour interpréter ce résultat.

«Sens des nombres» ou «sens des ordres de grandeur» ?

Dans sa conférence, Cassandra Potier-Watkins projette longuement un texte encadré et rédigé en caractère rouge afin qu’il émerge mieux : «Le premier objectif de l’éducation mathématique est de renforcer les liens entre les nombres symboliques et leur sens.» Cette phrase est mise en exergue parce qu’elle résume la thèse de Stanislas Dehaene concernant les premiers apprentissages numériques.

À priori, au cas où les élèves disposeraient précocement d’un «sens des nombres», il apparaitrait évidemment judicieux de l’exploiter pour favoriser le progrès. Encore faut-il préciser ce que l’on qualifie par «sens des nombres». En fait, toute analyse critique des propositions théoriques de Stanislas Dehaene doit commencer par une déconstruction de la façon dont il s’exprime.

Que veut-il dire lorsqu’il évoque «le sens des nombres» ? Sous sa plume, cette expression renvoie à ce qu’il appelle également «la bosse des maths». C’est le titre de son principal ouvrage sur les apprentissages numériques[[Stanislas Dehaene, La bosse des maths, 15 ans après, Odile Jacob, 2010.]]. On remarquera d’ailleurs que ce titre est traduit par The Number Sense dans sa traduction anglaise. Et, conformément à ce que signifie communément l’expression «bosse des maths», cela renvoie pour Stanislas Dehaene à une compétence innée. Il s’exprime ainsi dans son cours au Collège de France[[À voir en ligne: https://www.college-de-france.fr/media/stanislas-dehaene/UPL22033_dehaene_res0708.pdf]] du 1er avril 2008 : «(ce) noyau de connaissances est déjà présent chez le très jeune enfant et de nombreuses espèces animales, et est associé à un circuit cérébral situé dans la région intrapariétale bilatérale. L’apprentissage des symboles de l’arithmétique formelle s’appuie fortement sur ce sens précoce des nombres.» Ainsi, le «sens des nombres», comme la «bosse des maths», serait inné et, bien évidemment, jouerait un rôle majeur dans le progrès.

Il est essentiel de souligner que l’existence de compétences innées fait évidemment consensus chez les chercheurs, mais ils les interprètent rarement comme constituant une «bosse des maths». Tous s’accordent pour considérer que les bébés naissent avec un système leur permettant de distinguer deux collections lorsqu’elles sont de grandeurs suffisamment différentes. Pour tester cette compétence, on présente les deux collections et, dès qu’un enfant sait parler, on lui demande quelle est la plus grande. Avec les bébés et les animaux, c’est-à-dire en l’absence de langage, on utilise d’autres techniques expérimentales (habituation, apprentissage…).

La capacité de distinguer deux collections dès que leurs tailles sont suffisamment différentes est une compétence de bas niveau qui est effectivement largement partagée dans le règne du vivant : un grand nombre d’organismes sont génétiquement équipés afin de distinguer précocement un gros tas de nourriture d’un petit tas. C’est pourquoi la plupart des chercheurs en sciences cognitives font le choix de s’exprimer différemment de Stanislas Dehaene : ils parlent d’un «sens inné des ordres de grandeurs» (le mot anglais utilisé est magnitude) alors que lui choisit de parler d’un «sens inné des nombres» ou encore d’un «système inné de nombres approximatifs».

Parler de « nombre approximatif » sème la confusion

D’un point de vue épistémologique, la notion de nombre renvoie à un système conceptuel qui organise les quantités par comparaison entre elles[[Rémi Brissiaud, «Pourquoi l’école a-t-elle enseigné le comptage-numérotage pendant près de 30 années ? Une ressource à restaurer : un usage commun des mots grandeur, quantité, nombre, numéro, cardinal, ordinal, etc.», texte d’octobre 2014 mis en ligne par la Commission française pour l’enseignement des mathématiques (CFEM) : http://www.cfem.asso.fr/debats/premiers-apprentissages-numeriques/Brissiaud_UneRessourceaRestaurer.pdf]]. Une quantité de 7 jetons, par exemple, est plus grande qu’une quantité de 6 jetons parce que «7 jetons, c’est 6 jetons et encore 1». Une quantité de 8 cubes, autre exemple, est plus grande qu’une quantité de 5 cubes parce que «8 cubes, c’est 5 cubes et encore 3». Le nombre nait de la comparaison des quantités en donnant accès à leurs différences (chez les élèves plus âgés, il donne aussi accès à leurs rapports, ce qui constitue l’autre grand mode de comparaison).

Comme la notion de nombre nait de la comparaison des quantités, elle présuppose donc cette notion : il n’y a pas de conception possible des nombres sans celle préalable des quantités! Or les quantités sont définies à une unité près et, donc, pour accéder aux nombres il faut procéder à une analyse des collections unité par unité. Remarquons que les premiers symboles quantitatifs utilisés par nos ancêtres n’étaient pas des mots, du moins pour les «grandes quantités», mais une suite de traits gravés par correspondance terme à terme avec les unités d’un troupeau de moutons, par exemple. Les différentes unités du troupeau étaient bien prises en compte.

Présentons un résultat[[Voir Aurélie Coubart, Véronique Izard, Elizabeth S. Spelke, Julien Marie, Arlette Streri, « Dissociation between small and large numerosities in newborn infants », Developmental Science, 17, 11-22, 2014.]] qui invalide l’idée que les bébés disposeraient d’un «sens inné des nombres». Les nourrissons de moins de trois jours différencient une collection de 10 points et une autre de 30 points, mais ils différencient aussi une collection de 25 points et une autre de 75 points… En fait, ils différencient de grandes collections qui sont dans un rapport de 1 à 3 (dans cette comparaison visuelle, c’est le rapport qui importe !). En revanche, des bébés bien plus âgés ne font pas la différence entre une collection de 2 et une de 6, c’est-à-dire de petites collections qui, elles aussi, sont dans un rapport de 1 à 3. Ce résultat est totalement contre intuitif : les nourrissons réussissent avec de grandes collections ce que des bébés plus âgés échouent avec de petites collections !

Ceci plaide en faveur de l’hypothèse que le traitement inné des collections ne porte pas sur des quantités analysées unités par unités, mais sur des ordres de grandeur. En effet, lorsqu’il est confronté à de petites collections, le bébé prend vraisemblablement en considération les différentes unités des collections présentées. Et il échoue à comparer les quantités correspondantes ! En revanche, avec de grandes collections, leur taille l’empêche de prendre en considération les différentes unités, l’obligeant à traiter ces collections plus globalement. Il traite seulement leurs ordres de grandeur (magnitudes). Et il réussit !

Lorsqu’un chercheur reproche à Stanislas Dehaene sa façon de s’exprimer, il rétorque que pour qualifier les compétences innées des bébés, il n’utilise pas le mot «nombre» isolément parce qu’il lui accole le mot «approximatif». Cependant, l’usage de l’expression «nombre approximatif» est surprenant parce que le propre du nombre est d’être défini exactement : 4 n’est ni 3, ni 5 ! Habituellement, les pédagogues utilisent le qualificatif «approximatif», pour parler d’une compétence de très haut niveau : le véritable traitement approximatif des nombres, quand un élève, face à une collection de points, dit : «il y en a à peu près 25», par exemple. Et tout enseignant sait que les élèves préfèrent longtemps un traitement exact des nombres et que l’accès à un traitement approximatif performant est un signe d’expertise.

Ainsi, l’usage de l’expression «nombres approximatifs» pour qualifier les compétences innées des bébés crée une double confusion : un traitement non numérique, la comparaison des ordres de grandeur, est qualifié de numérique et un futur traitement numérique de haut niveau est désigné de la même manière qu’un traitement non numérique inné. En s’exprimant ainsi, Stanislas Dehaene ne rend pas service à l’école et aux enseignants.

L’innéisme de Stanislas Dehaene est de plus en plus controversé

Mais revenons au cœur de la question : le sens inné des ordres de grandeurs approximatifs joue-t-il un rôle majeur dans le progrès des enfants vers le nombre ? Ce sens inné des ordres de grandeurs peut-il être considéré comme une «bosse des maths» ? Les recherches sont de plus en plus nombreuses à mettre en évidence que c’est très loin d’être le cas.

En 2017, Carey et collègues résument les résultats de leur recherche[[Suzan Carey, Anna Shusterman, Paul Haward, Rebecca Distefano, «Do analog number representations underlie the meanings of young children’s verbal numerals ?», Cognition 168, 243–255, 2017]]. ainsi : «Ces données fournissent de nouvelles preuves que ce n’est pas en faisant correspondre les ordres de grandeurs approximatifs aux mots que les enfants construisent la signification des noms de nombres au début du développement.» Signalons que Susan Carey, professeur à l’Université de Harvard, est l’une des sommités de ces trente dernières années en psychologie cognitive.

Un peu plus tard, dans une recherche publiée début 2018[[Ian M. Lyons, Stéphanie Bugden, Samuel Zheng, Stefanie De Jesus et Daniel Ansari, «Symbolic number skills predict growth in nonsymbolic number skills in kindergarteners», Developmental Psychology, 54(3), 440-457, 2018.]], Lyons, Budgen et collègues résument leurs résultats ainsi : «Nous concluons qu’une fois que l’on acquiert une connaissance de base des symboles du nombre exact, c’est cette compréhension du nombre exact (et peut-être une pratique répétée avec celui-ci) qui facilite le développement du système approximatif des ordres de grandeur. Bien que le mécanisme précis reste à comprendre, ces données remettent en question l’opinion largement répandue selon laquelle le système approximatif des ordres de grandeur servirait d’échafaudage à l’acquisition des nombres

Enfin, une dernière recherche, de Daker et Lyons[[Rich J. Daker et Ian M. Lyons, «Numerical and Non-numerical Predictors of First Graders’ Number-Line Estimation Ability», Frontiers in Psycholology, 2018. En libre accès à l’adresse suivante : https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6283913/]], nous intéresse particulièrement ici parce qu’elle utilise les deux épreuves «prédictives» de l’évaluation CP-CE1. Elle est très récente (30 novembre 2018). Ces chercheurs se demandent ce qui détermine la réussite à l’épreuve dite de la «ligne numérique» et un examen des publications antérieures les conduit à étudier le rôle de trois variables :
1°) Le sens inné des ordres de grandeur. Pour l’évaluer, ils utilisent une épreuve de comparaison de collections de points. Les auteurs de la recherche disent explicitement que cette partie de leur travail est un test de la théorie exposée par Stanislas Dehaene dans son ouvrage The Number Sense.
2°) Le résultat à l’épreuve de comparaison que l’on trouve dans l’évaluation CP-CE1.
3°) Le résultat à un test d’intelligence non verbale, les matrices de Raven.
Leur conclusion est sans appel : le sens inné des ordres de grandeur n’explique en rien les performances à l’épreuve dite de la ligne numérique. En revanche, les deux autres variables contribuent à la réussite de manières importantes et proches.

Rappelons-nous le texte encadré projeté par Cassandra Potier-Watkins, corrigé ici en utilisant les notions correctes : «Le premier objectif de l’éducation mathématique est de renforcer les liens entre les nombres symboliques et le sens inné des ordres de grandeur.» Ce point de vue n’a plus de fondement scientifique. En revanche, comme la réussite à l’épreuve de comparaison joue un rôle crucial, le premier objectif de l’éducation mathématique doit être de permettre aux enfants d’entrer dans le nombre en leur apprenant à comparer les quantités et à accéder à leurs différences. Il faut, de plus, retenir l’objectif de développer l’intelligence non verbale des élèves mais ces deux objectifs ne se situent évidemment pas au même niveau dans une taxonomie des différents objectifs, le second étant beaucoup plus général et impliquant bien d’autres disciplines scolaires en plus des mathématiques.

Mieux vaut ne pas utiliser l’épreuve dite de la «ligne numérique»

L’interprétation donnée par Stanislas Dehaene de la réussite à l’épreuve dite de « la ligne numérique » est donc erronée ce qui, évidemment, laisse mal augurer des remédiations proposées aux élèves qui échoueraient (rappelons qu’elles sont élaborées par la DGESCO, conseillée par Cassandra Potier-Watkins). Il n’en reste pas moins que l’épreuve dite de la «ligne numérique» ainsi que celle de comparaison de nombres, lorsqu’elles sont proposées au CP, sont toutes deux prédictives du niveau des élèves au CE1. Cependant, la façon dont il convient d’interpréter cette conjonction de prédictions n’est pas nécessairement aussi simple qu’il y parait. Montrons-le en analysant une situation analogue dans un contexte volontairement très différent.

On ne prend guère de risque en affirmant que la marque de la layette d’un bébé et le niveau socio culturel de ses parents sont deux variables qui permettent de prédire le niveau d’études qu’il atteindra plus tard. Mais à l’évidence, ces deux «résultats» ne sont pas pareillement informatifs et ne doivent pas être considérés à l’identique.

D’emblée la marque de la layette est perçue comme un épiphénomène. L’explication est simple : la marque de la layette d’un bébé dépend du niveau socio culturel des parents et seul le caractère prédictif de ce niveau est réellement informatif, celui de la marque de la layette en étant seulement une conséquence.

On peut même aller plus loin : quiconque souhaite prédire le niveau d’étude que suivra plus tard un bébé, doit s’intéresser au niveau socioculturel de ses parents et non à la marque de sa layette parce que, tout en étant prédictive, cette dernière variable introduit du «bruit» dans l’étude (il suffit d’envisager le cas des parents de niveau socioculturel supérieur et qui n’accordent pas d’importance à la marque de la layette, par exemple).

Revenons à la recherche que Daker et Lyons viennent de publier : elle précise les liens qu’entretiennent la réussite à l’épreuve dite de la « ligne numérique » et celle à la comparaison de nombres : ils montrent que la première dépend fortement de la seconde. Ainsi, l’épreuve dite de la «ligne numérique» est à la comparaison des nombres ce que la marque de la layette est au niveau socioculturel des parents !
Lorsqu’on veut prédire au CP le niveau au CE1 des élèves en arithmétique, mieux vaut ne pas proposer l’épreuve dite de la «ligne numérique» parce qu’elle n’apporte aucune information de plus que celle de la comparaison de nombres et parce qu’elle introduit même un «bruit» important au vu de l’importance de l’intelligence non verbale pour la réussir. Dans la seconde partie de ce texte, nous verrons qu’en France, un autre «bruit» résulte du fait qu’au CP, les écoliers français n’ont, à juste raison, jamais étudié la «ligne numérique» comme système de représentation des nombres.

Rémi Brissiaud
Maitre de conférences honoraire en psychologie cognitive à l’ESPE de l’Université de Cergy-Pontoise, membre du conseil scientifique de l’AGEEM

Partie 2 sur l’articulation entre connaissances scientifiques et pédagogiques


À lire également sur notre site :
Les quatre opérations au CP, « le » manuel de Singapour et la réussite à l’école, par Rémi Brissiaud
L’enseignement du comptage en débat, par Rémi Brissiaud