Ifé - Veille et analyses

Vous êtes ici : Accueil » Actualités des thèses » Détails de la thèse

Modélisation bayésienne de l'apprentissage de la lecture

Auteur(s) : STEINHILBER Alexandra

Date de soutenance : 2023

Thèse délivrée par : Université Grenoble Alpes

Section(s) CNU : section 16 : Psychologie, psychologie clinique, psychologie sociale

Sous la direction de : Julien DIARD & Sylviane VALDOIS

Jury de thèse : Marie-Line Bosse ; Pierre Bessière ; Franck Ramus ; Marie Lallier ; Fabienne Chetail

"Le cadre théorique majeur de l’étude de l’apprentissage de la lecture est la théorie d’auto-apprentissage. Selon cette théorie, l’apprentissage de la lecture repose sur l’apprentissage incident de formes orthographiques nouvelles, grâce à un décodage phonologique réussi. Le contexte pourrait jouer un rôle facilitateur lorsque le décodage phonologique est partiellement correct.A ce jour, seuls deux modèles computationnels d’auto-apprentissage existent. Ils se placent dans le cadre théorique de l’architecture double-voie, qui suppose des traitements différents pour la lecture de mots connus et de mots nouveaux. Le traitement des mots connus se fait par un accès direct au lexique, alors que le traitement des mots nouveaux se fait par segmentation graphémique, puis application de conversions graphèmes-phonèmes, indépendantes des connaissances lexicales. Ces modèles conditionnent l’apprentissage orthographique d’un nouveau mot à la connaissance préalable de sa forme phonologique.Cependant, des données comportementales remettent en cause les hypothèses faites par ces modèles. Plusieurs études discutent la pertinence du graphème en tant qu’unité psycholinguistique par excellence du décodage et suggèrent que la lecture, même de nouveaux mots, se fait par analogie aux connaissances lexicales. Par ailleurs, les études comportementales montrent que l’apprentissage orthographique incident sans connaissance phonologique préalable est possible.Cette thèse porte sur la modélisation de l'apprentissage de la lecture et s'inscrit dans le cadre de la théorie de l'auto-apprentissage. Nous évaluons l’hypothèse selon laquelle un traitement uniquement lexical, ne reposant sur aucune unité psycholinguistique prédéfinie, mais utilisant l’attention visuelle pour segmenter le stimulus, est en mesure de simuler un auto-apprentissage réussi. Nous faisons également l’hypothèse que l’apprentissage orthographique est possible même sans contexte et lorsque la forme phonologique n’est pas préalablement connue, alors même que ces deux dimensions sont facilitantes.Nous proposons un nouveau modèle computationnel probabiliste d’apprentissage de la lecture, nommé « BRAID-Acq ». Il dispose d’une architecture de type simple-voie, et d’un sous-modèle visuo-attentionnel permettant une prise d’information visuelle spatialement quelconque, sans forcément s’aligner sur une unité psycholinguistique présupposée. Le modèle dispose également d’un sous-modèle attentionnel phonologique, couplé à son pendant visuel, pour mettre en relation des segments orthographiques et phonologiques. Il simule la dynamique de l’exploration attentionnelle au cours du traitement.La validation du modèle s'est faite en deux étapes. Dans une version préliminaire de BRAID-Acq, purement visuelle, nous montrons que le modèle simule l’évolution des comportements oculomoteurs lors de l’exposition répétée à des mots nouveaux. Nous montrons que la quantité d’attention visuelle du modèle a un impact sur cette évolution, ainsi que sur les effets de longueur et de lexicalité. Ensuite, nous montrons que le modèle BRAID-Acq complet est capable de lire correctement la plupart des mots nouveaux sur la base d’un traitement sous-lexical flexible, qui n’implique ni segmentation graphémique, ni conversions graphèmes-phonèmes. Il simule avec succès une variété de situations d’auto-apprentissage (en contexte et hors contexte, avec et sans forme phonologique préalable), mais en adoptant un traitement unique. Nous montrons que le présence de contexte et la connaissance de la forme phonologique sont facilitantes mais pas indispensables pour apprendre. En particulier, le contexte du modèle permet de désambiguïser la lecture de nouveaux mots lorsqu’elle est difficile, par exemple lorsque le mot est irrégulier, lorsque la langue est opaque ou lorsque le niveau de connaissances orthographiques est faible. En conclusion, le modèle BRAID-Acq simule l’auto-apprentissage avec succès, ce qui appuie nos hypothèses."

Bayesian modeling of reading acquisition

"The major theoretical framework for the study of reading acquisition is the self-teaching theory. According to this theory, learning to read is based on incidental learning of novel orthographic forms through successful phonological decoding. Context could play a facilitating role when phonological decoding is partially correct.To date, only two computational models of self-teaching exist.

They are based on the dual-route architecture, which assumes different processing for reading known words and novel words. The processing of known words is performed by direct access to the lexicon, whereas the processing of novel words is performed by graphemic segmentation, then application of grapheme-phoneme conversions, independent of lexical knowledge. These models condition the orthographic learning of a novel word on prior knowledge of its phonological form.However, behavioral data question the assumptions made by these models. Several studies discuss the relevance of the grapheme as the primary psycholinguistic unit of decoding and suggest that reading, even of novel words, is performed by analogy to lexical knowledge. Furthermore, behavioral studies show that incidental orthographic learning without prior phonological knowledge is possible.This thesis focuses on modeling reading acquisition and is based on the theory of self-teaching. We evaluate the hypothesis that a lexical processing, not relying on any predefined psycholinguistic unit, but using visual attention to segmentate the stimulus, is able to simulate successful self-teaching. We also hypothesize that orthographic learning is possible even without context and when the phonological form is not previously known, even though these two dimensions are facilitating.We propose a new probabilistic computational model for reading acquisition, named "BRAID-Acq". It has a single-route architecture, and a visual-attentional submodel that allows for spatially arbitrary visual information taking, without necessarily aligning with a presupposed psycholinguistic unit. The model also has a phonological attentional submodel, coupled with its visual counterpart, to relate orthographic and phonological segments. It simulates the dynamics of attentional exploration during processing.The validation of our model was done in two steps. In a preliminary, purely visual version of BRAID-Acq, we show that the model simulates the evolution of oculomotor behaviors across repeated exposure to novel words. We show that the amount of visual attention in the model impacts this evolution, as well as length and lexicality effects. Next, we show that the full BRAID-Acq model is able to correctly read most novel words based on flexible sub-lexical processing, which does not involve graphemic segmentation or grapheme-phoneme conversions. It successfully simulates a variety of self-teaching situations (with and without context, with and without prior phonological form), but using a unique processing. We show that the presence of context and knowledge of phonological form are facilitative but not essential for learning. In particular, our model's context helps disambiguate the reading of novel words when it is difficult, such as when the word is irregular, when the language is opaque, or when the level of orthographic knowledge is low. In conclusion, the BRAID-Acq model successfully simulates self-teaching, which supports our hypotheses."

URL : https://theses.hal.science/tel-04198656v1/document

mot(s) clé(s) : apprentissage et développement cognitif, littératie, compétences et pratiques langagières