Peut-on augmenter le taux d’acquisition lexicale par la lecture

Peut-on augmenter le rythme d’acquisition lexicale par la lecture ? Une expérience de lecture en français appuyée sur une série de ressources en ligne.

Tom Cobb

Université du Québec à Montréal

Chris Greaves

Polytechnic University of Hong Kong

Marlise Horst

Concordia University

Citer comme chapitre de P. Raymond & C. Cornaire (2001), Regards sur la didactique des langues secondes (pp. 133-153). Montréal: Éditions logique. [WWW Pré-publication.]

Introduction

Le domaine de la lecture en langue seconde (L2) a toujours semblé confirmer l’importance des ordinateurs dans l’apprentissage des langues, surtout depuis que l’Internet a établi sa capacité à multiplier la quantité et la diversité des textes et des contextes accessibles aux apprenants et aux enseignants. Cependant, l’utilité des ordinateurs dans l’acquisition d’habilités de lecture reste en grande partie un argument de principe plutôt qu'un argument de fait.

Avant l’Internet, des logiciels informatiques conçus pour favoriser l’acquisition de compétences en lecture suivaient surtout un modèle de développement d’habiletés qui faisait notamment appel au repérage des références pronominales, à l’extraction d’idées principales d’un paragraphe, à la déduction du sens d’un mot d’après le contexte, etc., soit le genre d’habiletés qui pouvait être encodé dans des questions à choix multiples à la suite d’un texte assez court. Mais très peu de résultats portent à croire que ces habiletés pouvaient être transférées avec certitude à la lecture d’un long texte, comme le confirment des exercices semblables exécutés sur papier. Il existe même des preuves du contraire (Oppenheimer, 1997). La création de didacticiels de ce genre prenait rarement en compte la recherche effectuée sur la lecture, que ce soit pour la L1 (langue maternelle) ou pour la L2, ce qui n’est pas surprenant étant donné la nature très souvent non concluante de cette recherche. Cependant, les comptes rendus de recherche font ressortir de façon relativement claire que l’acquisition de compétences en lecture dépend de la quantité de lecture faite par l’apprenant, que cela soit sur papier ou à l’écran. Cette quantité de lecture n’était pas vraiment réalisable avec l’approche des habiletés isolées où il y avait «trop peu à lire» (Reinking & Bridwell-Bowles, 1991).

Mais les choses ont changé, au moins d’une certaine manière, avec l’arrivée de l’Internet. «Trop peu à lire» n’est plus le problème d’autrefois. Aujourd’hui, une activité de lecture courante et accessible aux apprenants sur Internet consiste à rechercher une information particulière en passant par plusieurs sites de la Toile, par exemple, «à quel âge Napoléon a-t-il dû s’exiler à l'île d'Elbe ?» Nous pouvons présumer que cette recherche nécessitera la lecture de plusieurs sources avant d’aboutir à des résultats. Cependant, il n’est pas certain que le genre de lecture nécessaire pour de telles activités, à moins d’être rigoureusement dirigées, donne lieu à autre chose qu’un dépouillement sommaire au mieux, ou à la recherche d'une chaîne de caractères au pire. Il y a peut-être une réduction de tâche inévitable pour les activités de lecture sur la Toile; l’Internet regorge de textes authentiques qui sont en majorité trop difficiles pour la plupart des apprenants de langue seconde laissés à leurs propres moyens. Autrement dit, «trop peu à lire» a cédé la place à «trop à lire», en plus, comme on pouvait s’y attendre, d’une réduction correspondante dans la qualité de l’interaction entre texte et apprenant.

Dans le présent chapitre, nous espérons fournir une variante à ces deux approches de lecture assistée par ordinateur. Le modèle que nous proposons vise la lecture de longs documents authentiques en utilisant un certain nombre de ressources, ou R-READ (Resource-assisted reading of extensive authentic documents). Ainsi, les apprenants pourront lire des textes assez longs et authentiques, tout en profitant d'une série d’aides didactiques prédéterminées avec soin et qui deviennent de plus en plus accessibles sur Internet ou par son entremise. L’objectif de R-READ est de permettre aux apprenants d’emmagasiner les connaissances nécessaires pour franchir le seuil de la lecture indépendante en L2. Ce compte rendu de R-READ repose sur des résultats de recherche et prend en compte la mise sur pied et la mise à l’essai d’une application pratique préliminaire. En guise de préambule, nous aimerions toutefois relater une expérience personnelle vécue par l'un des auteurs.

1 Un consultant linguistique

Il y a presque vingt ans, Tom, anglophone et unilingue, s'est retrouvé au Manitoba obligé de passer un examen de traduction du français vers l’anglais pour obtenir son diplôme de maîtrise. Le français qui lui restait après ses études secondaires était plutôt pauvre, et il se demandait bien comment il allait pouvoir acquérir à temps la compétence en lecture dans l’autre langue officielle qu’il lui fallait pour réussir. Une amie bilingue de l’époque était d’avis que toute personne était capable de franchir le premier et le plus important obstacle d’une seconde langue si elle arrivait à lire un livre entier dans cette langue, tout livre bien écrit étant un microcosme de la langue dans son ensemble. Il suffirait de chercher chaque mot, de décomposer et d'analyser la syntaxe, etc. Ou alors de se jumeler avec un partenaire spécialiste en lecture pour décoder, expliquer, prononcer, confirmer ou rejeter les hypothèses. La personne ressource et le candidat se sont donc plongés dans la lecture de Candide de Voltaire, s’interrompant pour discuter et prendre des notes, beaucoup au début, mais sensiblement moins après seulement quelques heures. Après une première lecture, tous les mots lui étaient familiers. Au bout de cinq jours et de trois lectures, Tom était prêt pour l’examen de traduction. Plus tard, en séjour à Paris, il a trouvé que son apprentissage de la lecture lui permettait de déchiffrer une grande partie de la signalisation et de la publicité qui l’entourait. Apparemment, il avait franchi le seuil de l’apprentissage indépendant.

Enfin, il n’est pas donné à tout le monde de connaître une personne capable d’aider et prête à le faire au moment où on décide d’apprivoiser une seconde langue. Cependant, il y avait peut-être un autre moyen. Ne serait-il pas possible de recréer cette personne ressource dans un logiciel tutoriel ? L’idée n’est restée qu’un rêve jusqu’à récemment. Mais maintenant que l’Internet a une distribution, une qualité de ressources, et un registre suffisant, y compris les lectures audio en transit, un logiciel de ce genre est concevable. Dans le présent chapitre, nous allons décrire un tel outil spécialisé en lecture accessible sur Internet, résumer la base théorique de cette approche dans la recherche effectuée sur la lecture, puis présenter une étude de cas sur l’utilisation du programme par un apprenant.

2 Un consultant linguistique électronique: de Maupassant sur R-READ

L’expérience de lecture que nous voulions présenter aux apprenants du français est une version plus poussée, mais parallèle à celle qui avait déjà été conçue pour les étudiants en apprentissage de l’anglais. Pour le site anglais, le roman Call of the Wild de Jack London a été choisi pour les raisons suivantes : il s’agit d’un roman riche en vocabulaire, qui plaît autant aux jeunes qu’aux adultes; c’est un texte de longeur moyenne ; il est tombé dans le domaine public ; il est accessible sur Internet comme fichier texte à télécharger, et plusieurs bonnes interprétations audio sont offertes sur cassette. L’utilisation du site est assez simple. Le lecteur peut lire ou écouter, dans l’ordre qu’il préfère, ou les deux en même temps, le texte de Call of the Wild. Pendant la lecture, il peut arrêter l’enregistrement audio et cliquer sur n’importe quel mot dans le texte qu’il voudrait chercher (utilisant un interface «full-hypertext» developpé par Chris Greaves). Le fait de cliquer sur un mot génère un concordancier qui montre toutes les autres occurrences du mot qui se trouvent dans le roman. à partir de la fenêtre du concordancier, le lecteur peut cliquer sur un mot pour faire apparaître la définition du dictionnaire qui est fourni par le site Wordnet de l’université de Princeton. Si le lecteur souhaite noter certains renseignements, il peut les dactylographier ou les copier et les coller dans une base de données personnelle de façon à pouvoir les récupérer, les imprimer ou les sauvegarder sur son disque dur. On peut visiter le site à l’adresse https://lextutor.ca/ra_read/bouledesuif/. Une autre version de cette application peut être visitée à l’adresse http://vlc.polyu.edu.hk. Ce dernier site utilise des adaptations du roman Alice in Wonderland, et les définitions sont fournies par un dictionnaire anglais-chinois adapté de Wordnet par Greaves.

Le site parallèle en français repose sur le roman Boule de Suif de Maupassant, et les interactions envisagées sont identiques à celles du site anglais. La préparation du site n’a posé aucun problème particulier puisque les difficultés techniques avaient déjà été résolues au cours de la construction du site anglais. Cependant, le site français a présenté un défi pour d’autres raisons. Premièrement, il n’existe pas beaucoup de romans français en format de fichier texte et donc prêts à être téléchargés sur l’Internet. Il en existe encore moins qui sontenregistrés en audio, que ce soit en ligne ou non (aucun texte d’auteur canadien-français n’a été trouvé). Deuxièmement, le choix de dictionnaires français en ligne est limité, et ceux qui existent semblent mal se prêter à l’apprentissage. Aussi sont-ils difficiles d'accès par une ligne de commande d’un site extérieur. Le choix de Boule de Suif était plutôt un compromis puisque le texte, quoique d'une bonne longueur (13 418 mots) et très riche en vocabulaire, n’est pas particulièrement moderne ni adapté aux jeunes (l’ouvrage traite de exploitation sexuelle et d’hypocrisie des classes moyennes). Par contre, le fait de choisir une oeuvre de de Maupassant a permis d’éviter un problème majeur que nous avons connu avec Call of the Wild. Dans ce dernier, les lecteurs cliquent souvent sur des mots qu’ils ne comprennent pas pour avoir des contextes supplémentaires et découvrent, en fin de compte, que le mot ne paraît qu’une seule fois dans le texte entier. Dans ce cas, aucun autre contexte ne se présente à l’écran. En effet, Horst (2000) a noté dans ses recherches que pour des textes de longueur intermédiaire (de 5 000 à 15 000 mots), entre 5 et 10 pour cent du lexique n'apparaît qu’une seule et unique fois. Kucera (1982) a établi que c’était précisément les mots les moins utilisés dans un texte qui étaient souvent les plus chargés de sens. Pour le site français, une solution à ce problème consistait à générer des concordances de l’oeuvre entière de Maupassant, ce qui représente plus d’un million de mots qui nous ont fortuitement été rendus accessibles par Thierry Selva, un collègue belge. Le moteur du concordancier fonctionne plus lentement pour un texte de cette longueur, mais jusqu’à aujourd’hui aucun cas d’occurrence unique dans tout le corpus ne s’est présenté. La figure 1 montre des fenêtres du site Boule de Suif qui indiquent les interactions principales proposées.

Figure 1 : Interactions principales au site R-READ pour Boule de Suif.

Le texte doit être sélectionné à partir du menu latéral noir à gauche et peut être accompagné d’une récitation dramatique du texte comme option (le texte et le son peuvent être sélectionnés seuls ou ensemble; ainsi on peut, par exemple, entendre le texte avant de le lire). Dans le texte, le lecteur peut cliquer sur un mot intéressant (tel que lambeaux dans la figure) pour faire apparaître dans la fenêtre du bas une concordance tirée, comme nous l’avons mentionné auparavant, du corpus entier des textes de Maupassant. En même temps que la concordance, un lien à un dictionnaire bilingue pour débutants (Coffey, 2000) apparaît dans le coin supérieur droit. Ce lien peut mener au mot précis visé, ou à une liste de mots qui présentent une certaine affinité alphabétique. Ces interactions produisent des fenêtres d’écran reproduites à la figure 1.

Trois des éléments d’interaction proposés sur le site peuvent passer inaperçus au premier abord. Premièrement, un problème typique des dictionnaires en ligne fait surface lorsque le mot sur lequel on a cliqué est au pluriel ou s’affiche sous une forme variante. Dans ces cas, le moteur de recherche ne trouve pas le mot et indique un message à cet effet. Dans un dictionnaire format papier, une recherche du mot discussions mènera directement le lecteur là où se trouve le mot discussion, et le problème des variantes ne se pose pas. Une solution coûteuse pour remédier à ce problème en ligne serait de programmer le moteur de recherche afin qu’il regroupe par lemmatisation toutes les morphologies possibles de chaque famille de mots. Une solution peu coûteuse, et celle qu’a adoptée Coffey le créateur du dictionnaire de ce site, est de présenter non pas la réponse «aucun résultat», mais tous les mots proches du mot recherché, dont normalement les membres de la même famille (discussion, discutable, discuter). On présume que l’apprenant en reconnaîtra un comme étant la forme de base du mot qu’il recherche. Cette deuxième solution est en fait une simulation de ce qui se produit quand on cherche un mot dans un dictionnaire, où on peut voir le reste de la page. Dans la figure 1, l’apprenant a cliqué sur le mot lambeaux, ce qui a donné comme résultat une liste comprenant le mot lambeau. En cliquant à nouveau sur lambeau, l’apprenant voit apparaître l’information recherchée. Le deuxième élément peu évident se trouve au niveau des mots clés au centre des lignes de concordances. Ces mots clés sont en fait des liens hypertextes dynamiquement créés, qui, lorsqu’on clique dessus, élargissent le contexte jusqu’à l’équivalent d’à peu près un petit paragraphe. Et comme troisième élément, le site est relié à des renseignements historiques sur la Guerre franco-allemande de 1870 qui donnent le contexte des évènements de l’histoire.

Lorsqu’un apprenant trouve un mot et des renseignements pertinents qu’il souhaite garder, il peut les sauvegarder dans une base de données en cliquant sur «Lexique utilisateur» dans le coin supérieur gauche. Cette base de données est le cyberéquivalent des petits cahiers si précieux pour les apprenants de langue qui y inscrivent leurs nouvelles acquisitions, à la différence qu’elle est plus ordonnée, contient des renseignements plus longs et plus riches, et prend beaucoup moins de temps puisqu’elle peut être remplie à partir du texte, des concordances ou du dictionnaire en faisant de simples manipulations «copier-coller». La base de données peut être visionnée en sélectionnant les entrées de tous les apprenants ou celles de l’utilisateur effectif uniquement. Elle peut être téléchargée afin de l’intégrer à un lexique ou à un glossaire personnel qui peut, à son tour, être assemblé, édité et trié par le programme Excel installé sur la machine de l’apprenant. La figure 2 montre un exemple de la base de données. Dans cet exemple, «Tom» a demandé ses propres entrées seulement. En cliquant sur «Tout voir», il peut voir les entrées de tous les utilisateurs du site.

Figure 2 : Cahier de vocabulaire électronique

Voilà donc un site sur la Toile qui permet aux étudiants qui veulent lire un long texte en français de le faire. Ils peuvent également écouter un enregistrement du texte, voir toutes les occurrences des mots intéressants et des syntagmes déjà composés par le même auteur, rechercher les mots dans un dictionnaire adapté aux apprenants, et sauvegarder des trouvailles dignes de mérite. Mais une question se pose tout de même : toutes ces options intéressantes, sont-elles conçues dans un but d’amuser ou d’appuyer vraiment de manière concrète l’apprentissage d’une langue ?

3 Base de recherche

On a souvent l’impression que la création d’outils informatiques pour l’apprentissage des langues est dominée ou par les producteurs commerciaux de logiciels, ou par des amateurs d’ALAO (apprentissage des langues assisté par ordinateur). Ces deux groupes doivent se maintenir à l'avant-garde de l’évolution technologique et peuvent, par conséquent, manifestent un intérêt limité pour l'étude des complexités supplémentaires de la recherche en acquisition linguistique. Au cours des années, cependant, les chercheurs en ALAO et en acquisition linguistique ont eu l’occasion de se réunir. Généralement, il s’agissait d’universitaires spécialisés en acquisition linguistique qui avaient entrepris des études ayant une portée médiatique ou qui exprimaient leur opinion sur la portée médiatique de résultats obtenus. Ces convergences seront résumées sommairement par catégories correspondant aux interactions principales proposées sur le site Boule de Suif. Le champ principal de recherche vise l’acquisition lexicale et son traitement, ce qui est incontestablement l’obstacle majeur du lecteur débutant.

3.1 écouter et lire

Stanovich est un des principaux chercheurs spécialistes en difficultés de lecture en langue maternelle. Dans son article bien connu sur Matthew Effects (1986), il formule des remarques sur le genre de programme ALAO qu’il estime valable pour les apprenants ayant des difficultés à apprendre à lire. Il cite un logiciel plutôt daté (Draper et Moeller, 1971, n'est sans doute plus disponible) qui avait produit des effets très positifs au cours de l’apprentissage, et cela tout simplement parce qu’il donnait aux apprenants la possibilité d’entendre prononcer à haute voix les mots d’un texte par un simple clic. L’idée de base était qu’en situation de L1 beaucoup de mots sont méconnaissables en langue écrite, mais sont bien reconnus en langue parlée. Le contraire se produit le plus souvent en situation de L2 où les nouveaux mots, autres que les mots à occurrence très fréquente, se retrouvent plus souvent dans un texte écrit qu’en langue parlée. Ceci dit, la recherche en L2 maintient un rôle important pour l’écoute simultanée à la lecture. Lightbown (1992) a étudié l’acquisition de l’anglais chez des jeunes francophones du Nouveau-Brunswick qui n’avaient pas reçu d’enseignement en classe, mais qui avaient lu et écouté des cassettes de leur choix et à leur propre rythme. Résultats surprenants : les apprenants (du moins dans les premières étapes d’acquisition de L2) semblent profiter autant de la lecture et de l’écoute que de l’enseignement en classe. Chose ironique, ces résultats coïncident avec le remplacement des installations audio par des laboratoires informatiques dans la majorité des écoles. Fort heureusement, les nouvelles technologies de l’Internet, telles que la lecture audio en transit, peuvent transformer tout laboratoire informatique en laboratoire d’écoute, en plus d’offrir des avantages comme des dictionnaires en ligne.

3.2 Concordance comme outil cognitive

L’utilisation pédagogique de textes authentiques présente des contraintes majeures du fait que les apprenants sont apparemment bien moins capables de déduire le sens d’un mot d’après le contexte (Laufer & Sim, 1985; Haynes, 1983; Huckin, Haynes et Coady, 1991) qu’on croyait autrefois (exemples de Smith, 1971 ; Goodman, 1973 ; Krashen, 1989, et leurs nombreux disciples). Mais la recherche de Cobb (1997, 1999) souligne que la déduction contextuelle peut être renforcée de façon considérable en multipliant, à l’aide de l’ordinateur, le nombre de contextes accessibles pour un mot donné. Ce genre de programme informatique s’appelle un concordancier ou un logiciel de concordance. à partir d’un texte ou d’un corpus, le concordancier réunit tous les contextes existants pour un mot ou un syntagme donné. L’appui à l’apprentissage qu’offre le concordancier est le suivant : lorsqu'il existe plusieurs contextes, bon nombre d’entre eux ne seront pas clairs, mais il est probable qu'un ou deux de ces contextes possèderont l’apport linguistique et sémantique nécessaire pour fournir à l’apprenant les conditions d’apprentissage nécessaires pour obtenir une représentation initiale et stable du nouveau mot. Si les apprenants sont incités à examiner plusieurs contextes, ils pourront déduire d’autant mieux le sens que s’ils n’en examinaient qu’un seul. Autrement dit, nous proposons les concordances comme moyen de faire des déductions contextuelles grâce à l’utilisation de l'ordinateur. De plus, les concordances présentent aux apprenants des occurrences plus nombreuses et nécessaires pour apprendre les mots (Zahar, Cobb et Spada, à par.) Ces occurrences sont moins fréquentes lorsqu’on les rencontre normalement, c’est-à-dire sans moyens artificiels pour les renforcer.

3.3 Base de données utilisateur

Par ailleurs, Cobb (1997) a constaté que le temps énorme consacré par les apprenants à consigner les entrées lexicales lors de la lecture peut être utilisé de façon plus judicieuse grâce à l’ordinateur. Le temps mis à chercher et à consigner des renseignements peut être consacré à des lectures, ce qui permet à l’apprenant de voir plus de nouveaux mots ainsi que des anciens mots plus souvent. De plus, il s’est avéré que cette informatisation pouvait faciliter l’utilisation collective des recherches lexicales. Puisque les entrées peuvent être lues par les autres, les apprenants trient mieux les concordances pour trouver des bons exemples de mots.

3.4 Dictionnaire

Alors qu’une bonne partie de notre recherche met en doute la pertinence des dictionnaires pour les lecteurs débutants en L2, il est inutile d’essayer d’en empêcher l'usage. On peut seulement essayer d’encourager l’utilisation de dictionnaires convenables que les apprenants peuvent comprendre. Il ne faut pas pour autant inciter les apprenants à croire que l’établissement des correspondances entre L1 et L2 est toujours biunivoque (le «naïve lexical hypothesis» de Bland, Noblitt, et al, 1990). Nous essayons également de faire en sorte que le travail de concordance précède le travail de recherche dans les dictionnaires, selon le principe constructiviste que l’on apprend davantage à agrandir le cercle de ses connaissances généralisées qu'à les recevoir déjà toutes assimilées (Cobb, 1999). Cette séquence est soutenue dans une étude récente de Fraser (1999), qui constate qu’une combinaison des activités de déduction contextuelle et de recherche dans un dictionnaire apportait plus d’acquisition lexicale que l’une ou l’autre activité seule, mais aussi que la séquence de ces stratégies avait de l’importance. Selon Fraser, une tentative de déduction suivie d’une confirmation dans le dictionnaire est la meilleure séquence. à ses résultats, nous ajoutons une déduction contextuelle assistée par ordinateur, et ensuite le dictionnaire.

3.5 Interface cliquable

Une étude importante sur la lecture à base de ressources ou de didacticiel a été publiée récemment par Hulstijn, Hollander, et Greidanus (1996). L’étude fait ressortir qu’un bon nombre d’apprenants qui s’appuient sur un système de recherche lexicale assistée pendant leur lecture ne prennent pas forcément le temps de l’utiliser, possiblement par paresse, mais s’en servent davantage si la manipulation de recherche est suffisamment facile. Les ressources à cliquer sur le site Boule de Suif ne peuvent pas être plus faciles à utiliser, grâce à une technique Javascript développée par Greaves, où chaque mot du texte constitue, en effet, un hyperlien. Cependant, la possibilité existe également d’entrer des données dactylographiées pour des recherches plus poussées ou pour vérifier des hypothèses sur le français qui ne correspondent pas au texte à l’écran.

3.6 Approche

L’approche fondée sur les ressources illustrée par le site Boule de Suif est une des trois principales approches qui visent à traiter les exigences lexicales de la lecture en L2. Une approche décrite par Krashen (1989), Nagy (1997) et leurs disciples maintient que la lecture elle-même suffit pour que les apprenants acquièrent tous les mots nécessaires pour pouvoir lire. Cette approche n’est pas sans failles, comme on l'a déjà mentionné. L’approche à l’autre extrême est le pré-enseignement direct du vocabulaire, que les apprenants devront connaître pour réussir à lire certains textes. Par exemple, les apprenants pourraient apprendre la liste entière des mots identifiés par Nation et ses collaborateurs (Nation, 1990 ; Nation et Waring, 1997 ; Sutarsyah, Nation et Kennedy, 1994) puisqu’elle correspond à la vaste majorité du lexique des textes moyens, ou des textes d'un domaine particulier. Une approche intermédiaire, mais qui n’exclut pas vraiment les autres, est la lecture renforcée par des ressources de vocabulaire (Hulstijn, Holander et Greidanus, 1996), où les apprenants avancent seuls, mais où il est présumé qu’il leur faudra des ressources d’appui pour réussir. R-READ a pour objet d’évaluer de façon préliminaire la pertinence de cette approche intermédiaire.

4 Test pilote de R-READ

4.1 Contexte et méthode expérimentale

Afin d’évaluer l’utilité des concordances jumelées avec un accès aux définitions des dictionnaires ainsi qu’à une mémoire de données facile à entretenir, nous avons demandé à un apprenant de français d’utiliser le matériel expérimental. La question de recherche de cette étude pilote est la suivante :

Comment les résultats d’un apprentissage de vocabulaire par la lecture assistée par des ressources en ligne (décrites ci-dessus) se comparent-ils avec les résultats d’un apprentissage de lecture non appuyée par ces outils ?

Les données de base pour une comparaison avec la lecture non assistée, dite «normale», proviennent de plusieurs études de cas effectuées par Horst (2000). Pour une de ces études, elle a recherché la quantité de nouveau vocabulaire que pouvaient acquérir les apprenants par la lecture de textes ressemblant à Boule de Suif dans le sens qu’ils sont tous des textes classiques et littéraires du dix-neuvième siècle. R., un apprenant d’allemand, adulte et de niveau intermédiaire, a accepté de lire un petit roman allemand sans consulter un dictionnaire. Quelques jours plus tard, il a évalué sa connaissance de 300 mots apparus une seule fois dans le texte. Lorsqu’il a évalué à nouveau sa connaissance de ces mots cibles plusieurs jours plus tard, la différence était modeste. Après avoir lu le texte littéraire de 9500 mots (ce qui lui a pris environ trois heures), R. a estimé «connaître certainement» seulement cinq mots de plus que ce qu’il connaissait au moment du prétest. Nous concluons donc qu’il a appris environ deux mots à l’heure à la lecture non assistée.

Notre test des outils informatiques suit la conception utilisée par Horst (2000) dans l’étude précitée et dans une série d’expériences semblables. Cette fois-ci, il s’agit de J., une apprenante de français adulte d’un niveau intermédiaire comparable. Six semaines avant que J. lise Boule de Suif avec l’assistance en ligne, elle a été prétestée sur 400 mots qui n’apparaissent qu’une seule fois dans le texte. Elle devait attribuer une évaluation de sa connaissance de ces mots selon le schéma suivant (Horst & Meara, 1999) :

0 = Je ne connais pas ce mot

1 = Je ne suis pas certaine de connaître ce mot

2 = Je pense connaître ce mot

3 = Je suis certaine de connaître ce mot

J a attribué 0 (ne connais pas) à 180 mots. L’occasion était donc parfaite pour qu’elle apprenne de nouveaux mots en utilisant le matériel expérimental.

Après une session de formation assez brève, J. a commencé à lire Boule de Suif en suivant les directives prescrites, c’est-à-dire de cliquer sur les mots inconnus et de regarder les contextes fournis par le concordancier. Dans la plupart des cas, elle a cherché également à voir les définitions du dictionnaire. Son progrès était légèrement plus lent que la lecture normale ou non assistée ; il lui a fallu environ six heures pour lire le texte entier de 14 500 mots, contre trois heures de R. pour 9 500 mots (donc un taux de lecture de 3 166 mots à l'heure pour R., et de 2 416 mots a l'heure pour J.)

4.2 Résultats

Trois jours après avoir lu Boule de Suif, J. a évalué sa connaissance des 400 cibles. Le nombre de mots évalués à 3 (conaissance certaine) se situait à 137, soit une augmentation de 59 mots depuis son total du prétest de 78 mots certainement connus. Puisque J. a passé environ six heures à utiliser le programme, nous pouvons en déduire qu’elle a appris environ dix nouveaux mots à l’heure, ce qui constitue un nombre considérablement plus élevé que les deux mots à l’heure du lecteur non assisté.

Une semaine plus tard, J. a lu Boule de Suif une deuxième fois, cette fois-ci en utilisant l’option audio (la cadence du narratif audio étant trop rapide la première fois). Une fois de plus, elle a évalué sa connaissance des mots cibles plusieurs jours après avoir lu l’oeuvre. Puis, sept jours plus tard, un tour supplémentaire de lecture, d’écoute et de tests. J. a passé environ 4 heures à utiliser le matériel lors de ces dernières sessions; ainsi le nombre total d’heures passées se chiffrait à 14 (6 + 4 + 4, moyen 4.6). Le nombre de mots attribués à chaque catégorie de connaissance suite à chaque lecture est illustré ci-dessous dans le tableau 1.

Tableau 1 : Évaluation de la connaissance des mots avant et après chacune des trois lectures

	Prétest	Posttest 1	Posttest 2	Posttest 3
0 (connais pas)	180	74	49	28
1 ou 2 (pas certain)	142	189	165	170
3 (certain)	78	137	186	202

Le tableau 1 démontre que à la fin de l’expérience, J. était «certaine de connaître» 202 mots, soit 124 mots de plus de son point de départ qui était 78. Le tableau confirme une croissance ailleurs également : les chiffres montrent que le nombre de mots évalués à 0 (ne connais pas) s’est réduit de façon considérable au cours de l’expérience, et qu’un bon nombre de mots inconnus sont devenus plus familiers.

Le lecteur non assisté d’allemand, R., a aussi lu son texte de façon répétée, ce qui permet une comparaison appropriée avec les résultats des trois sessions de J. utilisant le matériel expérimental. Les résultats des deux apprenants suite à trois tours de lecture sont illustrés dans le tableau 2. Leurs points de départ des prétests son très semblables : les deux participants ont évalué 45% des mots cibles inconnus au début (27% des mots cibles pour J. et 20% pour R.) àprès trois sessions de lecture, l’avantage du processus assisté est clair : le nombre de mots évalués à 3 (certains) est resté le même dans le cas de R. mais a augmenté de façon dramatique dans le cas de J. Bien que R. ait finalement appris des douzaines de nouveaux mots à force de les voir dans des contextes, son progrès initial était lent. Même après les avoir vus 10 fois, ses réponses étaient moins précises que celles de J. à la fin des lectures répétées (quatre fois pour J. et dix pour R.), on a demandé aux deux participants de fournir des équivalents traduits des mots qu’ils ont évalués comme connus de façon certaine. Environ 94% des réponses de J. étaient jugées bonnes, alors que R. n’a pu identifier correctement des équivalents traduits que dans 77% des cas. Les données comparées sont illustrées dans le tableau 2.

Tableau 2 : Pourcentage des cibles dans chaque catégorie au départ et après trois lectures, assistée et non assistée.

	R (lecture non assistée) n=300 mots		J (lecture assistée) n=400 mots
	Prétest	3e Posttest	Prétest	3e Posttest
0 (connais pas)	45	38	45	7
1 ou 2 (pas certain)	28	33	36	43
3 (certain)	27	29	20	51

Conclusion

La comparaison du rythme d’acquisition entre R. et J. semble confirmer l’utilité de l’approche R-READ et indiquer une voie intermédiaire pour l'accroissement du vocabulaire par la lecture. La lecture à base de ressources semble capable de rendre non pertinent le choix entre l’acquisition incidente ou l’instruction de vocabulaire directe. La cadence et la précision de l’acquisition de J. rappelle les meilleurs résultats de l’enseignement direct (Nation, 1982), mais offre en plus un apprentissage amusant et peut-être plus profond de par la rencontre des mots dans des contextes riches.

Chacun des deux lecteurs a commencé sa lecture avec 45 mots uniques inconnus dans son texte respectif.à partir d’un contexte, R. n’a réussi à réduire le nombre de mots inconnus que de 7%, alors que J. a réduit son nombre de mots inconnus de 38%. En ce qui concerne les mots «connus de façon certaine», R. n’a pas réussi à augmenter ces acquis dans cette catégorie, tandis que J. a augmenté les siens de 250%. De plus, lors du posttest, J. avait un plus grand nombre de réponses correctes après seulement trois lectures (94 %) que celles de R. après 10 lectures (77 %).

Tout cela n’est pas surprenant en soi, sauf que le temps investi pour atteindre un niveau d’apprentissage nettement supérieur est à peine plus long, et ce grâce à l'efficacité des outils en ligne.

L’acquisition de vocabulaire par la lecture a toujours présenté un problème majeur dans le développement de l’alphabétisation dans une seconde langue. Les contextes sont riches mais parfois trompeurs, les définitions sont précises mais souvent incompréhensibles, et le nombre de mots à acquérir est déconcertant. La lecture à base de ressources paraît être une approche prometteuse pour rendre possible et même efficace l’acquisition de vocabulaire par la lecture. De plus, étant donné la croissance attendue de l’utilisation de la Toile au cours des années à venir, cette approche pourra remplacer le «consultant linguistique» efficace pour ceux qui n’ont pas la chance d’en connaître un.

Références

Bland, S., Noblitt, J, Armstrong, S, & Gray, G. (1990). The naive lexical hypothesis: Evidence from computer assisted learning. Modern Language Journal 74, 440-450.

Cobb, T. (1997). Is there any measurable learning from hands-on concordancing? System 25, 301-315.

Cobb, T. (1999). Applying constructivism: A test for the learner-as-scientist. Educational Technology Research and Development, 47 (3), 15-31.

Coffey, N. (En ligne). On-line French-English and English-French dictionary. [Publication électronique]. http://www.french-linguistics.co.uk/dictionary/ .

Draper, A.G. & Moeller, G.H. (1971). We think with words (therefore, to improve thinking, teach vocabulary). Phi Delta Kappan 52, 482-484.

Fraser, C. (1999). Lexical processing strategy use and vocabulary learning through reading. Studies in Second Language Acquisition, 21 (2), 225-241.

Goodman, K.S. (1973). Psycholinguistic universals in the reading process. Dans F. Smith (Ed.), Psycholinguistics and reading (pp. 21-29). New York: Holt, Rinehart & Winston.

Haynes, M. (1983). Patterns and perils of guessing in second language reading. Dans J Handscombe, RA. Orem, & B.P. Taylor (dir.), On TESOL '83 : The question of control (pp. 163-176). Washington DC: TESOL.

Horst, M. (2000). Text encounters of the frequent kind: Learning L2 vocabulary from reading. Dissertation PhD, University of Wales (UK), Swansea.

Horst, M., & Meara, P. (1999). Test of a model for predicting second language lexical growth through reading. Canadian Modern Language Review, 56 (2), 308-328.

Huckin, T., Haynes, M., & Coady, J. (1991). Second language reading and vocabulary learning. Norwood, NJ: Ablex.

Hulstijn, J. H., Hollander, M., & Greidanus, T. (1996.), Incidental vocabulary learning by advanced foreign language students: The influence of marginal glosses, dictionary use, and reoccurrence of unknown words. Modern Language Journal, 80, 327-339.

Krashen, S. (1989). We acquire vocabulary and spelling by reading: Additional evidence for the input hypothesis. Modern Language Journal 73, 440-464.

Kucera, H. (1982). The mathematics of language. Dans The American Heritage Dictionary, Second College Edition. Boston: Houghton Mifflin.

Laufer, B. & Sim, D. (1985). Taking the easy way out: Non-use and misuse of clues in EFL reading. English Teaching Forum, avril, 7-10.

Lightbown, P.M. (1992) Can they do it themselves: A comprehension-based ESL course for young children. Dans R. Courchêne, J. St-John, C. Thérien, & J. Glidden (dir.), Comprehension-based language teaching: Current trends. Ottawa: University of Ottawa Press.

Nagy, W. (1997). On the role of context in first- and second-language vocabulary learning. Dans Schmitt, N. & McCarthy, M. (dir.) Vocabulary : Description, acquisition, pedagogy (pp. 64-83). Cambridge: Cambridge University Press.

Nation, P. (1982). Beginning to learn foreign vocabulary: A review of the research. RELC Journal, 13 (1), pp. 14-36.

Nation, P. (1990). Teaching & learning vocabulary. Rowley Mass.: Newbury House.

Nation, P., & Waring, R. (1997). Vocabulary size, text coverage, and word lists. Dans Schmitt, N. & McCarthy, M. (dir.) Vocabulary : Description, acquisition, pedagogy (pp. 6-19). Cambridge: Cambridge University Press.

Oppenheimer, T. (1997). The computer delusion. Atlantic Monthly, juillet. [Publication électronique]. http://www.theatlantic.com/issues/97jul/computer.htm

Reinking, D., & Bridwell-Bowles, L. (1991). Computers in reading and writing. Dans R.Barr, M.L. Kamil, P. Rosenthal, & P.D. Pearson (dir.), Handbook of reading research, Vol. II (pp. 310-340). New York: Longman.

Selva, T. (En ligne). Personal Home Page. [Publication électronique]. http://www.kuleuven.ac.be/grelep/membres/tselva/selva.html .

Smith, F. (1971). Understanding reading : A psycholinguistic analysis of reading and learning to read. New York: Holt, Rinehart, & Winston.

Stanovich, K. (1986). Matthew effects in reading: Some consequences of individual differences in the acquisition of literacy. Reading Research Quarterly, 21 (4), 360-406.

Sutarsyah, C., Nation, P. & Kennedy, G. (1994). How useful is EAP vocabulary for ESP? A corpus based study. RELC Journal, 25 (2), 34-50.

Zahar, R, Cobb, T., & Spada, N. (à par.) Conditions of second language vocabulary acquisition. Canadian Modern Language Review, 2001.