La synthèse vocale : quelques pistes pédagogiques

Les technologies existent mais sont méconnues...

Les applications induites sont nombreuses mais peu valorisées...

Il s’agit ici de quelques notes rapides et modestes

pour impulser une réflexion et des expériences.

Notions à différencier :

-        synthèse vocale : ensemble des techniques permettant de faire parler les ordinateurs ; TTS : Text-To-Speech. On part d’un texte écrit pour le faire lire automatiquement par un logiciel.

-        commande vocale : il s’agit de piloter l’ordinateur, les logiciels à la voix. Un module Microsoft gratuit existe, speech recognition engine, mais seulement en anglais : http://activex.microsoft.com/activex/controls/agent2/actcnc.exe.

-        dictée vocale : il s’agit de remplacer le clavier dans la saisie de textes ; l’utilisateur utilise un microphone pour écrire, i.e. dicter, un texte via un logiciel comme Viavoice d’IBM etc. La saisie se fait soit dans un module spécifique, soit dans un traitement de texte classique. Commande et dictée vocales impliquent la reconnaissance de la parole.

Généralement, la synthèse vocale est encore cantonnée dans des secteurs particuliers : soit elle reste réservée à des utilisateurs ciblés comme les aveugles ou handicapés…, soit elle est un gadget ludique permettant la lecture des courriers électroniques.

Cependant, on peut noter des tentatives d’intégration dans des produits sociaux pour adultes comme la suite bureautique Easy Office d’e-press Corp, v.3, qui existe seulement en anglais pour l’instant.                                                                                                                                                 

Il y a aussi quelques essais pédagogiques : les modules d’écriture et lecture de Lectramini, réalisé par  M. Brun, comme Lectra également, l’utilisent : cela évite à l’enseignant d’enregistrer les textes, les phrases et les mots des documents de travail (gain d’énergie), cela permet, d’autre part, à l’enfant de se faire lire ses essais d’écriture (ouverture).

Quelques difficultés techniques / linguistiques à surmonter

Des difficultés existent : connues des techniciens, elles peuvent poser à de jeunes élèves des difficultés et amener des erreurs ; on fera un parallèle fructueux avec les limites des correcteurs d’orthographe et de grammaire. On peut observer cependant que les technologies évoluent et que des progrès se réalisent avec les versions des logiciels. Parmi les problèmes que doivent résoudre les informaticiens et dont ils se sortent plus ou moins bien suivant les produits, relevons quelques éléments.

-        Il s’agit de distinguer pour les prononcer différemment les homographes (« Les poules du couvent couvent. ») ; un minimum d’analyse linguistique s’impose pour différencier pertinemment.

-        La lecture des abréviations : p., N.B., H.T., M. ou Me, etc.

-        de même, celle des nombres complexes et des dates (13/09/98)…

-        la difficulté des liaisons, très importantes dans le cas du français ;

-        l’intonation : il faut tenir compte du sens dans un texte pour en faire une bonne LHV, de la ponctuation et des groupes de souffle, du type de phrase. Le logiciel peut-il différencier les phrases interrogative, exclamative et déclarative ?  Pour un point d'interrogation élève-t-il la voix en fin de phrase ?

-        la lecture de mots rares ou inconnus, n’appartenant pas au dictionnaire des mots usuels et dont l'écriture n'est pas que phonographique ;

-        l’oralisation des noms propres (faire prononcer par exemple les prénoms Vincent, Emile, Jordan etc. et comparer) et des mots ne répondant pas à la phonographie du français (de nombreux élèves ont des prénoms d’origine étrangère)..

Paradoxalement, les limites que rencontrent les logiciels, les erreurs de lecture qu’ils produisent peuvent être intéressantes à relever et analyser avec des élèves, pour mieux cerner les problèmes de l’orthographe, les questions de compréhension, les mécanismes de la lecture... On pourrait ainsi imaginer de faire produire aux élèves des énoncés qui piègent les logiciels et faire anticiper les accrocs.

Quelles applications possibles dans un cadre pédagogique ?

En langue maternelle :

ü   Travail sur la correspondance grapho-phonologique en cycle 2, sur la compréhension du système

  1. le hat mage la sori                    => problèmes identifiés à l’audition de la production
  2. le cha manje lasouri                  => phonographie et sortie correctes

On pourrait songer à utiliser la synthèse vocale, dans Word, en combinaison avec le correcteur d'orthographe, en fin de CP/ CE1 — certaines erreurs soulignées dans le traitement de texte ne relèvent pas de la phonographie, mais bien des normes de l’orthographe, de règles. Important pour le stade orthographique.

ü   Travail de discrimination phonologique

Confusion de sons (voyelles nasales, sourde/sonore…) => le logiciel permet la répétition à volonté, l’élève entend une voix autre ; cela peut apparaître comme une aide.

 

ü Apprentissage de la segmentation : limites des mots

Déjà le traitement de texte est une aide, lors de l'écriture. Mais si je peux obtenir une lecture oralisée de ce que j'écris, je peux entendre, dans certains cas, un mauvais découpage, pas toujours cependant : Lenfant se faitlire sontexte.

 

ü  Apprentissage de la ponctuation : la synthèse vocale rend (quelque peu) perceptible toute phrase non / mal ponctuée.

ü Aide à la perception de la grammaticalité d'un énoncé / phrase.

Pour des phrases boiteuses, en raison de la ponctuation et/ou de la grammaire (phrase sans principale etc.), l’écoute peut permettre de percevoir l’erreur.

ü Aide à la lecture en cycle 2, depuis la GS : oralisation d'un mot inconnu

En situation de lecture découverte, l’enfant sélectionne un mot, un groupe, un passage hors zone. Piste intéressante et à suivre du traitement de texte comme outil de lecture.

ü Aide à la lecture longue, en cycle 2 et 3 : médiation pour la compréhension ; économie d'énergie et mémoire…

L’intérêt existe surtout pour des lecteurs lents, médiocres, des déchiffreurs surtout sur des textes littéraires longs, symboliques… (cf. Pennac, L'œil du loup, in Entrelignes, CM2) On peut concevoir un intérêt dans des ateliers de lecture comme béquille; lors de parcours de lecture sur romans etc.

ü Aide à la réécriture : distanciation par la lecture du texte du premier jet.

Mon texte devient un texte à lire, lu par une (autre) voix. J'entends peut-être ce que je ne lirais pas… Ici, il s’agit de remettre en cause l'idée naïve qu’on se "relit" sur un premier jet ; bien voir que le plus souvent, on se lit ! Et encore faut-il percevoir qu’on lit davantage ce que l’on a dans la tête que ce que l‘on a vraiment rédigé, comme l'attestent les lapsus et omissions qu'on ne perçoit pas.

Si on utilise un traitement de texte pour écrire, dès le 1er jet, alors s’établit une certaine dynamique de lecture / écriture.

ü Application « mathématique » : en CP surtout, pour l’oralisation de nombres / écriture littérale, apprentissage de la correspondance des écritures

45 < = > quarante-cinq (cf. les erreurs d'écriture par inversion comme 54 etc.); permet la validation.

En langue étrangère :

ü Avec un bon TTS, on dispose en accès direct, immédiat d’un dictionnaire de prononciation pour des langues comme l’anglais, l’allemand ou l’espagnol. Bien noter l’intérêt pour des langues comme l’anglais où l’écart entre l’écrit et l’oral est important. L’élève sélectionne un mot inconnu dans l’éditeur et le Tdt devient encore un bon outil de lecture. Cf. aussi le recours complémentaire possible aux synonymes pour un mot qu’on ne comprend pas, via un thesaurus.

ü Oralisation d'un texte ; aspect mélodique, intonation… Mais inégalité des qualités des synthèses suivant les langues, les logiciels.

ü Travail sur l'écoute, réception orale de textes électroniques, de courriels de correspondants etc.

 

Bibliographie :

Cohen, Rachel et Mialaret, Gaston

Quand l'ordinateur parle : utilisation de la synthèse vocale dans l'apprentissage et le perfectionnement de la langue écrite, 1992, Presses universitaires de France, 243 p., collection : L'Educateur                                         

isbn : 2-13-044233-1

Notes : La synthèse vocale est un outil qui amène à repenser la situation éducative et l'action pédagogique. Il faut aussi comprendre les stratégies nouvelles d'apprentissage qui se font jour, les processus de découverte et de l'acquisition de l'écrit …