next up previous
Next: Les familles italo-américaines Up: Applications Previous: Applications

NetTalk

NetTalk est un réseau qui a appris à transformer un texte (en anglais) en une suite de phonèmes correspondant à sa lecture. Couplé en entrée à un scanner et à un OCR et en sortie à un synthétiseur de paroles, ce réseau est donc capable de lire un texte à haute voix.

Description de l'architecture du réseau :

 figure831
Figure 3.15: NetTalk

Le réseau comprend donc au total 309 neurones et comme les connexions sont complètes d'une couche à l'autre, 18320 connexions.

D'après les résultats publiés : 50000 mots appartenant à un corpus de 1000 mots ont été présentés au réseau. Le temps d'apprentissage a été : une nuit sur un VAX 780. Les performances : 95% pour l'ensemble d'apprentissage et 75% pour les nouveaux mots.

Citons à ce propos Jean-Pierre Nadal : <<Dans ses conférences, T. Sejnowski faisait entendre à l'auditoire un enregistrement sonore pris à divers moments au cours de la phase d'apprentissage. On pouvait alors entendre le réseau d'abords balbutier, puis on distinguait un découpage du texte en phrases, jusqu'à finalement une lecture raisonnable du texte. L'effet est évidemment spectaculaire, et il n'y a pas de doute, qu'à la suite de ces démonstrations, nombreux sont ceux qui se sont convertis au connexionnisme, si je puis dire ...On a ainsi vu, et ceci principalement aux Etats-Unis, se développer la vague, née en 1985, d'une activité impressionnante de ceux pour qui, <<ça y était>> : pour résoudre n'importe quel problème, il suffit de mettre dans une boîte noire quelques neurones artificiels, d'injecter une base de données et de laisser tourner la <<backprop>> pendant une nuit ; au matin, miracle, on retrouve une machine intelligente. Comme l'a dit Y. Le Cun, l'un des inventeurs de l'algorithme, l'usage de la RPG est à la fois wide et wilde (large et sauvage) ...

En fait, les performances de NetTalk étaient loin d'être exceptionnelles, si on les compare à ce qui se fait de mieux dans ce domaine de la lecture automatique. Il n'empêche que c'est une très jolie application, qu'on peut considérer comme le prototype de l'utilisation de la RPG pour un problème réel. Cette simulation démontre le pouvoir potentiel des réseaux de neurones : un temps de calcul raisonnable, une mise en tex2html_wrap3418 uvre facile, et des performances acceptables. Mais elle montre aussi les limitations de l'approche : les performances ne sont que acceptables. >>


next up previous
Next: Les familles italo-américaines Up: Applications Previous: Applications

Marc Tommasi
Wed May 14 15:14:59 MET DST 1997