NetTalk est un réseau qui a appris à transformer un texte (en anglais) en une suite de phonèmes correspondant à sa lecture. Couplé en entrée à un scanner et à un OCR et en sortie à un synthétiseur de paroles, ce réseau est donc capable de lire un texte à haute voix.
Description de l'architecture du réseau :
Le réseau comprend donc au total 309 neurones et comme les connexions sont complètes d'une couche à l'autre, 18320 connexions.
D'après les résultats publiés : 50000 mots appartenant à un corpus de 1000 mots ont été présentés au réseau. Le temps d'apprentissage a été : une nuit sur un VAX 780. Les performances : 95% pour l'ensemble d'apprentissage et 75% pour les nouveaux mots.
Citons à ce propos Jean-Pierre Nadal : <<Dans ses conférences, T. Sejnowski faisait entendre à l'auditoire un enregistrement sonore pris à divers moments au cours de la phase d'apprentissage. On pouvait alors entendre le réseau d'abords balbutier, puis on distinguait un découpage du texte en phrases, jusqu'à finalement une lecture raisonnable du texte. L'effet est évidemment spectaculaire, et il n'y a pas de doute, qu'à la suite de ces démonstrations, nombreux sont ceux qui se sont convertis au connexionnisme, si je puis dire ...On a ainsi vu, et ceci principalement aux Etats-Unis, se développer la vague, née en 1985, d'une activité impressionnante de ceux pour qui, <<ça y était>> : pour résoudre n'importe quel problème, il suffit de mettre dans une boîte noire quelques neurones artificiels, d'injecter une base de données et de laisser tourner la <<backprop>> pendant une nuit ; au matin, miracle, on retrouve une machine intelligente. Comme l'a dit Y. Le Cun, l'un des inventeurs de l'algorithme, l'usage de la RPG est à la fois wide et wilde (large et sauvage) ...
En fait, les performances de NetTalk étaient loin d'être
exceptionnelles, si on les compare à ce qui se fait de mieux dans ce
domaine de la lecture automatique. Il n'empêche que c'est une très
jolie application, qu'on peut considérer comme le prototype de
l'utilisation de la RPG pour un problème réel. Cette simulation
démontre le pouvoir potentiel des réseaux de neurones : un temps de
calcul raisonnable, une mise en
uvre facile, et des performances
acceptables. Mais elle montre aussi les limitations de l'approche :
les performances ne sont que acceptables. >>