Les systèmes Question/Réponse sont des programmes capables de répondre à des questions factuelles en langage naturel en cherchant la réponse dans un corpus de textes ou sur des sites Internet. Ils sont classiquement constitués d'un ensemble de modules réalisant respectivement une analyse de la question, une recherche de portions de documents pertinents et une extraction de la réponse à l'aide de motifs d'extraction, ou patterns en anglais. Mes travaux se focalisent sur ce dernier module. Nous partons du postulat que l'extraction de la réponse dans un ensemble de documents pertinents (susceptibles de contenir cette réponse) est assimilable à une tâche d'extraction d'information. Il s'agit en effet de l'extraction d'une information précise dans un contexte défini par la question. Une fois le contexte et le type d'information compris en analysant la question, il doit être possible d'utiliser des outils d'extraction d'information pour la recherche de la réponse.
Ces motifs d'extraction étant la plupart du temps écrits à la main par des experts, l'objet du stage a donc été d'utiliser des systèmes d'extraction d'information mettant en oeuvre de l'apprentissage automatique pour obtenir de tels motifs.
Mes travaux ont donc consisté en :
Mes travaux permettent non seulement de faire le lien entre les deux domaines de recherche que sont l'extraction d'information et les systèmes Question/Réponse, mais aussi de mieux cerner les caractéristiques des systèmes d'extraction d'information et des motifs d'extraction appris nécessaires au bon déroulement de l'extraction de la réponse.