Description :
Je suis professeur à l'UPMC et affilié au LIMICS depuis le mois de septembre. J'étais auparavant maître de conférences à l'Université Paris-Sud, chercheur au LIMSI-CNRS dans le domaine du traitement automatique des langues et de l'extraction d'information.
Je présenterai tout d'abord quelques travaux antérieurs liés à l'extraction d'information et à la fouille de textes dans des grandes masses de documents issues de différents domaines : corpus d'articles journalistiques, chartes médiévales, comptes-rendus médicaux. J'insisterai également sur la dimension temporelle et sur la notion d'événements qui a été un fil rouge important de mes recherches au LIMSI.
Je ferai ensuite le lien avec les activités que je compte mener en collaboration avec les collègues du LIMICS, de l'ISCD et de l'AP-HP : d'une part, l'enrichissement des données structurées des comptes-rendus médicaux grâce à des informations extraites des textes ; d'autre part, l'utilisation des informations structurées pour la classification de documents ou la fouille de données, dans le cadre d'études collaboratives.