Description :
Si on dispose aujourd'hui de plus en plus de ressources structurées telles que DBpedia, beaucoup d'informations sont encore exprimées sous forme textuelle, et c'est en particulier le cas des données journalistiques. Le journalisme de données s'est beaucoup développé avec l'utilisation massive de statistiques mais paradoxalement sans exploiter la matière que représente les événements relatés au travers d'articles.
Pour palier ce paradoxe, notre étude propose une approche pour construire une base de connaissances sur les événements en combinant à la fois les données structurées de Wikidata et textuelles des articles de presse. Elle permet ainsi de définir des schémas d'événements standards utilisables par exemple dans le cadre d'un apprentissage supervisé, ou lors de l'annotation automatique de nouveaux articles. Une application directe de ce projet est la création d'un moteur de recherche dédié pour les événements qui s'appuie sur les schémas précédemment définis.
Cette étude fait partie du projet ASRAEL, Acquisition de Schémas pour la Reconnaissance et l’Annotation d’Événements Liés, financé par l'ANR et en partenariat avec l'AFP, CEA LIST, LIMSI, EURECOM.