PARTAGES – Limics

2024-2027

Financement : Bpifrance

Page web : https://huggingface.co/spaces/HealthDataHub/PARTAGES

Corpus et modèles produits : https://huggingface.co/HealthDataHub

Le projet “PARTAGES”, porté par un consortium d’une trentaine de partenaires incluant des laboratoires de recherches (du CNRS, de l’INRIA, ou de diverses universités dont Sorbonne Université), des établissements de santé, et des entreprises deep tech est l’un des lauréats de l’appel à projets France 2030 sur l’IA générative. Coordonné par le Health Data Hub (HDH), ce projet a pour but de mettre l’intelligence artificielle générative au service des professionnels de santé pour leur faire gagner un temps médical précieux.

Alors que l’IA générative en santé donne déjà lieu à des déploiements majeurs, notamment aux États-Unis, ces outils sont encore peu mobilisés dans les établissements de santé français.
Ainsi, dans la lignée des grands modèles de langue (LLM) type ChatGPT, le traitement automatique des langues (TAL) présente de nombreux cas d’usages stratégiques en santé : la transcription automatique des échanges en consultation, le résumé automatique des dossiers médicaux, voire l’assistance dans la décision clinique ou les tâches médico-administratives. De façon générale, ces nouveaux outils peuvent améliorer la qualité de travail du personnel médical ainsi que la relation patient–soignant, avec des bénéfices massifs à la clé pour le système de santé publique.

Fort de ces constats, le HDH et ses partenaires ont formulé une réponse à cet enjeu, dans le cadre de l’appel à projets « Communs numériques pour l’intelligence artificielle générative » de France 2030. Opéré pour le compte de l’Etat par Bpifrance, ce dispositif vise à accélérer la création et la mise en accessibilité de communs numériques sur l’ensemble de la chaîne de valeur de l’IA générative afin d’en assurer l’utilisation, par le plus grand nombre, et d’en favoriser l’émergence de produits et services innovants. L’approche particulière des communs qui a été choisie dans le cadre de ce dispositif permet à des secteurs critiques tels que la santé de bénéficier et de contribuer à la constitution d’un socle de technologies souveraines et sûres.

Soignants, chercheurs, industriels, … PARTAGES réunit les compétences nécessaires au développement de l’IA générative en santé.

Afin d’être au plus près des besoins des différents acteurs de terrain et de leurs organisations, le projet mobilise 32 acteurs de l’écosystème français, regroupant des expertises en IA et un large panel d’établissements de santé, représentatifs de la diversité
du secteur. Parmi eux, des groupes hospitaliers publics tels que l’AP-HP et le GCS HOURAA, des centres de lutte contre le cancer comme le Centre Léon Bérard, l’Institut Curie, ainsi que les CHU de Toulouse, Bordeaux, Amiens-Picardie, Brest, Lille, Nancy, Rouen et la Réunion. Les groupes d’établissements ELSAN et Ramsay Santé ainsi que deux hôpitaux privés (Foch, Saint-Joseph & Marie Lannelongue) font également partie des acteurs impliqués dans ce projet.

Cela permettra aux experts académiques et industriels en IA, en particulier du TAL, de développer des outils répondant aux besoins des professionnels de santé, qui pourront s’assurer de leur pertinence et de leur représentativité. Ainsi, les laboratoires LIA (Avignon), LIG (Grenoble), LIS (Aix-Marseille), LS2N (Nantes), BPH (Bordeaux) mais aussi les équipes de l’AP-HP et de la startup Mistral AI contribueront à la conception d’un grand modèle de langue adapté spécifiquement au secteur de la santé. Ce grand modèle de langue servira de base à une large gamme d’outils particulièrement innovants, dont la performance sera assurée par des experts de la fiabilisation des données et l’évaluation de modèles IA dont les
laboratoires de recherche Limics, le LISN3 et le département de santé numérique du CHU de Rouen (DéSaN) ainsi que la startup reciTAL.
Ces outils à l’état de l’art seront conçus pour répondre à six cas d’usage stratégiques, dont le développement sera assuré par une collaboration entre les équipes du GreyC4, de l’AP-HP, du Limics, du Centre Léon Bérard, de l’UNESS5 et du centre de recherche BPH Inserm/université de Bordeaux :

un outil de pseudonymisation automatique des données textuelles de santé, afin que
l’ensemble de l’écosystème puisse bénéficier d’un outil standardisé pour cette étape préalable à toute utilisation secondaire des données de santé ;
deux outils visant à assister les praticiens de santé sur des tâches médico-administratives (codage DIM6 et résumé structuré de comptes-rendus) afin de libérer du temps médical ;
un cas d’usage permettant la génération de contenus pédagogiques pour tous les étudiants en médecine en France ;
deux outils facilitant l’analyse et la structuration automatique des informations médicales afin de soutenir la recherche clinique, en particulier en oncologie.

Les modèles seront mis en open source pour une utilisation la plus large possible. Ils constitueront ainsi des briques de base afin que l’écosystème pourra s’approprier pour développer une large gamme de cas d’usage d’IA générative en santé.

Contact: Xavier Tannier