Quelle est la plus-value d'une exploitation de dossiers médicaux informatisés par Natural Language Processing? - Etude comparative par rapport à une extraction de données structurées.
Velotta, Sandra
Promoteur(s) : JACQUES, Jessica ; GILLET, Pierre
Date de soutenance : 1-sep-2021/3-sep-2021 • URL permanente : http://hdl.handle.net/2268.2/12731
Détails
Titre : | Quelle est la plus-value d'une exploitation de dossiers médicaux informatisés par Natural Language Processing? - Etude comparative par rapport à une extraction de données structurées. |
Titre traduit : | [fr] Quelle est la plus-value d'une exploitation de dossiers médicaux informatisés par Natural Language Processing? - Étude comparative par rapport à une extraction de données structurées |
Auteur : | Velotta, Sandra |
Date de soutenance : | 1-sep-2021/3-sep-2021 |
Promoteur(s) : | JACQUES, Jessica
GILLET, Pierre |
Membre(s) du jury : | COUCKE, Philippe
Geurts, Pierre Ittoo, Ashwin |
Langue : | Français |
Nombre de pages : | 58 |
Mots-clés : | [fr] Dossier médical informatisé - [fr] Traitement du langage naturel - [fr] données médicales |
Discipline(s) : | Sciences de la santé humaine > Santé publique, services médicaux & soins de santé |
Public cible : | Chercheurs Professionnels du domaine Etudiants Grand public Autre |
Institution(s) : | Université de Liège, Liège, Belgique |
Diplôme : | Master en sciences de la santé publique, à finalité spécialisée en gestion des institutions de soins |
Faculté : | Mémoires de la Faculté de Médecine |
Résumé
[fr] Introduction : La gestion de données médicales au sein d’un hôpital est indispensable. En effet, l’exploitation des données de santé a pour intérêt d’aider les politiques de santé, la recherche scientifique ainsi que les gestionnaires des institutions de soins. Ces informations sont regroupées dans le dossier médical informatisé, où se côtoient des données structurées et non structurées, pouvant présenter des avantages comme des inconvénients. Les nouvelles technologies essaient d’exploiter ces données de manière idéale, offrant de nouvelles perspectives en combinant différentes applications. Une source utilisant le texte libre est difficilement exploitable. Dès lors, le NLP devient un atout. La comparaison de cette source avec une source utilisant des données structurées au travers d’une définition institutionnelle permettrait de déterminer la plus-value de cet outil manipulant le NLP.
Méthodologie : Cette étude compare deux méthodes ayant pour objectif d’identifier les patients diabétiques. La 1ère liste est composée de patients identifiés par l’exploitation de données structurées alors que la 2ème liste reprend les patients identifiés par l’outil de NLP. Pour ce faire, des données ont été extraites sur une période d’un an et des tables de contingence ont été créées afin de comparer la capacité des deux méthodes à identifier les patients atteints de diabète. Une revue de dossiers au sein du DMI a ensuite été réalisée afin de vérifier si les méthodes identifient correctement le statut diabétique du patient.
Résultats : L’outil de NLP identifie 34 218 patients que la méthode standardisée ne repère pas. Sur base d’une revue de dossiers de 100 patients, les patients identifiés uniquement par cette méthode présentent un taux de 94% de faux positifs. Pour la méthode standardisée, 5 691 patients ont été identifiés comme étant diabétiques uniquement par cette méthode. L’analyse démontre que 100% de vrais positifs sont identifiés par l’anamnèse infirmière, alors que le critère HBG >ou= 5,7% entraîne 75% de faux positifs.
Conclusion : Pour la méthode standardisée, les 3 critères de la définition institutionnelle sont fiables. L’information complémentaire « metformine » semble intéressante à intégrer. Par contre, l’HBG >ou= 5,7% est trop large. L’outil de NLP n’apporte pas de plus-value dans l’immédiat.
Fichier(s)
Document(s)
Citer ce mémoire
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.