Quelle est la plus-value d'une exploitation de dossiers médicaux informatisés par Natural Language Processing? - Etude comparative par rapport à une extraction de données structurées.

Quelle est la plus-value d'une exploitation de dossiers médicaux informatisés par Natural Language Processing? - Etude comparative par rapport à une extraction de données structurées.

Velotta, Sandra

Date de soutenance : 1-sep-2021/3-sep-2021 • URL permanente : `http://hdl.handle.net/2268.2/12731`

Détails

Titre :	Quelle est la plus-value d'une exploitation de dossiers médicaux informatisés par Natural Language Processing? - Etude comparative par rapport à une extraction de données structurées.
Titre traduit :	[fr] Quelle est la plus-value d'une exploitation de dossiers médicaux informatisés par Natural Language Processing? - Étude comparative par rapport à une extraction de données structurées
Auteur :	Velotta, Sandra
Date de soutenance :	1-sep-2021/3-sep-2021
Promoteur(s) :	JACQUES, Jessica GILLET, Pierre
Membre(s) du jury :	COUCKE, Philippe Geurts, Pierre Ittoo, Ashwin
Langue :	Français
Nombre de pages :	58
Mots-clés :	[fr] Dossier médical informatisé - [fr] Traitement du langage naturel - [fr] données médicales
Discipline(s) :	Sciences de la santé humaine > Santé publique, services médicaux & soins de santé
Public cible :	Chercheurs Professionnels du domaine Etudiants Grand public Autre
Institution(s) :	Université de Liège, Liège, Belgique
Diplôme :	Master en sciences de la santé publique, à finalité spécialisée en gestion des institutions de soins
Faculté :	Mémoires de la Faculté de Médecine

Résumé

[fr] Introduction : La gestion de données médicales au sein d’un hôpital est indispensable. En effet, l’exploitation des données de santé a pour intérêt d’aider les politiques de santé, la recherche scientifique ainsi que les gestionnaires des institutions de soins. Ces informations sont regroupées dans le dossier médical informatisé, où se côtoient des données structurées et non structurées, pouvant présenter des avantages comme des inconvénients. Les nouvelles technologies essaient d’exploiter ces données de manière idéale, offrant de nouvelles perspectives en combinant différentes applications. Une source utilisant le texte libre est difficilement exploitable. Dès lors, le NLP devient un atout. La comparaison de cette source avec une source utilisant des données structurées au travers d’une définition institutionnelle permettrait de déterminer la plus-value de cet outil manipulant le NLP.
Méthodologie : Cette étude compare deux méthodes ayant pour objectif d’identifier les patients diabétiques. La 1ère liste est composée de patients identifiés par l’exploitation de données structurées alors que la 2ème liste reprend les patients identifiés par l’outil de NLP. Pour ce faire, des données ont été extraites sur une période d’un an et des tables de contingence ont été créées afin de comparer la capacité des deux méthodes à identifier les patients atteints de diabète. Une revue de dossiers au sein du DMI a ensuite été réalisée afin de vérifier si les méthodes identifient correctement le statut diabétique du patient.
Résultats : L’outil de NLP identifie 34 218 patients que la méthode standardisée ne repère pas. Sur base d’une revue de dossiers de 100 patients, les patients identifiés uniquement par cette méthode présentent un taux de 94% de faux positifs. Pour la méthode standardisée, 5 691 patients ont été identifiés comme étant diabétiques uniquement par cette méthode. L’analyse démontre que 100% de vrais positifs sont identifiés par l’anamnèse infirmière, alors que le critère HBG >ou= 5,7% entraîne 75% de faux positifs.
Conclusion : Pour la méthode standardisée, les 3 critères de la définition institutionnelle sont fiables. L’information complémentaire « metformine » semble intéressante à intégrer. Par contre, l’HBG >ou= 5,7% est trop large. L’outil de NLP n’apporte pas de plus-value dans l’immédiat.

Fichier(s)

Document(s)

VELOTTA_SANDRA_MEMOIRE.pdf
Description: -
Taille: 5.79 MB
Format: Adobe PDF

Demander un tiré à part

Citer ce mémoire

Tous les documents disponibles sur MatheO sont protégés par le droit d'auteur et soumis aux règles habituelles de bon usage.
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.

Mémoire

Quelle est la plus-value d'une exploitation de dossiers médicaux informatisés par Natural Language Processing? - Etude comparative par rapport à une extraction de données structurées.

Velotta, Sandra

Promoteur(s) : JACQUES, Jessica ; GILLET, Pierre

Date de soutenance : 1-sep-2021/3-sep-2021 • URL permanente : http://hdl.handle.net/2268.2/12731

Détails

Résumé

Fichier(s)

Document(s)

Auteur

Promoteur(s)

Membre(s) du jury

Citer ce mémoire

Date de soutenance : 1-sep-2021/3-sep-2021 • URL permanente : `http://hdl.handle.net/2268.2/12731`