Reconnaissance des concepts médicaux par text mining pour le codage des données médicales lors des études cliniques
Author | : Laure Chapuzet |
Publisher | : |
Total Pages | : 64 |
Release | : 2014 |
ISBN-10 | : OCLC:904430117 |
ISBN-13 | : |
Rating | : 4/5 (17 Downloads) |
Download or read book Reconnaissance des concepts médicaux par text mining pour le codage des données médicales lors des études cliniques written by Laure Chapuzet and published by . This book was released on 2014 with total page 64 pages. Available in PDF, EPUB and Kindle. Book excerpt: Les évènements indésirables inscrits dans le cahier d’observation de patients participant à une étude clinique sont des données textuelles inexploitables telles quelles. Le codage de ces données est actuellement principalement réalisé par des humains, en utilisant le dictionnaire MedDRA, afin de les rendre exploitables par des outils statistiques. Le codage est ainsi un processus long et couteux avec une variabilité inter-humain et intra-humain. Nous avons réalisé la comparaison entre deux méthodes de codage des évènements indésirables d’une base de données. Le premier codage est réalisé par des codeurs humains. Le second est réalisé par un logiciel de text mining possédant différents paramètres. Ces deux méthodes utilisent conjointement un dictionnaire de référence commun : le MedDRA. La comparaison montre que 78% des concepts médicaux de la base codée par des humains sont également présents dans la base codée par le logiciel de text mining. Le contrôle qualité du codage d’une seconde base de données a aussi été effectué. Cette base, codée par des humains, pouvait malheureusement contenir des erreurs de codage compte tenu de sa volumétrie (55 000 évènements indésirables). Des concepts médicaux ont été retrouvés par le logiciel de text mining dont certains sont absents de la base codée par des humains. L’utilisation d’un logiciel de text mining permet donc d’améliorer la qualité du codage et de détecter des erreurs humaines de codage. Ce travail permet de proposer un meilleur outil de codage des données médicales qui serait plus rapide, plus homogène et de meilleure qualité avec peu d’efforts humains.