CISMeF

Extracteur de Concepts Multi-Terminologique (ECMT v3)

Sommaire



1 - Introduction

Cet indexeur multi-terminologique permet d'annoter automatiquement un texte à l'aide des concepts des principales terminologies de santé disponibles en Français.
Pour tout usage, merci de contacter par courriel le Pr. Stéfan Darmoni de l'équipe CISMeF.



2 - Appel au web service

Le web service ECMT est appelable en REST ou SOAP.

REST :
wadl : /CISMeFecmtservice/REST?_wadl
La version REST est plus adaptée aux technologies Web. Elle est utilisable directement avec un navigateur (attention la taille du texte est limitée dans ce cas).
Elle est de ce fait plus simple à utiliser et plus souple que la version SOAP.

SOAP :
wsdl : /CISMeFecmtservice/SOAP?wsdl
Là où REST nécessite de l'http, SOAP sépare langage, plate-forme, et transport. Son usage est démocratisé, il est bien standardisé et offre une gestion intégrée d'erreur.

NB. : en REST comme en SOAP, le premier appel étant plus lent, penser afin d'optimiser les performances à réutiliser un même client pour n appels successifs.
Bien que cela ne soit pas nécessaire à la compilaton, la désérialisation des objets du web service en java nécessite la librairie "woodstox-core-asl-4.2.0.jar".

Méthodes reconnues :



3 - Options

La méthode "getAutomaticIndexingWithOptions(options, text)" vous permet de préciser quelles informations vous sont utiles. L'utilisation de ces options présente les avantages suivants :

L'argument "options" est en fait une chaine de caractère rassemblant des couples attribut=valeur (séparées par un "&"),
par exemple : "at=true&a=false&d=false&r=true=&c=true&sn=true&e=&f=CIS_MT_8,UML_ST_T060".

Liste des options disponibles :
(1) : les options "e" et "f" acceptent également des identifiants de listes directement définies dans un fichier de configuration. Si le fichier de configuration contient par exemple une entrée : alors "e=SET1" signifiera exclure "CIS_MT_57[Droit de la santé],CIS_MT_55[Économie],MSH_D_000825[Structures anatomiques de l'animal],UML_ST_T065[activité éducative], ...."

(2) : concernant les options "e" et "f", la priorité des opérateurs est la suivante :



4 - Interface de démonstration

Si utilisé en REST via un navigateur, le service ECMT a recours à une simple xslt visant à donner un rapide aperçu de l'annotation retournée. Bien que la plus-value de l'outil réside dans le source XML, cette interface vise à mettre en avant l'usage que l'on peut faire des informations dispensées par le service : libellés principaux et nature des concepts identifiés, code interne CISMeF (1), labels reconnus, positions dans le texte, relations hiérarchiques ou terminologiques, catégorisations, temps de réponses, etc.

Dans la copie d'écran ci-dessous, on peut voir à gauche le texte annoté. Chaque élément en vert est un concept reconnu; des informations détaillées sont affichées lorsque l'on passe le curseur sur celui-ci (popup grise). A droite sont listés pour chaque concepts reconnu : son libellé préféré, l'acronyme de la terminologie, son code origine (1), son CUI UMLS, si l'information est conditionnelle (2), les informations de contexte qui peuvent être utiles (2).

(1) : L'outil terminologique possède des codes internes qui sont basés sur le code d'origne des terminologies, les deux sont renvoyés par le service.
(2) : La condition, ainsi que le contexte n'en sont pour le moment qu'au stade prototypal.
ECMT



5 - Réponse du service

La réponse du service correspond à la sérialisation en XML des objets java de sortie (ces derniers sont d'ailleurs récupérables par désérialisation).

Voici la signification des balises et attributs retournés :



6 - Terminologies utilisées

MeSH
Medical Subject Headings
Éditeur: NLM (National Library of Medicine)
Le MeSH est un thésaurus biomédical publié et mis à jour par la National Library of Medicine (US), et utilisé notamment pour l'indexation des références bibliographiques de MEDLINE/PubMed. De langue anglaise, il est traduit dans de nombreuses autres langues, notamment en français par l'INSERM.

ATC
Anatomical Therapeutic Chemical classification
Éditeur: WHO
La classification ATC est utilisée pour classer les médicaments. C'est le Collaborating Centre for Drug Statistics Methodology de l'Organisation mondiale de la santé (OMS) qui la contrôle. Les médicaments sont divisés en différents groupes selon l'organe ou le système sur lequel ils agissent et/ou leurs caractéristiques thérapeutiques et chimiques. Le code ATC a la forme générale LCCLLCC où (L représente une lettre et C un chiffre). Dans ce système, les médicaments sont classés en groupes à cinq niveaux différents :
Le premier niveau : groupe anatomique (un caractère alphabétique)
Le deuxième niveau : groupe thérapeutique principal (deux caractères numériques)
Le troisième niveau : sous-groupe thérapeutique/pharmacologique (un caractère alphabétique)
Le quatrième niveau : sous-groupe chimique/thérapeutique/pharmacologique (un caractère alphabétique)
Le cinquième niveau : sous-groupe pour la substance chimique : le principe actif individuel ou l'association de principes actifs (deux caractères numériques)

CCAM
Classification Commune des Actes Médicaux
Éditeur: ATIH
La CCAM est une une nomenclature française destinée à coder les gestes pratiqués par les médecins, gestes techniques dans un premier temps puis, par la suite, les actes intellectuels cliniques. Cette classification sert à établir : En médecine libérale et en milieu hospitalier, les honoraires des actes techniques réalisés lors des consultations Dans les cliniques privées, les honoraires pour les interventions réalisées Dans les hôpitaux publics et privés, le PMSI et sa tarification des séjours hospitaliers transmis à l'assurance maladie dans le cadre de la T2A Le choix des actes de cette nomenclature revient à la Commission d'Évaluation des Actes Professionnels (CEAP) de la Haute Autorité de Santé.

CIM-10
Classification Internationale des Maladies - 10ème révision
Éditeur: WHO
La CIM-10 permet le codage des maladies, des traumatismes et de l'ensemble des motifs de recours aux services de santé. Les affections (symptômes, maladies, lésions traumatiques, empoisonnements) et les autres motifs de recours aux services de santé sont répertoriés dans la CIM avec une précision qui dépend de leur importance, c'est-à-dire de leur fréquence et de l'intensité du probléme de santé public qu'ils posent (par exemple, le chapitre des maladies infectieuses est le plus gros et le plus détaillé parce que ces maladies sont la première cause mondiale de morbidité et de mortalité).

MedlinePlus
Éditeur: NLM
MedlinePlus est un site tout public (professionnels, patients, usagers) de la National Library of Medicine (US) proposant de l'information de qualité et concernant la santé

Racines des Médicaments
Racines des spécialités pharmaceutiques françaises.

SNOMED int.
Systematized Nomenclature of MEDicine
Éditeur: ASIP Santé
La SNOMED internationale est une nomenclature pluri-axiale couvrant tous les champs de la médecine et de la dentisterie humaines, ainsi que la médecine animale. Il s'agit d'un systême de classification permettant de normaliser l'ensemble des termes médicaux utilisés par les praticiens de santé. La SNOMED a pour fonction d'attribuer un code à chaque concept permettant un grand nombre de combinaisons entre eux. Elle comprend également une liste des diagnostics interfacée avec la CIM-10. La SNOMED permet ainsi de stocker des informations médicales individuelles dans des entrepôts de données afin d'établir des outils d'analyse décisionnelle, de faciliter des décisions thérapeutiques, de contribuer aux études épidémiologiques et à l'enseignement. L'utilisation de SNOMED garantit l'universalité du vocabulaire médical.