De nouvelles données et de nouvelles méthodes pour évaluer les soins primaires de la population cancéreuse en Ehpad

Article (PDF Available)inRevue d Épidémiologie et de Santé Publique 64:S143-S144 · May 2016with 35 Reads
DOI: 10.1016/j.respe.2016.03.073
Abstract
De nouvelles données et de nouvelles méthodes pour évaluer les soins primaires de la population cancéreuse en EHPAD T Delespierre*1, 2 (doctorante), P Denormandie1, 4 (directeur général adjoint), D Armaingaud4 (directeur éthique médical et qualité), L Josseran2, 3 (praticien hospitalier et chercheur) 1 : Institut du Bien Vieillir Korian, 21-25 rue Balzac 75008 Paris 2 : UVSQ, 78000 Versailles 3 : Hôpital Raymond-Poincaré, 92380 Garches 4 : Korian SA, 21-25 rue Balzac 75008 Paris *Auteur correspondant tiba.delespierre@ groupe-korian.com (Delespierre) Introduction Le groupe privé Korian, spécialisé dans l’hébergement et l’accompagnement des personnes âgées et dépendantes, gère près de 600 établissements dans 4 pays européens : France, Allemagne, Belgique et Italie. Un data warehouse (DWH) mis en place en 2010 héberge aujourd’hui l’ensemble des données résidents dont l’essentiel de la prise en charge saisie au fil de l’eau. L’objectif est de montrer que l’on peut retracer des parcours de soins dans leur intégralité. Méthodes La table transmissions contient l’essentiel de l’information alimentée séquentiellement. Grâce aux index résident et établissement et aux dates de transmission, il devient possible, a posteriori, par requêtes SQL (Standard Query Language) de suivre un résident au cours du temps lorsque les données ont été saisies par le personnel médical. Un algorithme s’appuyant sur ces requêtes a permis de bâtir 21 syndromes décrivant l’essentiel des pathologies et problèmes touchant les résidents. Son principe s’appuie sur le deep learning : un apprentissage supervisé en plusieurs couches intelligentes de traitement textuel destiné à identifier des syndromes prédéterminés. Une première couche exclut les mots vides de sens et simplifie les expressions, une seconde aiguille vers l’un des 21 syndromes, enfin la troisième intègre expertise médicale et textmining pour raffiner la définition des syndromes dont le cancer. Un processus itératif d’apprentissage des couches 2 et 3 a permis d’améliorer la définition des syndromes et la logique du système. Toutes les transmissions ‘cancer’ sur la période d’étude [01/10/2010 - 01/04/2016] ont ensuite été extraites puis croisées avec l’ensemble des transmissions syndromiques concernant ces résidents. Les délais [date d’entrée - date de première transmission ‘cancer’] et les durées de séjour ont été calculés et distribués en tertiles a priori représentatifs de la gravité des symptômes et de leur état de santé. Enfin, il a été tenté de rapprocher ces transmissions avec les antécédents et pathologies des résidents. Résultats Au 17 janvier 2016, 39 561 résidents étaient présents dans 127 EHPAD. L’analyse en deep learning a permis d’identifier 4 400 résidents qui avaient au moins une information cancer transmise pendant la période d’étude. Le découpage de la population en trois tertiles de durée de séjour, a conduit aux effectifs suivants 1468, 1465 et 1467 résidents. Les durées moyennes de séjour, sont respectivement de 52, 434 et 1822 jours. A noter que pour 48,3% des résidents du premier tertile durée de séjour, il n’y avait ni mention d’une pathologie, ni mention d’un antécédent cancer dans la table des antécédents et pathologies. Pour illustrer la grande hétérogénéité des profils des résidents avec cancer et des informations saisies, nous avons choisi de présenter les parcours de 2 résidentes, sous forme de 2 nuages de mots. Discussion - Conclusion Cette technique d’extraction permet de retracer les parcours de santé et de vie et d’obtenir une image fine des problématiques de soins des résidents lorsque ces informations sont alimentées. Une comparaison des effectifs des syndromes (table 1), triés par ordre décroissant et par tertiles de durées de séjour, montre que leur fréquence augmente avec la durée de séjour. Néanmoins, douleurs, dépression et idées noires sont prégnantes pour tous les résidents avec cancer. Les problèmes de comportement et l’altération de l’état général vont croissants avec la durée du séjour et le vieillissement concomitant de cette population. Tenter de définir une typologie des résidents en reliant les informations syndromiques avec les autres tables du DWH s’avère difficile car le remplissage des tables est souvent lacunaire. Cependant, au vu de la richesse des informations extraites, et à la condition de contrôler quantité et qualité des données (volume, contenu et périodicité) une typologie définie exclusivement à partir des transmissions semble possible et judicieuse. Mots clés SQL EHPAD data warehouse deep learning text mining Déclaration d’intérêt Korian SA finance le contrat doctoral de T. Delespierre
De nouvelles données et de nouvelles méthodes pour évaluer les
soins primaires de la population cancéreuse en EHPAD
Tiba Delespierre*, ** , Philippe Denormandie** , Didier Armaingaud***, Loïc Josseran*,**
*HandiResp EA4047, UFR des Sciences de la vie Simone Veil Université de Versailles St Quentin, Montigny-le Bretonneux, France
** Institut du bien vieillir Korian, Paris, France
*** Korian, Paris, France
Contexte Objectif
Le groupe privé Korian, spécialisé dans l’hébergement et l’accompagnement des personnes âgées et dépendantes, gère près de
600 établissements dans 4 pays européens : France, Allemagne, Belgique et Italie. Le dossier résident informatisé a été mis en
place en 2010. Lensemble des données résidents sont aujourd’hui hébergées dans un data warehouse.
Lobjectif est de montrer que l’on peut retracer le parcours de soins des résidents dans leur intégralité.
Méthode
La table Transmissions contient l’essentiel de l’information saisie au fil de l’eau par le personnel médical et paramédical. Grâce
aux index résident et établissement et aux dates de transmission, il devient possible, par simples requêtes SQL (Standard Query
Language) de suivre un résident au cours du temps.
Un algorithme s’appuyant sur ces requêtes et le deep learning a permis de bâtir 21 syndromes (figure 1). Les 3 tables générées en
sortie, de gauche à droite, permettent pour la première, de construire les effectifs (table 1), pour la seconde, de bâtir des filtres
(table 2) enfin, pour la troisième, de conserver les observations afférentes aux syndromes détectés (table 3).
Toutes les transmissions cancer de l’ensemble des établissements sur la période [01/10/2010 - 01/04/2016] ont été extraites
(filtre sur la table 2) puis croisées avec l’ensemble des transmissions syndromiques concernant ces résidents (filtre sur la table
3). Cette technique permet de retracer leur parcours de santé (table 3) et d’obtenir une image fine des problématiques de soins.
La longueur du séjour (tableau 1) a été découpée en tertiles.
figure 1: génération des syndromes
figure 2: 2 wordclouds illustrant la prise
en charge de 2 résidentes.
table 1
tableau 1: effectifs syndromiques des résidents avec au moins une transmission cancer découpés en tertiles durée de séjour
table 3
table 2
Résultats
Au 1er avril 2016, sur une cohorte d’environ 40 000 résidents présents dans 127 EHPAD, 4 400 résidents avaient au moins une
information ‘cancer transmise pendant la période. Un découpage en tertiles longueur de séjour et les effectifs syndromiques
(table 1) donne une image macro des résidents (tableau 1).
Pour illustrer la grande hétérogénéité des profils, nous avons choisi de présenter les parcours de 2 résidentes des premier et
dernier tertiles délai date d’entrée - date de première transmission cancer sous forme de 2 wordclouds (figure 2) permettant
de visualiser d’un seul coup d’œil, après anonymisation, tous les mots décrivant la prise en charge. Le premier, tronqué à gauche,
avec 165 transmissions, décrit une personne entrée avec des problèmes de comportement, dépression et idées noires qui
décèdera suite à une mauvaise chute et une altération de son état général et non pas à un cancer. Le second, tronqué à droite,
avec 226 transmissions, décrit une personne arrivée suite à une hospitalisation, avec un cancer déclaré à l’entrée qui souffre de
douleurs récurrentes et intenses traitées par morphine, toujours vivante au 01/04/2016.
Discussion - Conclusion
Une comparaison des effectifs des syndromes (tableau 1) montre que leur fréquence augmente avec la durée du séjour. Néanmoins, douleurs, dépression et idées noires
sont prégnantes pour tous. Les problèmes de comportement et l’altération de l’état général (AEG) vont croissants avec la durée du séjour et le vieillissement concomitant de
cette population.
Nous avons tende relier les informations syndromiques avec les autres tables du DWH pour définir une typologie des résidents, mais la tâche se révèle complexe car le
remplissage des tables est parfois lacunaire. Ainsi, par exemple, nous avons trouvé que pour 48,3% des résidents du premier tertile durée de séjour, il n’y avait ni mention
d’une pathologie, ni mention d’un antécédent cancer dans la table des antécédents et pathologies.
  • ... This syndromic IS offers a real opportunity finding new ways to seniors' functioning modelization and opens hopefully the path towards specific clinical hypotheses formulation. Other works included studying the use of this IS applied to other public health problems such as frequent falls or falls with casualties [103], but also working towards a better life ending with cancer [104]. Ultimately, the aims are removing all preventable deaths and improving the residents' end of life with more autonomy, less pain and an improved quality of life, translating this new knowledge into health benefits for seniors everywhere. ...
    Article
    Full-text available
    Abstract Background: New Nursing Homes (NH) data warehouses fed from residents’ medical records open the way for monitoring health elderly population on a daily basis. Elsewhere syndromic surveillance has already shown that professional data can be used for public health (PH) surveillance but not during a long-term follow-up of the same cohort. Objective: The goal of this study was to build and assess a national ecological NH PH surveillance system (SS). Methods: Using a national network of 126 NH, a residents’ cohort was built. Medical and personal data were extracted from their electronic health records (EHR) and transmitted through internet to a national server almost in real time. Socio-demographic, autonomy and syndromic information were recorded. A set of twenty-six syndromes was defined using pattern matching with the standard query language LIKE operator and a Delphi-like method, between November 2010 and June 2016. Early aberration reporting system (EARS) and Bayes surveillance algorithms of the R surveillance® package were then used to assess our influenza and acute gastro enteritis (AGE) syndromic data against the Sentinelles network data, French epidemics gold-standard, following Centers for Disease and Control (CDC) surveillance system assessment guidelines. Results: By extracting all socio-demographic residents’ data, a cohort of 41 061 senior citizens was built. EARS_C3 algorithm on NH influenza and AGE syndromic data gave respectively sensitivities of 0.482 and 0.539 and specificities of 0.844 and 0.952 over a 6 year-period, forecasting the last influenza outbreak by catching early flu signals. Also, assessing influenza and AGE syndromic data quality, precisions during last season epidemic weeks’ peaks (weeks 03-2017 and 01-2017) were of 0.98 and 0.96, whereas during last summer epidemic weeks’ low (week 33-2016) were of 0.95 and 0.92. Conclusions: This study confirmed that using syndromic information gives a good opportunity to develop a genuine French national PH SS dedicated to senior citizens. Access to seniors’ free-text validated health data on influenza and AGE responds to a PH issue for the surveillance of this fragile population. This database will also make possible new ecological research on other subjects that will improve prevention, care and rapid response when facing health threats. Keywords Centers for Disease Control and Prevention (CDC), Nursing Homes (NH), Syndromic Surveillance System (SSS), SQL pattern matching, Delphi method, Sentinelles network, Influenza like Illness (ILI), Acute Respiratory Infection (ARI), Acute Gastro Enteritis (AGE), Information System (IS)
This research doesn't cite any other publications.