Conference PaperPDF Available

Extension des critères d'inclusions dans les essais cliniques à l'aide de méthodes d'optimisation

Authors:

Abstract

Cette communication expose la problématique du recrutement (inclusion) dans les essais cliniques. Après une brève présentation des données disponibles dans le système hospitalier, un scénario avec un critère d'inclusion sera présenté. L'apport du datamining et de l'optimisation combinatoire dans ce cas sera ensuite présenté, ainsi qu'une partie de la modélisation à mettre en place.
Extension des critères d’inclusions dans les essais cliniques à
l’aide de méthodes d’optimisation
Julie Jacques1,2,3, David Delerue1, Laetitia Jourdan2, Clarisse Dhaenens2,3
1Société ALICANTE
50 Rue Philippe de Girard, 59113 Seclin, France
julie.jacques@alicante.fr, david.delerue@alicante.fr
2INRIA Nord Europe ; Parc Scientifique de la Haute Borne 40, avenue Halley, Bât.A, Park Plaza, 59650
Villeneuve d’Ascq, France
Laetitia.Jourdan@inria.fr
3LIFL ; Université de Lille 1, Bât. M3, 59655 Villeneuve d’Ascq cédex, France
Clarisse.Dhaenens@lifl.fr
Mots-clés :recherche opérationnelle, optimisation, essais cliniques, data mining.
1 Introduction
Les essais cliniques permettent d’améliorer la qualité et l’efficacité des soins. Ils préparent les
techniques de soin de demain. Le plus souvent, les patients pris en charge dans un essai clinique
bénéficient d’un meilleur suivi et d’un traitement plus efficace qu’avec la prise en charge habituelle.
En pratique cependant, peu de patients "éligibles" à un essai clinique se verront proposer une partici-
pation.
Lors de la mise en place de la méthodologie d’un essai clinique, des critères d’inclusion sont dé-
finis et ciblent le profil des patients que l’on souhaite inclure dans l’essai clinique. Ces critères sont
variés : démographiques, diagnostiques, biologiques,... Une fois définis, ils permettent de commen-
cer la phase d’inclusion (recrutement). Elle est le plus souvent réalisée par le médecin investigateur,
en charge de l’essai clinique pour un hôpital donné. Ce médecin recrute des patients au cours de sa
pratique médicale habituelle : les patients qu’il ne suit pas sont ainsi involontairement exclus du re-
crutement. Les autres intervenants de santé peuvent également orienter des patients vers le médecin
investigateur [1]. Cependant ceux-ci ne sont pas toujours formés au recrutement pour les études en
cours [2]. Un système d’aide à la décision permettrait d’améliorer cette phase de recrutement.
2 Identifier les potentiels d’inclusion dans le système d’information hos-
pitalier
2.1 Système d’information hospitalier et PMSI
Dans le cadre du plan Hôpital 2007, chaque établissement de santé français dispose d’un système
d’information hospitalier qui contient au minimum les informations du Programme de médicalisation
des systèmes d’information (PMSI). Ces informations associent à chaque patient un ou plusieurs
séjours hospitaliers, comprenant diagnostics et actes ; ce qui représente environ 31000 attributs sur
un patient. Les informations qu’il contient pourraient être utilisées pour détecter dans les séjours les
potentiels d’inclusion pour les essais cliniques en cours. Selon les hôpitaux, les bases PMSI peuvent
s’enrichir de 3500 séjours par mois.
2.2 Exemple de problématique
Voici un exemple de cas d’utilisation : un essai clinique est mis en place pour étudier l’évolution
des patients ayant subi un AVC. Un critère d’inclusion candidat va être "le patient a eu un diagnostic
d’AVC", codé "I64" dans le PMSI. Il est possible de réaliser un moteur de recherche qui parcourt
l’ensemble des données PMSI pour isoler les patients avec le code "I64". Cependant les risques de
"rater" des inclusions potentielles sont élevés. Comme tout système de codage, le PMSI est exposé à
des erreurs de saisie, des données manquantes voire des habitudes de saisies différentes. Les erreurs
de saisie qui y sont constatées peuvent aller jusqu’à affecter 20% des données. Ce système admet
parfois plusieurs codages différents pour le même évènement. Il est également possible que "I64"
soit corrélé avec d’autres attributs. Ainsi, "I64" peut être similaire aux critères suivants :
diagnostic I64 "AVC sans précision" (critère initial)
diagnostic I61-I63 "Hémorragie intracérébrale", "séquelles d’hémorragie intracrânienne"
diagnostic I69 "séquelles de maladies cérébrovasculaires"
actes ACQK001 et DEQP003 "scannographie du crâne", "électrocardiographie"
Découvrir automatiquement les corrélations entre attributs détecterait les patients à potentiel d’inclu-
sion même lorsque le critère "I64" n’est pas renseigné. L’extension des critères d’inclusion initiaux
devient alors possible.
2.3 Apport de l’optimisation combinatoire
Ce cas d’utilisation pose un problème de datamining. Il s’agit d’analyser les données PMSI pour
trouver les règles sur les attributs du patient qui, dans cet exemple, prédisent le code "I64". Ces règles
pourront ensuite être utilisées sur des bases de données hospitalières pour retrouver les patients cor-
respondant aux nouveaux critères. Cette approche sera portable bien sûr à d’autres essais cliniques
sur des critères autres que "I64".
Pour permettre la recherche de règles, une phase de sélection d’attributs est nécessaire. Au vu du
nombre d’attributs à traiter (31000), les outils de datamining usuels comme Weka se sont avérés
insuffisants. La problématique de sélection d’attributs étant de nature combinatoire, des méthodes
d’optimisation adaptées aux problèmes de grande dimension seront utilisées : les méta-heuristiques.
L’approche enveloppante (wrapper) sera mise en oeuvre. Elle combine un algorithme d’optimisation
- capable de parcourir de larges espaces de recherche - et une méthode de classification (pour éva-
luer les sélections proposées)[3]. Pour mettre en place cette méthode, une phase de modélisation sera
nécessaire pour en particulier identifier les critères caractérisant la qualité d’un ensemble de règles
prédisant "I64". Plusieurs critères d’optimisation sont candidats :
maximiser support et confiance
maximiser le nombre de patients similaires à "I64" détectés par les règles. La définition d’une
notion de similarité médicale entre patients - catégorie d’âge identique, historique médical si-
milaire - devient alors nécessaire
minimiser le nombre de règles obtenues : évite les solutions trop spécifiques
minimiser les erreurs d’inclusion : dans un second temps, un mécanisme d’apprentissage peut
permettre au médecin investigateur d’indiquer les faux positifs produits par le système
Le choix de ces critères permettra de définir un score d’efficacité pour chaque ensemble de règles.
Références
[1] J-P. Le Floch, L. Perlemuter. Essais thérapeutiques et études cliniques MASSON 1995
[2] Rollman BL, Fischer GS, Zhu F, Belnap BH. Comparison of electronic physician prompts versus
waitroom case-finding on clinical trial enrollment J Gen Intern Med. 2008 Apr ;23(4) :447-50
[3] J. Garcia-Nieto, E.Alba, L.Jourdan, E.Talbi Sensitivity and specificity based multiobjective ap-
proach for feature selection : Application to cancer diagnosis Information Processing Letters
109 (2009) :887-896
ResearchGate has not been able to resolve any citations for this publication.
Article
Full-text available
Recruiting patients into clinical research protocols is challenging. Electronic medical record (EMR) systems capable of prompting clinicians may facilitate enrollment. To compare an EMR-based clinician prompt versus a wait-room-based case-finding strategy at enrolling patients into a clinical trial. Cross-sectional comparison of recruitment data from two trials to treat anxiety disorders in primary care. Both studies utilized similar enrollment criteria, intervention strategies, and the same four practice sites and EMR system. Patients referred by their (primary care physicians) PCPs in response to an EMR prompt (recruited 1/2005-10/2006), and patients enrolled by research assistants stationed in practice waiting rooms (7/2000-4/2002). Referral counts, patients' baseline sociodemographic and clinical characteristics. Over a 22-month period, EMR-prompted PCPs referred 794 patients and 176 (22%) met study inclusion criteria and enrolled, compared to 8,095 patients approached by wait room-based recruiters of whom 193 (2.4%) enrolled. Subjects enrolled by EMR-prompted PCPs were more likely to be non-white (23% vs 5%; P < 0.001), male (28% vs 18%; P = 0.03), and have higher anxiety levels than those recruited by wait-room recruiters (P < 0.0001). EMR systems prompting clinicians to refer patients with specific characteristics are an efficient recruitment tool with critical implications for increasing minority participation in clinical research.
Article
The study of the sensitivity and the specificity of a classification test constitute a powerful kind of analysis since it provides specialists with very detailed information useful for cancer diagnosis. In this work, we propose the use of a multiobjective genetic algorithm for gene selection of Microarray datasets. This algorithm performs gene selection from the point of view of the sensitivity and the specificity, both used as quality indicators of the classification test applied to the previously selected genes. In this algorithm, the classification task is accomplished by Support Vector Machines; in addition a 10-Fold Cross-Validation is applied to the resulting subsets. The emerging behavior of all these techniques used together is noticeable, since this approach is able to offer, in an original and easy way, a wide range of accurate solutions to professionals in this area. The effectiveness of this approach is proved on public cancer datasets by working out new and promising results. A comparative analysis of our approach using two and three objectives, and with other existing algorithms, suggest that our proposal is highly appropriate for solving this problem.