Content uploaded by Julie Jacques
Author content
All content in this area was uploaded by Julie Jacques
Content may be subject to copyright.
Extension des critères d’inclusions dans les essais cliniques à
l’aide de méthodes d’optimisation
Julie Jacques1,2,3, David Delerue1, Laetitia Jourdan2, Clarisse Dhaenens2,3
1Société ALICANTE
50 Rue Philippe de Girard, 59113 Seclin, France
julie.jacques@alicante.fr, david.delerue@alicante.fr
2INRIA Nord Europe ; Parc Scientifique de la Haute Borne 40, avenue Halley, Bât.A, Park Plaza, 59650
Villeneuve d’Ascq, France
Laetitia.Jourdan@inria.fr
3LIFL ; Université de Lille 1, Bât. M3, 59655 Villeneuve d’Ascq cédex, France
Clarisse.Dhaenens@lifl.fr
Mots-clés :recherche opérationnelle, optimisation, essais cliniques, data mining.
1 Introduction
Les essais cliniques permettent d’améliorer la qualité et l’efficacité des soins. Ils préparent les
techniques de soin de demain. Le plus souvent, les patients pris en charge dans un essai clinique
bénéficient d’un meilleur suivi et d’un traitement plus efficace qu’avec la prise en charge habituelle.
En pratique cependant, peu de patients "éligibles" à un essai clinique se verront proposer une partici-
pation.
Lors de la mise en place de la méthodologie d’un essai clinique, des critères d’inclusion sont dé-
finis et ciblent le profil des patients que l’on souhaite inclure dans l’essai clinique. Ces critères sont
variés : démographiques, diagnostiques, biologiques,... Une fois définis, ils permettent de commen-
cer la phase d’inclusion (recrutement). Elle est le plus souvent réalisée par le médecin investigateur,
en charge de l’essai clinique pour un hôpital donné. Ce médecin recrute des patients au cours de sa
pratique médicale habituelle : les patients qu’il ne suit pas sont ainsi involontairement exclus du re-
crutement. Les autres intervenants de santé peuvent également orienter des patients vers le médecin
investigateur [1]. Cependant ceux-ci ne sont pas toujours formés au recrutement pour les études en
cours [2]. Un système d’aide à la décision permettrait d’améliorer cette phase de recrutement.
2 Identifier les potentiels d’inclusion dans le système d’information hos-
pitalier
2.1 Système d’information hospitalier et PMSI
Dans le cadre du plan Hôpital 2007, chaque établissement de santé français dispose d’un système
d’information hospitalier qui contient au minimum les informations du Programme de médicalisation
des systèmes d’information (PMSI). Ces informations associent à chaque patient un ou plusieurs
séjours hospitaliers, comprenant diagnostics et actes ; ce qui représente environ 31000 attributs sur
un patient. Les informations qu’il contient pourraient être utilisées pour détecter dans les séjours les
potentiels d’inclusion pour les essais cliniques en cours. Selon les hôpitaux, les bases PMSI peuvent
s’enrichir de 3500 séjours par mois.
2.2 Exemple de problématique
Voici un exemple de cas d’utilisation : un essai clinique est mis en place pour étudier l’évolution
des patients ayant subi un AVC. Un critère d’inclusion candidat va être "le patient a eu un diagnostic
d’AVC", codé "I64" dans le PMSI. Il est possible de réaliser un moteur de recherche qui parcourt
l’ensemble des données PMSI pour isoler les patients avec le code "I64". Cependant les risques de
"rater" des inclusions potentielles sont élevés. Comme tout système de codage, le PMSI est exposé à
des erreurs de saisie, des données manquantes voire des habitudes de saisies différentes. Les erreurs
de saisie qui y sont constatées peuvent aller jusqu’à affecter 20% des données. Ce système admet
parfois plusieurs codages différents pour le même évènement. Il est également possible que "I64"
soit corrélé avec d’autres attributs. Ainsi, "I64" peut être similaire aux critères suivants :
– diagnostic I64 "AVC sans précision" (critère initial)
– diagnostic I61-I63 "Hémorragie intracérébrale", "séquelles d’hémorragie intracrânienne"
– diagnostic I69 "séquelles de maladies cérébrovasculaires"
– actes ACQK001 et DEQP003 "scannographie du crâne", "électrocardiographie"
Découvrir automatiquement les corrélations entre attributs détecterait les patients à potentiel d’inclu-
sion même lorsque le critère "I64" n’est pas renseigné. L’extension des critères d’inclusion initiaux
devient alors possible.
2.3 Apport de l’optimisation combinatoire
Ce cas d’utilisation pose un problème de datamining. Il s’agit d’analyser les données PMSI pour
trouver les règles sur les attributs du patient qui, dans cet exemple, prédisent le code "I64". Ces règles
pourront ensuite être utilisées sur des bases de données hospitalières pour retrouver les patients cor-
respondant aux nouveaux critères. Cette approche sera portable bien sûr à d’autres essais cliniques
sur des critères autres que "I64".
Pour permettre la recherche de règles, une phase de sélection d’attributs est nécessaire. Au vu du
nombre d’attributs à traiter (31000), les outils de datamining usuels comme Weka se sont avérés
insuffisants. La problématique de sélection d’attributs étant de nature combinatoire, des méthodes
d’optimisation adaptées aux problèmes de grande dimension seront utilisées : les méta-heuristiques.
L’approche enveloppante (wrapper) sera mise en oeuvre. Elle combine un algorithme d’optimisation
- capable de parcourir de larges espaces de recherche - et une méthode de classification (pour éva-
luer les sélections proposées)[3]. Pour mettre en place cette méthode, une phase de modélisation sera
nécessaire pour en particulier identifier les critères caractérisant la qualité d’un ensemble de règles
prédisant "I64". Plusieurs critères d’optimisation sont candidats :
– maximiser support et confiance
– maximiser le nombre de patients similaires à "I64" détectés par les règles. La définition d’une
notion de similarité médicale entre patients - catégorie d’âge identique, historique médical si-
milaire - devient alors nécessaire
– minimiser le nombre de règles obtenues : évite les solutions trop spécifiques
– minimiser les erreurs d’inclusion : dans un second temps, un mécanisme d’apprentissage peut
permettre au médecin investigateur d’indiquer les faux positifs produits par le système
Le choix de ces critères permettra de définir un score d’efficacité pour chaque ensemble de règles.
Références
[1] J-P. Le Floch, L. Perlemuter. Essais thérapeutiques et études cliniques MASSON 1995
[2] Rollman BL, Fischer GS, Zhu F, Belnap BH. Comparison of electronic physician prompts versus
waitroom case-finding on clinical trial enrollment J Gen Intern Med. 2008 Apr ;23(4) :447-50
[3] J. Garcia-Nieto, E.Alba, L.Jourdan, E.Talbi Sensitivity and specificity based multiobjective ap-
proach for feature selection : Application to cancer diagnosis Information Processing Letters
109 (2009) :887-896