Content uploaded by Philippe Saint-Pierre
Author content
All content in this area was uploaded by Philippe Saint-Pierre on Nov 11, 2015
Content may be subject to copyright.
Mod`eles multi-´etats de type Markovien et application `a
l’asthme
Philippe Saint Pierre
To cite this version:
Philippe Saint Pierre. Mod`eles multi-´etats de type Markovien et application `a l’asthme. Life
Sciences. Universit´e Montpellier I, 2005. French. <tel-00010146>
HAL Id: tel-00010146
https://tel.archives-ouvertes.fr/tel-00010146
Submitted on 14 Sep 2005
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of sci-
entific research documents, whether they are pub-
lished or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destin´ee au d´epˆot et `a la diffusion de documents
scientifiques de niveau recherche, publi´es ou non,
´emanant des ´etablissements d’enseignement et de
recherche fran¸cais ou ´etrangers, des laboratoires
publics ou priv´es.
UNIVERSITE MONTPELLIER I
U.F.R. de MEDECINE
Année 2005 N
◦
attribué par la bibliothèque
THESE
pour obtenir le grade de
DOCTEUR DE L’UNIVERSITE MONTPELLIER I
Formation Doctorale : Biostatistique
Ecole Doctorale : Information, Structures, Systèmes
Discipline : Epidémiologie, Economie de la santé, Prévention
présentée et soutenue publiquement
par
Philippe SAINT PIERRE
Le 29 Avril 2005
Titre :
MODELES MULTI-ETATS DE TYPE MARKOVIEN ET
APPLICATION A L’ASTHME
Directeur de thèse : Professeur Jean-Pierre DAURES
Co-encadrant : Professeur Philippe GODARD
JURY
M. Michel AUBIER Professeur à l’Université Paris VII Rapporteur
M. Jean-Pierre DAURES Professeur à l’Université Montpellier I Directeur de thèse
M. Gilles DUCHARME Professeur à l’Université Montpellier II Examinateur
M. Abdelkader EL HASNAOUI Biométricien à GlaxoSmithKline Examinateur
M. Philippe GODARD Professeur à l’Université Montpellier I Directeur de thèse
Mme. Catherine HUBER Professeur à l’Université Paris V Rapporteur
M. Gérard TAP M. de Conférences à l’Université Toulouse III Examinateur
REMERCIEMENTS
En premier lieu, je tiens à exprimer mes sincères remerciements à Jean-Pierre Daurès
pour m’avoir encadré pendant cette thèse. Il a su me faire confiance en me laissant une
grande liberté d’initiative tout en me faisant profiter de sa rigueur et de ses compétences
mathématiques. Au delà du contexte professionnel, je lui exprime toute mon estime.
Je voudrais aussi remercier Philippe Godard qui a co-encadré ce travail. Le médecin
qu’il est a su faire confiance au statisticien que je suis. Il m’a beaucoup apporté par sa
vision clinique du problème. Ce fut pour moi un très grand honneur de collaborer avec un
éminent spécialiste de l’asthme.
Je suis également très reconnaissant envers Catherine Huber et Michel Aubier pour
l’intérêt qu’ils ont bien voulu accorder à ma thèse en acceptant d’en être les rapporteurs.
J’adresse mes remerciements sincères à Gilles Ducharme, Gérard Tap et Abdelkader El
Hasnaoui pour avoir accepté de participer à ce jury.
Je tiens à remercier toute l’équipe de l’IURC pour m’avoir supporté au cours de ces
années de thèse. Vous m’avez tous aidé, de près ou de loin, à réaliser cette thèse. Merci à
Nicolas pour m’avoir fait partager son expérience.
Je remercie tout particulièrement Yohan D., Christophe & Julie, Yohann F. et Christel
pour tous les bons moments passés au boulot et en dehors. Vous êtes pour beaucoup dans
ce travail, autant sur le plan humain que scientifique.
Merci à Marie, Sandy, Nathalie, Françoise, Séverine, Christine, Pascale pour leur bonne
humeur quotidienne et leurs nombreux coups de main, Christophe C. pour ses conseils
éclairés, Faiza, Pierre et Eve mes collègues de thèse. Je pense aux anciens de l’IURC :
Yannick, Claude & Karine, Christophe B. pour m’avoir supporté dans le bureau, Delphine,
Remy et Florian pour les foots, Claudine pour la collaboration scientifique et les moments
partagés aux congrès.
Un merci particulier à Sylvie pour sa gentillesse, son efficacité et son aide dans l’orga-
nisation des congrès et de la thèse.
Je décerne une mention spéciale à Benoît pour tous les moments partagés. Du parc de
Balma au Laos en passant par le Burkina, tu as toujours été là !
"Spéciale dédicace" à Charly & Amandine pour leur enthousiasme et leur motivation
débordantes. Je vous souhaite sincèrement le meilleur pour le "BiblioBrousse". Je suis fier
de vous avoir comme amis.
Je remercie évidemment Cathy & Guillaume pour leur amitié fidèle malgré le temps
qui passe ainsi qu’Olivier pour toutes les soirées "play" et les week-ends "snow".
J’ai des remerciements tous particuliers à adresser aux anciens Balmanais pour leurs
amitiés et les nombreuses soirées aussi bien survoltées que mémorables. Je pense à Benoît,
PJ, Cathy, Olivier C., Laurent, Sophie, Bruno, François J., François C., Bertrand, ainsi
que Johan A. et sa petite famille.
Comment pourrai-je oublier mes collègues toulousains de licence et de maîtrise avec
qui j’ai partagé une bonne partie de ma vie universitaire. Les soirées enflammées, le séjour
en Espagne entre "playboys", mais aussi les révisions de partiels resteront pour moi, de
grands et de bons souvenirs. Cruz, Cécile, Aurélie, Ernest, Nico S., Géraldine & Patrick,
Hélène et Franck : merci ! Je suis heureux de continuer à vous voir malgré la distance.
Je remercie également Amélie & Alex et Laurie & Benoît pour nous avoir accueillis à
Montpellier.
Je ne peux oublier Kaz dit Alexis pour son hospitalité et pour tous les bons moments
passés de Ouaga à Songo. J’ai une pensée particulière pour sa famille qui m’a accueilli et
m’a permis de partager une tranche de vie dans un monde loin de nos valeurs et de nos
considérations occidentales.
Je pense également à Cédric Bonnet, aux familles Helson, Buxant, Ravel et Mangenot,
les vieux amis de Bouaké. La cour de l’école Bambi restera pour moi un terrain de jeu
inoubliable.
Un grand merci à la famille de Céline qui m’a toujours apporté son soutien : Jo &
Bernard, Pierre & Aurèle, Fabienne & Bruno.
Je voudrais remercier spécialement ma famille qui m’a toujours soutenu. En particulier,
mes parents qui ont toujours cru en moi, mon frère qui, fort de son expérience, a su me
conseiller, ma soeur et Olivier pour leurs encouragements. Aude, maintenant que je suis
initié, je pourrai te conseiller ! "Spéciale dédicace" à Mamie qui malheureusement n’a pas
pu participer à cet événement mais à qui je pense.
Ces remerciements ne seraient pas complets si je n’évoquais la présence et le soutien
inconditionnel de Céline. Elle m’a suivi à Montpellier (et à Delhi !), elle m’a supporté au
quotidien et elle m’a toujours encouragé dans les moments difficiles. Elle m’a également
aidé dans toutes les étap es de la rédaction : des problèmes mathématiques à la relecture
en passant par la rédaction. Je ne te remercierai jamais assez pour tout ce que tu m’as
apporté.
La rédaction d’une thèse donne la chance de pouvoir remercier toutes les personnes
qui nous sont chères et qui ont rendu ce travail possible. Famille, collègues ou amis, si j’en
suis arrivé là, c’est bien grâce à vous. Même si les mots et la place manquent, puissent ces
quelques lignes exprimer l’ampleur de ma reconnaissance.
Philippe.
Table des matières
Introduction 3
1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2 Modélisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1 Alternatives aux modèles multi-états . . . . . . . . . . . . . . . . . . . . 4
2.2 Les mo dèles multi-états . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3 Structure du document . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
I Présentation de la base de données 9
1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
2 Présentation de la base de données . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1 Définition des états de contrôle . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 Définitions des modèles . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3 Covariables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3 Description de la base à l’inclusion . . . . . . . . . . . . . . . . . . . . . . . . 16
II Modèle de Markov homogène et extensions 21
1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
2 Définitions et notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.1 Processus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2 Processus Markovien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3 Processus Markovien homogène . . . . . . . . . . . . . . . . . . . . . . . 25
3 Modèle de Markov homogène . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.1 Vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.2 Incorporation de covariables . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.3 Modèle de Markov homogène par périodes . . . . . . . . . . . . . . . . . 28
3.4 Tests d’hypothèses et d’adéquation . . . . . . . . . . . . . . . . . . . . . 29
4 Application à l’asthme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.1 Modèle à trois états . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.2 Modèle à deux états . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
III Modèle semi-Markovien homogène 37
1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
2 Préliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.2 Probabilités de transition du processus semi-Markovien . . . . . . . . . . 41
i
2.3 Fonction de vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3 Estimation paramétrique des temps de séjour . . . . . . . . . . . . . . . . . . 44
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2 Modèle à risques proportionnels . . . . . . . . . . . . . . . . . . . . . . . 45
3.3 Modélisation paramétrique de la loi de séjour dans l’état . . . . . . . . . 46
3.3.1 Loi de Weibull . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.3.2 Loi de Weibull généralisée . . . . . . . . . . . . . . . . . . . . . . 48
3.4 Extension à un modèle semi-Markovien non-homogène . . . . . . . . . . 51
4 Estimation non-paramétrique des intensités du processus semi-Markovien . . . 52
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.2 Ecriture de la vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.3 Estimation non-paramétrique des intensités . . . . . . . . . . . . . . . . 54
4.4 Estimateurs dérivés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.4.1 Estimateur du noyau semi-Markovien . . . . . . . . . . . . . . . . 57
4.4.2 Estimateur des probabilités du processus semi-Markovien . . . . 57
4.5 Propriétés asymptotiques des estimateurs . . . . . . . . . . . . . . . . . 58
5 Application à l’asthme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.1 Application de l’estimation paramétrique . . . . . . . . . . . . . . . . . . 59
5.1.1 Modèle stratifié . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.1.2 Modèle univarié . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.1.3 Modèle multivarié avec transition spécifique . . . . . . . . . . . . 66
5.2 Application de l’estimation non-paramétrique . . . . . . . . . . . . . . . 66
6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.1 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.2 Méthodes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
IV Modèle de Markov non-homogène 71
1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
71
2 Processus de Markov et processus de comptage . . . . . . . . . . . . . . . . . 72
2.1 Processus de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.2 Processus de comptage . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
2.3 Vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.4 Processus de comptage et censure à droite . . . . . . . . . . . . . . . . . 76
2.4.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.4.2 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
2.4.3 Censure à droite indépendante . . . . . . . . . . . . . . . . . . . 78
2.4.4 Caractéristique de la censure à droite . . . . . . . . . . . . . . . . 80
3 Estimation non-paramétrique . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.1 Observations et notations . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.2 Estimation des intensités cumulées . . . . . . . . . . . . . . . . . . . . . 83
3.3 Estimation des probabilités de transition . . . . . . . . . . . . . . . . . . 84
3.4 Test des intensités de transition . . . . . . . . . . . . . . . . . . . . . . . 86
3.5 Cas particulier: données de survie . . . . . . . . . . . . . . . . . . . . . . 87
4 Estimation semi-paramétrique . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.1 Définitions et notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.2 Estimation des intensités de base . . . . . . . . . . . . . . . . . . . . . . 91
4.3 Estimation des coefficients de régression . . . . . . . . . . . . . . . . . . 92
ii
4.4 Estimation des probabilités de transition . . . . . . . . . . . . . . . . . . 94
4.5 Covariables dépendantes du temps . . . . . . . . . . . . . . . . . . . . . 95
4.6 Tests des coefficients . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.7 Test de l’hypothèse de proportionnalité des risques . . . . . . . . . . . . 96
4.8 Cas particulier: données de survie . . . . . . . . . . . . . . . . . . . . . . 97
5 Application à l’asthme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.1 Estimation non-paramétrique . . . . . . . . . . . . . . . . . . . . . . . . 99
5.2 Estimation semi-paramétrique . . . . . . . . . . . . . . . . . . . . . . . . 101
5.3 Comparaison des modèles de Markov homogène et non-homogène . . . . 103
6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6.1 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6.2 Méthodes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.3 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
V Prise en compte de la censure informative - Méthode IPCW 109
1 Méthode IPCW pour les modèles de survie . . . . . . . . . . . . . . . . . . . .
109
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
1.2 Mécanisme de censure . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
1.3 Hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
1.4 Réduction du nombre de covariables . . . . . . . . . . . . . . . . . . . . 113
1.5 Etude du risque de censure . . . . . . . . . . . . . . . . . . . . . . . . . 114
1.5.1 Notations et estimation . . . . . . . . . . . . . . . . . . . . . . . 114
1.5.2 Extension p ossible . . . . . . . . . . . . . . . . . . . . . . . . . . 114
1.5.3 Estimation de la survie de la censure et calcul des poids . . . . . 115
1.6 Estimation IPCW . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
1.6.1 Estimation IPCW de la survie . . . . . . . . . . . . . . . . . . . . 116
1.6.2 Version IPCW du score de la vraisemblance partielle . . . . . . . 117
1.6.3 Ecarts-types . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
2 Méthode IPCW adaptée au modèle Markovien . . . . . . . . . . . . . . . . . . 120
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
2.2 Modèle avec un état de censure . . . . . . . . . . . . . . . . . . . . . . . 122
2.2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
2.2.2 Hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
2.2.3 Estimations des risques de censure . . . . . . . . . . . . . . . . . 123
2.2.4 Estimation des probabilités de censure . . . . . . . . . . . . . . . 124
2.2.5 Calcul des poids . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
2.3 Extension p ossible . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
2.4 Modèle non-paramétrique IPCW . . . . . . . . . . . . . . . . . . . . . . 126
2.5 Modèle semi-paramétrique IPCW . . . . . . . . . . . . . . . . . . . . . . 128
2.5.1 Estimation des coefficients de régression . . . . . . . . . . . . . . 128
2.5.2 Estimation des probabilités de transition . . . . . . . . . . . . . . 129
3 Application à l’asthme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
3.1 Application à des données de survie . . . . . . . . . . . . . . . . . . . . . 130
3.1.1 Définition du modèle . . . . . . . . . . . . . . . . . . . . . . . . . 130
3.1.2 Modèle de Cox pour l’événement . . . . . . . . . . . . . . . . . . 131
3.1.3 Risque et survie de la censure . . . . . . . . . . . . . . . . . . . . 132
3.1.4 Estimation de la survie . . . . . . . . . . . . . . . . . . . . . . . . 135
iii
3.1.5 Méthode IPCW avec covariables . . . . . . . . . . . . . . . . . . 136
3.1.6 Extension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
3.2 Application à un modèle de Markov à deux états . . . . . . . . . . . . . 137
3.2.1 Modèle avec deux états de contrôle . . . . . . . . . . . . . . . . . 137
3.2.2 Modèle avec état de censure . . . . . . . . . . . . . . . . . . . . . 139
3.2.3 Estimations des probabilités de transition . . . . . . . . . . . . . 140
3.2.4 Méthode IPCW avec covariables . . . . . . . . . . . . . . . . . . 142
3.2.5 Extension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
4 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
4.1 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
4.2 Méthodes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
4.3 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
Conclusion Générale 147
5 Récapitulatif de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
147
6 Résultats cliniques sur l’asthme . . . . . . . . . . . . . . . . . . . . . . . . . . 148
7 Choix du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
8 Discussion des biais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
9 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
Bibliographie 159
A Théorie statistique 161
1 Processus aléatoires et intégrales stochastiques . . . . . . . . . . . . . . . . . .
161
2 Produit intégral (ou infini) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
3 Processus de comptage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
4 Processus p onctuel marqué . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
5 Vraisemblance d’un processus de comptage . . . . . . . . . . . . . . . . . . . . 166
6 Vraisemblance partielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
7 Processus de comptage et censure à droite . . . . . . . . . . . . . . . . . . . . 170
7.1 Notations et définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
7.2 Censure à droite indépendante . . . . . . . . . . . . . . . . . . . . . . . . 172
7.3 Vraisemblance sous censure indépendante . . . . . . . . . . . . . . . . . 173
7.4 Censure à droite non informative . . . . . . . . . . . . . . . . . . . . . . 174
8 Théorème de la limite centrale . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
B Programmation de l’estimateur semi-paramétrique 177
1 Données requises pour l’estimation . . . . . . . . . . . . . . . . . . . . . . . .
178
1.1 Base d’entrée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
1.2 Quantités à calculer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
1.3 Programmation des quantités . . . . . . . . . . . . . . . . . . . . . . . . 179
2 Fonction de la log-vraisemblance partielle . . . . . . . . . . . . . . . . . . . . 179
3 Ecart-types des coefficients de régression . . . . . . . . . . . . . . . . . . . . . 181
3.1 Méthodologie pour une covariable . . . . . . . . . . . . . . . . . . . . . . 181
3.2 Programmation p our une covariable . . . . . . . . . . . . . . . . . . . . . 182
3.3 Méthodologie pour deux covariables . . . . . . . . . . . . . . . . . . . . . 183
3.4 Programmation p our deux covariables . . . . . . . . . . . . . . . . . . . 184
iv
4 Estimateur de Nelson-Aalen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
5 Estimateur des probabilités de transition . . . . . . . . . . . . . . . . . . . . . 185
6 Test de l’hypothèse de proportionnalité des risques . . . . . . . . . . . . . . . 186
C Définition des états de contrôle 187
Liste des figures
I.1 Modèle à trois états de contrôle pour l’asthme. . . . . . . . . . . . . . . . 13
I.2 Modèle à deux états de contrôle pour l’asthme. . . . . . . . . . . . . . . . 14
I.3 Modèle de survie pour l’asthme. . . . . . . . . . . . . . . . . . . . . . . . 15
II.1 Modèle à trois états de contrôle pour l’asthme. . . . . . . . . . . . . . . . 30
II.2 Modèle à deux états de contrôle pour l’asthme. . . . . . . . . . . . . . . . 33
II.3 Probabilités de transition de l’état inacceptable vers l’état acceptable. Les
deux courbes du haut (foncées) sont associées aux patients non sévères, sans
corticothérapie orale et sans antécédents majeurs de corticoïdes oraux. Les
deux courbes du bas (claires) sont associées aux patients sévères, avec une
corticothérapie orale et avec des antécédents de corticoïdes oraux. IMC
< 25: courbes en trait plein, IMC > 25: courbes en pointillé. . . . . . . .
35
III.1 Exemple de fonctions de risque d’une loi de Weibull. . . . . . . . . . . . . 49
III.2 Exemple de fonctions de risque d’une loi de Weibull généralisée. . . . . . 50
III.3 Modèle à trois états de contrôle pour l’asthme. . . . . . . . . . . . . . . . 59
III.4 Estimations des intensités du temps de séjour par des lois de Weibull
(courbes noires) et Weibull généralisée (courbes grises). (a) Temps de sé-
jour dans un état inacceptable vers un état optimal (3 → 1) dans les strates
IMC < 25 (—–) et IMC 6 25 (- - -). (b) Temps de séjour dans un état
sous-optimal vers un état inacceptable (2 → 3) dans les strates non sévère
(—–) et sévère (- - -). . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
III.5 Estimations des intensités du processus semi-Markovien en utilisant des
lois de Weibull (courbes noires) et Weibull généralisée (courbes grises). (a)
Intensité de transition d’un état inacceptable vers un état optimal (3 → 1)
dans les strates IMC < 25 (—–) et IMC 6 25 (- - -). (b) Intensité de
transition d’un état sous-optimal vers un état inacceptable (2 → 3) dans
les strates non sévère (—–) et sévère (- - -). . . . . . . . . . . . . . . . . .
63
III.6 Estimations des intensités du temps de séjour par des lois de Weibull
(courbes noires) et Weibull généralisée (courbes grises). (a) Temps de sé-
jour dans un état inacceptable vers un état optimal (3 → 1) avec l’IMC en
covariable (IMC < 25 (—–); IMC > 25 (- - -)). (b) Temps de séjour dans
un état sous-optimal vers un état inacceptable (2 → 3) avec la sévérité en
covariable (non sévère (—–); sévère (- - -)). . . . . . . . . . . . . . . . . .
65
v
III.7 Estimations des intensités du processus semi-Markovien en utilisant des
lois de Weibull (courbes noires) et Weibull généralisée (courbes grises). (a)
Intensité de transition d’un état inacceptable vers un état optimal (3 → 1)
avec l’IMC en covariable (IMC < 25 (—–); IMC > 25 (- - -)). (b) Intensité
de transition d’un état sous-optimal vers un état inacceptable (2 → 3) avec
la sévérité en covariable (non sévère (—–); sévère (- - -)). . . . . . . . . .
65
III.8 Estimations non-paramétrique des intensités du pro cessus semi-Markovien
associée à la transition 3 → 1 dans les strates IMC < 25 et IMC > 25.
Chaque figure correspond à une valeur de α. . . . . . . . . . . . . . . . .
67
III.9 Comparaison des estimations paramétrique et non-paramétrique (α = 0.3)
des intensités du processus semi-Markovien associées à la transition 3 → 1.
(a) strate IMC < 25; (b) strate IMC > 25. . . . . . . . . . . . . . . . . .
68
IV.1 Modèle de survie à deux états: vivant et décès. . . . . . . . . . . . . . . . 87
IV.2 Modèle à trois états de contrôle pour l’asthme. . . . . . . . . . . . . . . . 98
IV.3 Estimation non-paramétrique (Nelson-Aalen) des intensités cumulées dans
les strates IMC < 25 et IMC > 25 : (a) transition de l’état optimal vers
l’état inacceptable (1 → 3); (b) transition de l’état inacceptable vers l’état
optimal (3 → 1). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
100
IV.4 Estimation non-paramétrique (Aalen-Johansen) des probabilités de tran-
sition dans les strates IMC < 25 et IMC > 25 : (a) transition de l’état
optimal vers l’état inacceptable (1 → 3); (b) transition de l’état inaccep-
table vers l’état optimal (3 → 1). . . . . . . . . . . . . . . . . . . . . . .
100
IV.5 Estimation semi-paramétrique des probabilités de transition avec l’IMC en
covariable: IMC < 25 et IMC > 25 : (a) transition de l’état optimal vers
l’état inacceptable (1 → 3); (b) transition de l’état inacceptable vers l’état
optimal (3 → 1). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
103
IV.6 Estimation des probabilités de transition dans un modèle homogène (courbe
lisse) et dans un modèle non-homogène (courb e en escalier); (a) transition
de l’état optimal vers l’état inacceptable (1 → 3); (b) transition de l’état
inacceptable vers l’état optimal (3 → 1). . . . . . . . . . . . . . . . . . .
104
V.1 (a) Modèle à deux états avec retour. (b) Modèle progressif. (c) Modèle à
trois états « sain », « malade », « décès ». . . . . . . . . . . . . . . . . . .
121
V.2 Modèle à deux états de santé et un état absorbant représentant la censure
(Etat C). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
122
V.3 Modèle à deux états de santé et à deux états absorbants représentant la
censure. L’état C
1
représente la censure par perdu de vue et l’état C
2
représente la censure engendrée par les exclus vivants. . . . . . . . . . . . 126
V.4 Modèle à deux états de santé avec retour. . . . . . . . . . . . . . . . . . . 126
V.5 Modèle de survie pour l’asthme. . . . . . . . . . . . . . . . . . . . . . . . 131
V.6 Estimations du risque de censure dans un modèle sans covariable, un mo-
dèle avec covariables codées 0 et un modèle avec covariables codées 1. . .
134
V.7 Estimations de la survie de censure dans un modèle sans covariable, un
modèle avec covariables codées 0 et un modèle avec covariables codées 1. .
135
V.8 Estimations de la survie de l’événement (transition dans l’état inacceptable)
par Kaplan-Meier et par la méthode IPCW. . . . . . . . . . . . . . . . . .
136
vi
V.9 Modèle à deux états de contrôle pour l’asthme. . . . . . . . . . . . . . . . 138
V.10 Probabilités de censure à partir des états de contrôle acceptable et inac-
ceptable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
141
V.11 Estimations des probabilités de transition par la méthode semi-paramétrique
et par la méthode IPCW. (a) Probabilité de transition de l’état de contrôle
acceptable vers l’état inacceptable (1 → 2). (b) Probabilité de transition
de l’état de contrôle inacceptable vers l’état acceptable (2 → 1). . . . . .
141
Liste des tableaux
I.1 Critères pour le contrôle de l’asthme. . . . . . . . . . . . . . . . . . . . . 12
I.2 Représentativité des transitions. . . . . . . . . . . . . . . . . . . . . . . . 13
I.3 Représentativité des transitions. . . . . . . . . . . . . . . . . . . . . . . . 14
I.4 Caractéristiques des patients lors de l’inclusion dans l’étude en fonction de
l’état de contrôle (acceptable et inacceptable). . . . . . . . . . . . . . . .
17
I.5 Caractéristiques des patients lors de l’inclusion dans l’étude en fonction de
l’Indice de Masse Corporelle (IMC < 25 et IMC > 25). . . . . . . . . . . .
18
I.6 Caractéristiques des patients lors de l’inclusion dans l’étude en fonction de
la sévérité de l’asthme (non sévère et sévère). . . . . . . . . . . . . . . . .
19
II.1 Processus stochastiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
II.2 Estimations des coefficients de régression dans un modèle homogène avec
une covariable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
II.3 Estimations des coefficients de régression dans un modèle homogène par
période (2 périodes, τ
1
= 100). . . . . . . . . . . . . . . . . . . . . . . . . 31
II.4 Estimations des coefficients de régression dans un modèle homogène avec
une covariable (IMC) et dans un modèle avec quatre covariables. . . . . .
34
III.1 Transitions qui semblent vérifier l’hypothèse de proportionnalité des risques. 62
III.2 Estimations des coefficients de régression dans un modèle semi-Markovien
avec une covariable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
64
IV.1 Les vraisemblances successives. . . . . . . . . . . . . . . . . . . . . . . . . 93
IV.2 Test du Log-rank et de Gehan-Wilcoxon pour comparer les intensités de
transition dans les strates IMC < 25 (codée 0) et IMC > 25 (codée 1). . .
101
IV.3 Estimation semi-paramétrique des coefficients de régression associés aux
covariables: Z
1
= IMC (0 si IMC < 25, 1 si IMC > 25) et Z
2
(t) = Z
1
×
log(t/1000) où t est le temps en jours. . . . . . . . . . . . . . . . . . . . .
102
IV.4 Estimations des coefficients de régression associés à l’IMC dans un modèle
homogène et dans un modèle non-homogène. . . . . . . . . . . . . . . . .
105
V.1 Modèle de Cox univarié pour l’événement. . . . . . . . . . . . . . . . . . . 132
V.2 Modèle de Cox multivarié pour l’événement. . . . . . . . . . . . . . . . . . 132
V.3 Modèle de Cox multivarié pour la censure. . . . . . . . . . . . . . . . . . . 133
V.4 Estimation des coefficients de régression pour la survie de l’événement par
le mo dèle de Cox et par la méthode IPCW. . . . . . . . . . . . . . . . . .
136
vii
V.5 Modèle semi-paramétrique univarié p our les risques de transition entre
états de santé. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
138
V.6 Modèle semi-paramétrique multivarié pour les risques de transition entre
états de santé. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
139
V.7 Modèle semi-paramétrique multivarié pour les risques de censure. . . . . . 139
V.8 Estimation des coefficients de régression pour la transition 1 → 2 par le
modèle semi-paramétrique et par la méthode IPCW. . . . . . . . . . . . .
142
V.9 Estimation des coefficients de régression pour la transition 2 → 1 par le
modèle semi-paramétrique et par la méthode IPCW. . . . . . . . . . . . .
143
1
2 Introduction
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
Introduction
1 Contexte
Dans de nombreux domaines, décrire l’évolution des phénomènes dans le temps est d’un
intérêt capital, en particulier pour aborder les problématiques de la prédiction et de la
recherche de facteurs causaux. Les observations correspondent souvent à des mesures d’une
même caractéristique faites à plusieurs instants. Ces données, appelées mesures répétées,
se distinguent de celles présentes dans les modélisations statistiques traditionnelles. En effet,
– la même variable est mesurée plusieurs fois sur un même individu en des temps dif-
férents : les réponses ne peuvent plus être considérées comme étant indépendantes
comme c’est le cas dans l’analyse de régression usuelle,
– plusieurs individus sont inclus dans l’échantillon : les réponses ne forment pas une
série chronologique simple.
En épidémiologie, les données de cohorte constituent la source majeure de mesures répé-
tées. Ces données sont obtenues quand on observe un groupe de patients au cours du temps
afin d’identifier, décrire ou quantifier un phénomène. La variable qu’on cherche à expliquer
peut être de différentes formes.
– Dans le cas du VIH, la mesure de la charge virale reflète l’avancée du virus dans l’or-
ganisme et la mesure de lymphocytes CD4 reflète le réservoir immunologique. Ce sont
des marqueurs fondamentaux pour définir l’état de santé du patient. Ces marqueurs
sont des variables quantitatives.
– Dans le cas du cancer, l’état de la maladie p eut être renseigné par le nombre de
métastases. Il y a un nombre fini de modalités pour la variable étudiée.
– Dans le suivi d’une transplantation, le phénomène d’intérêt est par exemple le rejet
de la greffe. La variable étudiée est binaire.
– Dans de nombreuses maladies, la variable prenant les valeurs « sain », « malade » et
« décès » peut être considérée comme la variable à expliquer.
Une autre spécificité des données de cohorte réside dans le fait que souvent, les mesures
ne sont pas effectuées à des intervalles de temps fixés. Ainsi, les temps d’observation ne
sont pas les mêmes pour tous les individus et le temps écoulé entre deux observations n’est
généralement pas fixé (et varie d’un individu à l’autre). L’espace des temps de mesure est
dit continu par opposition au cas discret où les temps d’observation sont fixés pour tous les
individus.
Dans la plupart des maladies chroniques, des données de cohorte sont mises en place afin
de mieux comprendre l’évolution de la maladie. Dans le cas de l’asthme et des allergies, en
3
4 Introduction
réponse à l’augmentation rapide de la prévalence, de nombreuses cohortes ont été mises en
oeuvre dans le but de mieux connaître les différents facteurs de risque de ces affections. En
1996, plusieurs CHU français ont collecté des données sur des patients asthmatiques suivis
à l’hôpital. La base obtenue est une cohorte observationnelle reflétant l’activité réelle d’un
hôpital avec des patients venant consulter à des instants quelconques. L’espace des temps
d’observation étant continu, certains modèles statistiques usuels pour données longitudi-
nales ne conviennent plus. Par exemple, l’analyse de la variance pour mesures répétées, qui
nécessite des temps d’observation fixés, n’est pas adaptée.
Les modèles multi-états constituent une alternative intéressante pour modéliser des don-
nées de type mesures répétées. D’un point de vue théorique, l’objectif de ce document est
d’étudier et de développer des méthodes statistiques pour les modèles multi-états. D’un
point de vue clinique, l’objectif est d’analyser une cohorte sur l’asthme afin de fournir aux
cliniciens des outils pour comprendre l’évolution des patients asthmatiques.
2 Modélisation
2.1 Alternatives aux modèles multi-états
Les modèles à effets aléatoires (où modèles mixtes) sont fréquemment utilisés pour ét u-
dier la corrélation entre des observations. Par l’intermédiaire des effets aléatoires, ils per-
mettent d’expliciter les différences entre les individus sans observer les déterminants de cette
variabilité inter-individuelle. Ils prennent ainsi en compte une hétérogénéité entre individus
ou entre groupes d’individus. Ces modèles peuvent être généralisés et de nature linéaire ou
non (Pinheiro et Bates [2000]). La corrélation entre les observations d’un même individu
peut être modélisée par l’intermédiaire des modèles marginaux (Diggle et al. [1994]). La
matrice de covariance des observations est définie de manière à prendre en compte les cor-
rélations intra-individus. La théorie des équations d’estimation généralisées (Liang et Zeger
[1986]) permet par exemple d’estimer ce type de modèles.
Les modèles de régression mettant en jeu des variables fonctionnelles peuvent également
être utilisés. De manière plus précise, ces modèles considèrent le cas d’un problème de
régression où la variable à expliquer est réelle et la variable explicative est une fonction.
Pour chaque individu, les données mesurées au cours du temps sont considérées comme une
courbe. Dans le contexte de la régression, ces modèles ont été introduits pour prendre en
compte la corrélation entre les observations d’un même individu et le fait que le nombre de
variables explicatives (nombre de mesures pour un même individu) est souvent supérieure
à la taille de l’échantillon. Le modèle linéaire et le modèle linéaire généralisé traditionnels
peuvent être adaptés afin de tenir compte de la nature fonctionnelle des variables explicatives
(Saint-Pierre [2001], Cardot et al. [1999]).
2.2 Les modèles multi-états
Depuis une trentaine d’années, les modèles multi-états ne cessent de connaître un in-
térêt croissant. Ces mo dèles utilisent la notion d’« état » et de processus pour décrire un
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Modélisation 5
phénomène. La notion de processus est utilisée pour représenter les différents états suc-
cessivement occupés à chaque temps d’observation. En épidémiologie, ils permettent par
exemple, de représenter l’évolution d’un patient à travers les différents stades d’une mala-
die. Après définition des différents stades, les modèles multi-états permettent d’étudier de
nombreuses dynamiques complexes. L’étude de ces modèles consiste à analyser les forces de
passage (intensités de transition) entre les différents états.
Un nombre important de publications statistiques concerne les modèles multi-états. Ce-
pendant, l’application de ces modèles dépasse rarement le cadre des revues spécialisées.
Cette situation s’explique en partie, par l’absence de logiciels adaptés et la méconnaissance
des méthodes statistiques. La popularité et la richesse des modèles de survie, en particu-
lier du modèle de Cox, dessert l’utilisation de ces modèles dans le domaine appliqué. Il est
pourtant des situations où l’étude d’un délai d’apparition d’un événement ne peut apporter
qu’une rép onse partielle au problème posé.
Dans les modèles multi-états les plus simples, l’information sur l’état présent renseigne
sur les états précédents : par exemple, les modèles progressifs (Hougaard [1999]), les modèles
à risques compétitifs (Huber-Carol et Pons [2004], Andersen et al. [1993]), ou encore les mo-
dèles de survie qui représentent le cas le plus simple avec uniquement deux états : « vivant
» et « décès » (Therneau et Grambsch [2000]). Cependant, dès que le modèle comprend des
états réversibles (c’est-à-dire que certains événements sont récurrents), il devient nécessaire
de faire des hypothèses sur l’histoire de l’individu. Les modèles de type Markovien sont
très utiles car ils supposent que l’information sur les états précédents est résumée par l’état
présent. Le terme de modèle multi-états regroupant de nombreuses problématiques biosta-
tistiques, le nombre de publications sur le sujet est très important. On pourra se référer,
par exemple, aux travaux de Andersen et Keiding [2002], Hougaard [1999], Andersen et al.
[1993] et Commenges [1999] qui font le point sur l’état de l’art dans ce domaine.
Dans ces modèles de type Markovien, les intensités de transition entre les états p euvent
dépendre de différentes échelles de temps, en particulier,
– la durée du suivi (temps depuis l’inclusion dans l’étude),
– le temps depuis la dernière transition (durée dans l’état présent).
Il existe plusieurs possibilités pour définir les intensités de transition α(t, d), où t repré-
sente la durée du suivi et d la durée passée dans l’état. Lorsque α(t, d) = α, le modèle est dit
homogène par rapport au temps t. Lorsque α(t, d) = α(t) le modèle est dit non-homogène.
Dans le cas où les intensités de transition dépendent de la durée du suivi, α(t, d) = α(d), le
modèle est semi-Markovien homogène par rapport au temps t. Enfin, lorsque α(t, d) dépend
des deux échelles de temps, le modèle est semi-Markovien non-homogène.
Dans certaines applications, la durée du suivi n’est pas toujours l’échelle de temps la
mieux adaptée. En effet, le temps calendaire et l’âge peuvent également être considérés
comme échelle de temps principale. Par exemple, le temps calendaire peut être adapté
quand on considère le risque de contracter une maladie qui a une incidence variant beaucoup,
comme l’infection par le VIH dans les années 80. Le choix entre les échelles de temps dépend
de ce qui est le plus important dans une application donnée.
Plusieurs modèles statistiques sont possibles, on distingue les appro ches paramétrique,
non-paramétrique et semi-paramétrique.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
6 Introduction
L’approche paramétrique stipule que les intensités de transition appartiennent à une
classe particulière de fonctions, qui dépendent d’un nombre fini de paramètres. L’avantage
de cette approche est la facilitation attendue de la phase d’estimation des paramètres. L’in-
convénient est l’inadéquation pouvant exister entre le modèle retenu et le phénomène étudié.
L’approche non-paramétrique ne nécessite aucune hypothèse sur la forme des in-
tensités de transition et c’est là son principal avantage. L’inconvénient d’une telle approche
est la nécessité de disposer d’un nombre important d’observations. En effet, le problème
de l’estimation d’un paramètre fonctionnel est délicat puisqu’il appartient à un espace de
dimension infinie.
L’approche semi-paramétrique est une sorte de compromis entre les deux approches
précédentes. Les intensités de transition appartiennent à une classe de fonctions pour partie
dépendant de paramètres et pour partie s’écrivant sous forme de fonctions non-paramétriques.
Cette approche est très répandue en analyse de survie au travers du modèle de régression
de Cox (Therneau et Grambsch [2000]).
Le modèle peut également faire intervenir un effet aléatoire qui agit de manière multipli-
cative sur les intensités de transition. Dans les études de survie, ces modèles permettent de
tenir compte de la dépendance entre les temps d’événement sont appelés modèle de fragilité
(frailty model) (Therneau et Grambsch [2000], Hougaard [1995]). Plus généralement, ces
modèles permettent de prendre en compte des variables omises dans la modélisation (par
exemple, les variables non observées, celles dont les effets sont déjà bien connus ou celles
dont il n’est pas certain qu’elles influencent les intensités) (Huber-Carol et Vonta [2004],
Hougaard [2000], Nielsen et al. [1992], Andersen et al. [1993]). Ces modèles sont particu-
lièrement intéressants quand on peut distinguer des groupes d’individus : par exemple, les
personnes d’une même famille auront des caractéristiques génétiques communes. Les carac-
téristiques génétiques étant différentes d’une famille à l’autre, il est intéressant d’avoir un
effet aléatoire spécifique à chaque famille.
Une particularité des données de cohorte réside dans le fait qu’elles ne sont que par-
tiellement observées à cause des différents phénomènes de censure et troncature (à droite,
à gauche, par intervalles). Par exemple, le mécanisme de censure à droite est toujours pré-
sent car on n’observe pas un phénomène sur un temps infini ; le mécanisme de censure par
intervalles intervient quand les temps exacts de transition ne sont pas connus (on sait uni-
quement que les transitions se sont produites pendant un intervalle de temps) (Commenges
[2002]). Les méthodes d’estimation varient en fonction du type de données incomplètes.
Les modèles statistiques faisant intervenir des données censurées considèrent le plus
souvent que le processus de censure est indépendant du processus d’événement. Dans les
études de survie par exemple, cela suppose que le fait qu’un patient soit censuré n’apporte
aucune information sur la survenue de l’événement. Dans le cas du VIH par exemple, les
patients qui arrêtent le suivi sont souvent ceux dont l’état est le plus grave et dont le
moral est affecté. Il est alors nécessaire de proposer des alternatives afin de tenir compte
de l’information comprise dans la censure (Robins et Finkelstein [2000], Minini et Chavance
[2004], Little [1995]).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Structure du document 7
3 Structure du document
Le chapitre I décrit la base de données sur l’asthme qui sera analysée tout au long de
cette thèse. Les notions cliniques essentielles, la définition des états de contrôle de l’asthme,
la structure des différents modèles étudiés et les covariables sont décrites.
Le chapitre II présente les problématiques classiques de l’inférence dans le modèle de
Markov homogène tout en donnant quelques notions et définitions sur les processus. Ce
modèle est appliqué au cas de l’asthme afin d’obtenir des résultats cliniques.
Le chapitre III présente les modèles de semi-Markov et deux méthodes d’estimation des
paramètres du mo dèle : une méthode paramétrique permettant d’estimer la distribution des
temps de séjour et une méthode non-paramétrique permettant d’estimer les intensités du
processus par des fonctions constantes par morceaux. L’application de ces méthodes à la
base de données sur l’asthme est également discutée.
Le chapitre IV s’attache, quant à lui, au modèle de Markov non-homogène. La théorie des
processus de comptage est utilisée pour obtenir des estimations non-paramétriques et semi-
paramétriques des intensités de transitions. Les résultats obtenus dans le cas de l’asthme
sont présentés pour chacune des méthodes.
Le chapitre V décrit une méthode d’estimation permettant de prendre en compte un
mécanisme de censure informative. La métho de IPCW (Robins et Finkelstein [2000]) est tout
d’abord présentée dans le cadre de données de survie ; elle est ensuite généralisée à certains
modèles multi-états, aux modèles progressifs et au modèle avec deux états réversibles. Ces
méthodes sont appliquées au cas de l’asthme où il semble que les patients qui se portent
bien arrêtent le suivi.
Une partie résume ensuite le travail entrepris dans les chapitres précédents.
Enfin, les différentes annexes fournissent des compléments concernant la théorie statis-
tique des processus de comptage et un « guide » visant à faciliter la programmation des
méthodes d’estimation dans le modèle de Markov non-homogène.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
8
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
Chapitre I
Présentation de la base de données
1 Introduction
L’asthme est une maladie chronique réversible provoquant une obstruction bronchique
plus ou moins grave. L’asthme mortel était rare et méconnu avant 1960, année où l’on a
enregistré une épidémie d’asthmes mortels dans les pays anglo-saxons. Une meilleure compré-
hension du traitement de l’asthmatique a permis de réduire le nombre annuel de décès mais,
depuis 1977, une seconde épidémie est apparue dans la plupart des pays développés touchant
de plus en plus d’enfants. L’OMS a modifié en 1979 la classification des maladies, les condi-
tions de diagnostic ont été améliorées, la consommation de médicaments anti-asthmatiques
a augmenté mais cela reste insuffisant puisque la mortalité ne diminue pas. Chaque année
en France, on dénombre environ 2000 décès dont une grande partie pourrait être évitée par
une meilleure connaissance de la maladie, en particulier sa gravité, son évolution, le suivi
et le traitement. En France, il y a 3.5 millions de personnes touchées par l’asthme, plus
particulièrement des enfants et des jeunes adultes. Aux Etats-Unis, il y a plus de 17 millions
d’asthmatiques et il y en aurait plus de 300 millions dans le monde (Masoli et al. [2004]).
Cette prévalence est en constante augmentation dans les pays en voie de développement et
commence à se stabiliser dans les pays industrialisés.
Au sujet de la prévalence imp ortante de l’asthme, il est important de noter qu’il semble
de plus en plus probable qu’il y ait une relation entre l’indice de masse corporelle (IMC
= poids/taille
2
) et les symptômes de l’asthme. Depuis quelques années déjà, l’obésité est un
problème majeur de santé publique dans les pays industrialisés. On note une augmentation
de la prévalence de l’obésité pour les femmes et les hommes et pour tous les âges (adulte
et enfant). Par exemple, une étude récente de la population américaine a montré que la
prévalence du surpoids (IMC > 25) est de 65% et que celle de l’obésité (IMC > 30) est
de 31% (Flegal et al. [2002]). Dans de nombreux pays européens (Angleterre, Allemagne,
Pologne), le pourcentage de personnes obèses dépasse les 15%. Ces cinq dernières années,
de nombreux travaux ont été publiés afin de montrer que le surpoids et l’obésité étaient
des facteurs de risque pour l’asthme à la fois pour les adultes et pour les enfants (Weiss
et Shore [2004]). De plus, l’IMC serait lié à la sévérité de l’asthme et une perte de poids
améliorerait le fonctionnement pulmonaire, les symptômes de morbidité et le niveau général
de santé (Akerman et al. [2004]). L’étude la plus récente suggère que l’obésité pourrait être
en relation avec de nombreuses inflammations (Weisberg et al. [2003]).
9
10 Chapitre I. Présentation de la base de données
L’asthme est une maladie capricieuse, complexe et d’évolution souvent imprévisible.
Notre compréhension de l’évolution de l’asthme est encore insuffisante et bien des asthmes
mortels pourraient être prévenus par une amélioration du suivi thérapeutique et une meilleure
éducation du patient. Certaines études ont montré qu’en France, l’asthme insuffisamment
pris en charge aboutirait trop fréquemment à des formes graves nécessitant une hospitali-
sation en urgence. De plus, on sait que près de 50% des personnes asthmatiques ne suivent
pas le traitement prescrit. Il parait donc indispensable de mieux comprendre l’évolution de
cette maladie. En effet, une meilleure connaissance de l’évolution des patients asthmatiques
peut permettre (i) d’éduquer les malades pour qu’ils disposent des compétences nécessaires
à la bonne prise en charge de leur maladie au quotidien et pour qu’ils adhérent en toute
confiance aux prescriptions et aux conseils du médecin, (ii) aux cliniciens de mieux adapter
les thérapeutiques et les protocoles de suivi afin d’éviter les changements d’états conduisant
aux états de la maladie les plus sévères.
Cependant, dans la littérature, peu d’études se sont intéressées à la modélisation lon-
gitudinale de l’évolution de l’asthme dans un cadre Markovien. Jain [1986] a ajusté un
modèle de Markov à temps discret, Redline et al. [1989] ont utilisé un modèle autorégressif
de type Markovien, alors que Korn et Whittemore [1979] et Ware et al. [1988] présentent
des méthodes d’analyse de données longitudinales appliquées à l’asthme. Plus récemment,
Duchateau et al. [2003] ont utilisé un modèle de fragilité pour étudier les crises d’asthme ;
Boudemaghe et Daures [2000] et Combescure et al. [2003] ont appliqué un modèle de Markov
homogène sans covariable pour modéliser l’évolution du contrôle de l’asthme. On note aussi
que certaines études (Chouaid et al. [2004], Price et Briggs [2002], Paltiel et al. [2001]) se
sont intéressées à des analyses coût-efficacité du traitement de l’asthmatique.
Dans ce qui suit, nous présentons la base de données longitudinales (données répétées
dans le temps) sur l’asthme. Nous définissons le contrôle de l’asthme, les structures des
modèles utilisés et les différentes covariables étudiées. Enfin, nous décrivons succinctement
les caractéristiques des patients lors de leur inclusion dans l’étude.
2 Présentation de la base de données
Afin d’étudier l’évolution de l’asthme et les facteurs qui conditionnent son évolution,
l’ARIA (Association de Recherche en Intelligence Artificielle dans le cadre de l’asthme et des
maladies respiratoires), coordonnée par le professeur P. GODARD, a mis au point en 1994
une cohorte de patients asthmatiques. Cette base est constituée de diverses informations
sur des patients suivis entre 1994 et 2002. Elle est alimentée par un réseau d’experts en
asthmologie issue des CHU français. Les dossiers proviennent essentiellement de patients
suivis dans des centres hospitaliers de Bordeaux, Grenoble, Marseille, Montpellier, Paris,
Strasbourg et Tarbes.
La base est constituée de patients adultes avec un asthme persistant diagnostiqué depuis
au moins un an. Le diagnostic, le suivi et le traitement des patients sont effectués en accord
avec les recommandations internationales du National Institutes of Health [1997]. La base
de données reflète l’activité d’un hôpital avec des patients venant consulter à des intervalles
de temps variables. Il a été demandé aux patients de venir consulter tous les trois mois
ou de venir en fonction de leurs besoins personnels. La base comprend 871 patients, soit
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Présentation de la base de données 11
au total 2386 consultations. A chaque visite, le médecin complète un formulaire ( Juniper
et al. [1999]) renseignant plus de 1700 variables liées à l’asthme. Dans toute cette thèse, on
s’intéresse à l’étude de l’évolution de l’asthme et à l’analyse des données répétées dans le
temps. Ainsi, nous utilisons pour l’analyse une sous base contenant uniquement les patients
ayant au moins deux consultations. L’échantillon comprend 406 patients avec un total de
1639 consultations. Le temps de suivi chronologique est l’échelle de temps de référence. Ce
temps est mesuré à partir de la première consultation du patient. Ainsi, quelque soit le
moment d’entrée dans l’étude, le temps associé à la première consultation sera 0.
Les méthodes présentées aux chapitres III, IV et V prennent en compte certaines durées
dans l’écriture des modèles. Le modèle semi-Markovien (cf. chapitre III) nécessite de définir
la durée dans le dernier état visité. Les modèles de Markov non-homogènes (cf. chapitre IV
et V) font intervenir la durée de suivi. La définition de ces quantités passe par la désignation
d’une date de fin d’étude à partir de laquelle il n’est plus tenu compte de l’information. Cette
date commune à tous les individus est appelée date de point. Dans notre cas, cette date est
définie comme la dernière consultation renseignée dans la base de données, ici, le 4 février
2002.
2.1 Définition des états de contrôle
Afin d’étudier l’évolution de l’asthme par des modèles multi-états, il a d’abord été néces-
saire de définir des états représentant globalement les différents états de santé dans lesquels
peut se retrouver le patient lors de son suivi. Dans le cas de l’asthme, l’état de santé du pa-
tient est souvent établi à l’aide de la notion de contrôle (Godard et al. [1998], Boulet et al.
[1999], Cockcroft et Swystum [1996]). Le contrôle de la maladie renvoie à l’appréciation des
événements (cliniques, fonctionnels et thérapeutiques) sur une période plus courte (7 à 30
jours). Le terme contrôle est synonyme de « maîtrise » de la maladie et reflète d’un certain
point de vue « l’activité » de la maladie sur quelques semaines. Le contrôle est devenu de-
puis quelques années déjà un marqueur fondamental dans le suivi de l’asthmatique. D’après
les recommandations canadiennes (Boulet et al. [1999]), les critères pris en compte sont les
symptômes (fréquence et intensité), le degré d’obstruction bronchique, sa variabilité et la
pression thérap eutique (Tableau I.1).
Définissons les notions intervenant dans la définition du contrôle.
– Le débit expiratoire de pointe (DEP) qui mesure (en litre par minute) le souffle au
moment où l’air sort le plus vite des bronches.
– Une exacerbation (ou attaque d’asthme) est un épiso de de dégradation progressive, sur
quelques jours, d’un ou plusieurs signes cliniques, ainsi que des paramètres fonctionnels
d’obstruction bronchique. Une exacerbation est dite grave quand elle nécessite une
corticothérapie per os (par voie orale) ou si le débit expiratoire de pointe (DEP) a
chuté de plus de 30% au-dessous des valeurs initiales pendant 2 jours successifs.
– Le contrôle optimal est atteint lorsque tous les critères du tableau I.1 sont satisfaits
(c’est-à-dire que pour tout i = 1, ..., 7, S
i
= 0) et que le médecin obtient le meilleur
compromis pour le patient entre le degré de contrôle, l’acceptation du traitement
et la survenue éventuelle d’effets (définition de l’Agence National d’Accréditation et
d’Evaluation en Santé (ANAES [2004])).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
12 Chapitre I. Présentation de la base de données
Critères Valeurs
S
1
: Symptômes diurnes S
1
= 0, si < 4 jours/semaine
S
1
= 1, si > 4 jours/semaine
S
2
: Symptômes nocturnes S
2
= 0, si < 1 nuit/semaine
S
2
= 1, si > 1 nuit/semaine
S
3
: Activité physique S
3
= 0, si absence de limitation
S
3
= 1, si présence de limitation
S
4
: Exacerbations S
4
= 0, si légères ou peu fréquentes
S
4
= 1, si fréquentes
S
5
: Absentéisme professionnel S
5
= 0, si pas d’absentéisme
ou scolaire S
5
= 1, si absentéisme
S
6
: Utilisation de S
6
= 0, si < 4 doses/semaine
bêta-2 mimétiques S
6
= 1, si > 4 doses/semaine
S
7
: DEP S
7
= 0, si > 85 % de la meilleure valeur personnelle
(Débit Expiratoire de Pointe) S
7
= 1, si 6 85 % de la meilleure valeur personnelle
Tab. I.1 – Critères pour le contrôle de l’asthme.
–
Le contrôle sous-optimal est le minimum à rechercher chez tous les patients. Il
est atteint lorsque tous les critères du tableau sont satisfaits (∀ i = 1, ..., 7, S
i
= 0)
mais le meilleur compromis pour le patient entre le degré de contrôle, l’acceptation
du traitement et la survenue éventuelle d’effets n’est pas obtenu (ANAES [2004]).
– Le contrôle inacceptable est défini par la non-satisfaction d’un ou plusieurs critères
de contrôle (c’est-à-dire qu’il existe i tel que S
i
= 1, i = 1, ..., 7). Il représente un état
insatisfaisant qui nécessite une adaptation de la prise en charge (ANAES [2004]).
Le stade sous-optimal est introduit car un contrôle optimal (ou excellent) est parfois
impossible à obtenir. Les trois niveaux de contrôle permettent ainsi de définir l’état de santé
du patient à chaque consultation.
Remarque 1 Plusieurs références bibliographiques sur l’asthme sont disponibles dans Saint-
Pierre et al. [2005a] et Combescure et al. [2003].
Remarque 2 La définition des états de contrôle à partir des variables de la base de données
est détaillée en annexe page 187.
2.2 Définitions des modèles
Au cours de ce document, les méthodes statistiques présentées sont appliquées à la base
de données sur l’asthme. Trois types de modèles seront considérés : un modèle à trois états,
un modèle à deux états et un modèle de survie.
Modèle à trois états
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Présentation de la base de données 13
Les trois états de contrôle étant réversibles, le mo dèle suppose que toutes les transitions
entre les états sont possibles. Le modèle est représenté par la figure I.1.
Etat 2
Contrôle sous
optimal
Etat 1
Contrôle optimal
Etat 3
Contrôle
inacceptable
Fig. I.1 – Modèle à trois états de contrôle pour l’asthme.
Le tableau I.2 décrit la représentativité des 1233 transitions observées et renseignées
dans la base de données. On comptabilise une transition i → j quand on observe un patient
dans l’état i à une consultation et qu’il est observé dans l’état j à la consultation suivante
(i, j = 1, ..., 3). Dans de nombreux cas, on n’observe pas de changement d’état de contrôle
d’une consultation à l’autre (transition i → i). On dénombre un plus grand nombre de
passage de 3 → 1 et 3 → 2 que de 1 → 3 et 2 → 3, ce qui est cohérent avec l’effort du médecin
pour obtenir une amélioration de l’état de contrôle. Notons qu’entre deux consultations
consécutives, il peut y avoir des changements d’état qui ne sont pas observés par les médecins
et qui ne sont pas renseignés dans la base de données.
Transition Effectif Pourcentage
1 → 1 130 10.6%
1 → 2 95 7.7%
1 → 3 44 3.6%
2 → 1 112 9.1%
2 → 2 169 13.7%
2 → 3 71 5.8%
3 → 1 114 9.2%
3 → 2 120 9.7%
3 → 3 378 30.6%
Tab. I.2 – Représentativité des transitions.
Ce modèle à trois états sera utilisé dans tous les chapitres sauf dans le chapitre V où la
méthode ne permet pas d’étudier ce type de modèle.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
14 Chapitre I. Présentation de la base de données
Modèle à deux états
Devant l’impossibilité d’obtenir ce contrôle optimal chez tous les patients asthmatiques,
un rapport de l’ANAES (Agence National d’Accréditation et d’Evaluation en Santé) datant
de septembre 2004 (ANAES [2004]) préconise de fonder le contrôle de l’asthme sur des
critères acceptables. Le contrôle de l’asthme est ainsi défini par deux états :
– un état de contrôle acceptable regroupant l’état optimal et l’état sous-optimal,
– un état de contrôle inacceptable.
Le mo dèle est représenté par la figure I.2.
Etat 1
Contrôle
acceptable
Etat 2
Contrôle
inacceptable
Fig. I.2 – Modèle à deux états de contrôle pour l’asthme.
Le tableau I.3 décrit la représentativité des 1233 transitions. On dénombre 115 transitions
de l’état de contrôle acceptable) vers l’état de contrôle inacceptable (1 → 2) et plus du
double de transitions de l’état inacceptable vers l’état acceptable (2 → 1).
Transition Effectif Pourcentage
1 → 1 506 41%
1 → 2 115 9.3%
2 → 1 234 19%
2 → 2 378 30.7%
Tab. I.3 – Représentativité des transitions.
Cette considération clinique permet de bien différencier le stade le plus grave de la
maladie, mais permet aussi de considérer un modèle plus simple avec moins de paramètres.
Ce modèle sera étudié dans le cadre du modèle de Markov homogène (chapitre II) pour
approfondir les résultats cliniques et être en accord avec les récentes recommandations.
Il sera également utilisé dans l’application des méthodes prenant en compte la censure
informative dans un modèle à deux états réversibles (chapitre V).
Modèle de survie
Le chapitre V présente une méthode d’estimation pour données de survie sous hypothèse
de censure informative. Dans le même temps, il est dans l’intérêt des pneumologues de bien
comprendre le passage dans un état de contrôle inacceptable. Des données de survie sont
obtenues en sélectionnant pour chaque patient, une séquence d’au moins deux consultations
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Présentation de la base de données 15
consécutives commençant par un état acceptable et qui se termine soit par la fin du suivi
soit par un état inacceptable. Le modèle de survie est représenté par la figure I.3.
Après cette sélection, la base comprend 334 patients et un total de 777 consultations.
Deux types de suivi sont rencontrés :
– Les patients qui subissent l’événement, c’est-à-dire des patients qui passent dans l’état
de contrôle inacceptable (24, 8%; n = 83).
– Les patients qui ne subissent par l’événement avant la fin de l’étude (75, 2%; n = 251).
Etat 1
Contrôle
acceptable
Etat 2
Contrôle
inacceptable
Fig. I.3 – Modèle de survie pour l’asthme.
2.3 Covariables
Les résultats cliniques présentés concernent essentiellement l’impact du surpoids sur
l’évolution de l’asthme. Les covariables étudiées sont le traitement par corticoïdes oraux
et inhalés, l’indice de masse corporelle, la présence d’exacerbations, la dose cumulée de
corticoïdes oraux pendant l’année avant l’inclusion et la sévérité. Cependant, de nombreuses
autres covariables ont été étudiées comme par exemple, la présence de rhinite, la durée de
l’asthme, le tabagisme, l’âge ou le sexe, l’atopie (test positif à au moins un allergène). Les
résultats concernant ces covariables ne sont pas présentés dans ce travail car ils sont moins
intéressants et ont parfois une influence mineure sur la maladie. Par exemple, dans notre cas,
le tabagisme ne modifie pas de manière significative l’évolution de la maladie (Ce résultat
peut s’expliquer par le fait que les patients suivis ont des asthmes persistants ; ainsi, il y
a peu de fumeurs dans la base de données et ceux qui fument semblent avoir les asthmes
les moins sévères (Tableau I.6)). De nombreuses autres covariables n’ont pas été prises en
compte car elles sont trop liées à la définition des états de contrôle (par exemple, le débit
d’air expiré). Les covariables étudiées seront codées de manière binaire (codage (0,1)). Ce
codage facilite l’interprétation clinique des résultats en terme de risque relatif, permet de
mieux différencier certains groupes de patients et permet d’avoir des effectifs suffisants dans
chacune des classes ce qui n’est pas toujours le cas avec un codage en plusieurs classes.
Définissons un peu plus en détail les covariables et les codages considérés.
– La dose journalière de corticoïdes oraux : les patients n’ayant pas de traitement par
corticoïdes oraux seront codés 0. La variable vaudra 1 sinon.
– La dose journalière de corticoïdes inhalés : les patients ayant une posologie inférieure
ou égale à 500 µg seront codés 0. La variable vaudra 1 sinon.
– L’indice de masse corporelle : l’IMC est défini comme le poids (en kilogrammes) divisé
par la taille (en mètres) au carré et sert d’indicateur du surpoids et de l’obésité. Un
IMC < 20 correspond à un poids insuffisant, un IMC entre 20 et 25 correspond à
un poids normal, un IMC entre 25 et 30 correspond au surpoids, un IMC entre 30
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
16 Chapitre I. Présentation de la base de données
et 35 correspond à l’obésité et un IMC > 35 correspond à une obésité morbide. Afin
d’étudier l’effet du surpoids, nous considèrerons le codage binaire suivant : les patients
avec un IMC < 25 seront codés 0 et les patients avec un IMC > 25 seront codés 1. Ce
codage permet d’avoir des effectifs suffisants dans chaque classe : en effet, on dénombre
trop p eu de patients obèses et de patients avec un poids trop faible dans la base.
– La sévérité de l’asthme : la sévérité tient compte de l’histoire de la maladie sur une
période plus ou moins longue : 6 à 12 mois. Le niveau de sévérité est fondé sur l’im-
portance des symptômes, le niveau de perturbation des paramètres fonctionnels et sur
les paramètres thérapeutiques. La sévérité peut se définir par le niveau de pression
thérapeutique nécessaire pour obtenir un contrôle durable de la maladie. Cette notion
est différente de celle du contrôle de l’asthme (Combescure et al. [2003], Cockcroft
et Swystum [1996]). La sévérité est codée en 5 catégories numérotées de 1 à 5 et de
sévérité croissante. En suivant les recommandations des cliniciens, les modalités seront
regroupées en deux classes : les patients sévères codés 1 (sévérité 4-5) et les patients
non sévères (sévérité 1-2-3) codés 0. Cette manipulation permet de simplifier l’inter-
prétation clinique en différenciant bien les asthmes les plus graves et permet d’avoir
des effectifs plus conséquents dans chacune des classes.
– Le nombre d’exacerbations : cette variable renseigne sur la fréquence des crises ou
attaques entre deux consultations. Elle sera codé 0 si le nombre d’exacerbations entre
deux consultations est nul et 1 si elles sont au nombre de 1 ou plus. Ceci nous permettra
d’une part de comparer les patients qui n’ont pas d’exacerbations à ceux qui en ont
et d’autre part d’éviter le problème du très faible effectif dans certaines classes.
– La dose cumulée de corticoïdes oraux pendant l’année avant l’inclusion : cette variable
renseigne sur les antécédents de traitement par corticoïdes oraux. Elle est particulière-
ment intéressante dans l’étude de l’impact du surpoids sur l’évolution de l’asthme. En
effet, les traitements par corticoïdes oraux représentent un des biais les plus courants
dans l’étude du surpoids car un de leurs effets secondaires est une prise de poids. Les
patients ayant une dose totale inférieure ou égale à 2 grammes sont codés par 0 et
patients ayant une dose supérieure à 2 grammes sont codés par 1. Ce seuil est fixé par
des spécialistes car apparemment une dose cumulée sur l’année inférieure à 2 grammes
n’entraînerait pas de prise de poids significative.
3 Description de la base à l’inclusion
Nous présentons ici certaines caractéristiques des patients à l’inclusion dans l’étude. Les
variables présentées sont liées au traitement de l’asthme, l’état de la maladie mais aussi le
tabagisme, le sexe, l’age et l’IMC. La table I.4, décrit les variables en fonction de l’état de
contrôle à l’inclusion : état optimal et sous optimal d’un côté et état inacceptable de l’autre.
Les tableaux I.5 et I.6 donnent une description des variables en fonction, respectivement,
de l’IMC (IMC < 25 et IMC > 25) et de la sévérité (non sévère et sévère). Chaque tableau
fournit les p-values obtenues avec les tests de Kruskall-Wallis et du Chi-2 pour repérer des
liens significatifs entre les groupes pour chacune des variables.
Le tableau I.4 fournit des résultats prévisibles à savoir que la sévérité, la présence d’exa-
cerbations et la présence d’une corticothérapie orale sont corrélées avec l’état de contrôle : ces
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Description de la base à l’inclusion 17
caractéristiques sont associées avec un contrôle inacceptable. De même, le débit expiratoire
de p ointe décroît significativement avec un état de contrôle inacceptable.
D’après le tableau I.5, plusieurs variables sont liées avec les groupes associés à l’indice
de masse corporelle. En particulier, les patients en surpoids ont plus tendance à avoir un
asthme sévère, une corticothérapie orale ou inhalée, ou des antécédents de corticoïdes oraux.
Le surp oids semble lié à la sévérité et à la corticothérapie, en particulier par voie orale.
La description des patients à l’inclusion en fonction de la sévérité est présentée dans le
tableau I.6. Le débit expiratoire de pointe, le traitement et l’IMC sont liés avec la sévérité.
Comme précédemment, le surpoids est associé à la sévérité : près de 50% des patients
sévères sont en surpoids. De plus, le tabagisme est associé avec la sévérité : en effet, il y a
plus d’anciens fumeurs parmi les patients avec un asthme sévère. Ces patients semblent plus
réceptifs aux recommandations médicales.
Etat de contrôle
Variables
Contrôle
acceptable
(n = 163)
Contrôle
inacceptable
(n = 243)
p-value
#
Age 41.8 ± 17.8 42.4 ± 15.3 0.84
Femme 84 (51.5 ) 148 (60.9) 0.06
IMC < 25 109 (66.9) 151 (62.1) 0.33
Asthme sévère 12 (7.4) 79 (32.5) < 0.01
Au moins une exacerbation 31 (19) 94 (38.7) < 0.01
Rhinite 107 (69.9) 184 (76.7) 0.14
Atopie 78 (47.8) 122 (50.2) 0.64
Durée de l’asthme 17 ± 14.5 18.3 ± 14.5 0.36
Debit Expiratoire de Pointe 86.6 ± 17.8 71.2 ± 22.8 < 0.01
Antécédents corticoïdes oraux > 2g 14 (8.6) 40 (16.5) 0.03
Traitement avec corticoïdes oraux 19 (11.7) 54 (22.2) < 0.01
Dose corticoïdes inhalés > 500 µg 83 (50.9) 138 (56.8) 0.29
Tabagisme
Non fumeur
Ancien fumeur
Fumeur
124 (76.1)
22 (13.5)
17 (10.4)
166 (68.3)
47 (19.3)
30 (12.4)
0.21
Les résultats sont présentés avec la moyenne ± écart-type ou le nombre (%).
#
p-values calculées avec les tests de Kruskall-Wallis ou du Chi-2.
Tab. I.4 – Caractéristiques des patients lors de l’inclusion dans l’étude en fonction de l’état
de contrôle (acceptable et inacceptable).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
18 Chapitre I. Présentation de la base de données
Indice de Masse Corporelle
Variables IMC < 25
(n = 260)
IMC > 25
(n = 146)
p-value
#
Age 38.1 ± 16.4 49.3 ± 13.7 < 0.01
Femme 160 (61.5) 72 (49.3) 0.02
Asthme sévère 48 (18.5) 43 (29.5) 0.01
Au moins une exacerbation 74 (28.5) 51 (34.9) 0.17
Rhinite 196 (75.4) 95 (65.1) 0.02
Atopie 145 (55.9) 55 (37.7) < 0.01
Durée de l’asthme 16.5 ± 12.8 20.1 ± 16.9 0.16
Debit Expiratoire de Pointe 79.3 ± 21.9 73.8 ± 22.5 0.03
Antécédents corticoïdes oraux > 2g 27 (10.4) 27 (18.5) 0.03
Traitement avec corticoïdes oraux 36 (13.8) 37 (25.3) < 0.01
Dose corticoïdes inhalés > 500 µg 128 (49.2) 93 (63.7) < 0.01
Tabagisme
Non fumeur
Ancien fumeur
Fumeur
183 (70.4)
45 (17.3)
32 (12.3)
107 (73.3)
24 (16.4)
15 (10.3)
0.78
Les résultats sont présentés avec la moyenne ± écart-type ou le nombre (%).
#
p-values calculées avec les tests de Kruskall-Wallis ou du Chi-2.
Tab. I.5 – Caractéristiques des patients lors de l’inclusion dans l’étude en fonction de l’Indice
de Masse Corporelle (IMC < 25 et IMC > 25).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Description de la base à l’inclusion 19
Sévérité de l’asthme
Variables Non sévère
(n = 315)
Sévère
(n = 91)
p-value
#
Age 41.4 ± 16.5 44.7 ± 15.8 0.12
Femme 188 (59.7) 44 (48.3) 0.05
IMC < 25 212 (67.3) 48 (52.8) 0.01
Au moins une exacerbation 95 (30.2) 30 (33) 0.61
Rhinite 223 (73.8) 68 (74.7) 0.86
Atopie 162 (51.4) 38 (41.8) 0.1
Durée de l’asthme 17.6 ± 14.5 18.4 ± 14.9 0.78
Debit Expiratoire de Pointe 83.8 ± 17.3 55.1 ± 23.1 < 0.01
Antécédents corticoïdes oraux > 2g 20 (6.3) 34 (37.4) < 0.01
Traitement avec corticoïdes oraux 37 (11.7) 36 (39.6) < 0.01
Dose corticoïdes inhalés > 500 µg 153 (48.6) 68 (74.7) < 0.01
Tabagisme
Non fumeur
Ancien fumeur
Fumeur
233 (74)
43 (13.6)
39 (12.4)
57 (62.6)
26 (28.6)
8 (8.8)
< 0.01
Les résultats sont présentés avec la moyenne ± écart-type ou le nombre (%).
#
p-values calculées avec les tests de Kruskall-Wallis ou du Chi-2.
Tab. I.6 – Caractéristiques des patients lors de l’inclusion dans l’étude en fonction de la
sévérité de l’asthme (non sévère et sévère).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
20 Chapitre I. Présentation de la base de données
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
Chapitre II
Modèle de Markov homogène et
extensions
1 Introduction
Dans l’analyse de données longitudinales et particulièrement en épidémiologie, les sujets
sont souvent suivis par intermittence et l’information recueillie se présente sous la forme de
mesures ou d’états de santé en plusieurs temps discrets. Il est alors utile de modéliser le
passage des individus entre les différents stades de la maladie. Dans ce contexte, les modèles
multi-états qui fournissent une vision complète et détaillée de l’évolution de la maladie sont
des méthodes intéressantes. Les modèles multi-états à temps continus sont particulièrement
utiles quand les temps de consultation varient d’un individu à l’autre et quand les temps
entre consultations sont variables.
Dans les modèles multi-états, l’hypothèse de Markov est couramment considérée. Cette
hypothèse suppose que l’évolution future du processus dépend uniquement de l’état du pro-
cessus au temps t, autrement dit, l’histoire du processus est résumée par l’état au temps t.
Dans les modèles de Markov, on peut faire différentes hypothèses sur l’évolution du proces-
sus. En particulier, les paramètres du modèle peuvent dépendre ou non de la durée totale
du suivi : on parle alors de modèle non-homogène et de modèle homogène. L’hypothèse
d’homogénéité qui rend les forces de transition constantes au cours du temps simplifie la
modélisation et donne des résultats facilement interprétables d’un point de vue clinique.
Les modèles de Markov homogènes ont été appliqués avec succès dans de nombreux
domaines, en particulier en épidémiologie : par exemple, dans la modélisation des stades
du cancer (Kay [1986], Hsieh et al. [2002]), des stades de l’infection par VIH ( Gentleman
et al. [1994], Longini et al. [1989]) ou encore des stades du diabète ( Marshall et Jones
[1995]). De nombreuses publications sont consacrées au développement de la méthodologie.
Par exemple, Cook [1999] utilise des effets aléatoires dans le cas particulier d’un modèle
à deux états, Satten [1999] utilise des effets aléatoires dans un modèle progressif, Aguirre-
Hernandez et Farewell [2002] développent un test d’ajustement pour des modèles de Markov
stationnaires, Kousignian et al. [2003] utilisent la méthode Monte Carlo Markov Chain pour
estimer les paramètres. Récemment, plusieurs travaux traitent de l’estimation dans le cas
21
22 Chapitre I I. Modèle de Markov homogène et extensions
de données censurées par intervalles (Chen et Cook [2003], Satten [1999], Joly et al. [2002]).
Une vue d’ensemble sur ces modèles est donnée par Hougaard [1999] et Commenges [1999].
Le modèle de Markov homogène est régulièrement utilisé, cependant il impose des
contraintes fortes sur le comportement de l’évolution de la maladie. En effet, les intensi-
tés de transition sont supposées constantes sur une longue période ce qui est restrictif dans
de nombreuses maladies. Il est important d’envisager d’autres hypothèses moins restrictives
par l’intermédiaire des modèles non-homogènes. Par exemple, l’ajustement d’un modèle à
intensités constantes par périodes (Lindsay et Ryan [1993], Alioum et Commenges [2001])
permet de considérer un modèle non-homogène tout en conservant l’hypothèse d’homogé-
néité au sein d’une même période. Ce modèle sera utilisé pour tester la validité de l’hypothèse
d’homogénéité. Une approche par les processus de comptage des modèles non-homogènes
sera présentée au chapitre IV.
L’hypothèse d’homogénéité de la population est aussi contraignante et peut être plus
raisonnable si elle est appliquée dans des sous-groupes. L’incorporation de covariables dans
le modèle permet ainsi d’obtenir des estimations des probabilités de transition ajustées à
chaque groupe de patients. De plus, en considérant un modèle à risques proportionnels, on
peut étudier et quantifier l’impact des covariables sur l’évolution de la maladie. L’introduc-
tion de covariables dépendantes du temps permet d’être plus précis dans l’utilisation de
certaines variables.
L’objectif de ce chapitre est (i) de décrire la méthodologie des modèles de Markov ho-
mogènes à temps continu et d’en donner quelques extensions possibles, (ii) d’appliquer ces
méthodes à la modélisation de l’évolution du contrôle de l’asthme. Il reprend principalement
des résultats faisant l’objet de deux publications liées aux modèles de Markov homogènes.
– Un premier article (Saint-Pierre et al. [2003]) publié dans la revue Statistics in
Medicine. Ce travail reprend une grande partie des problématiques présentes dans
ce type de mo dèle : estimation, modélisation avec covariables dépendantes du temps,
modèle non-homogène par périodes, test des paramètres du modèle et des tests d’adé-
quation. Ce travail décrit également l’application de ces méthodes à un modèle à trois
états de contrôle de l’asthme.
– Un deuxième article (Saint-Pierre et al. [2005a]) soumis dans la revue internationale de
pneumologie Chest. Ce travail approche l’application des modèles Markoviens d’un
point de vue clinique. Il traite de l’impact négatif du surpoids sur l’évolution du
contrôle de l’asthme et a p our objet d’informer les médecins sur les conséquences du
surpoids sur le contrôle du patient.
Ce chapitre se décompose en trois parties. La première partie est consacrée aux dé-
finitions et propriétés des processus Markoviens homogènes. La deuxième partie décrit le
modèle Markovien homogène, l’écriture de la vraisemblance, l’incorporation de covariables
et l’extension à un modèle homogène par périodes. La troisième partie discute l’application
de ces méthodes à un modèle à trois états et présente des résultats sur l’impact négatif du
surpoids dans un modèle à deux états de contrôle.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Définitions et notations 23
2 Définitions et notations
2.1 Processus
Soient F l’espace des temps et (S, S) l’espace des états (un espace mesurable).
Définition 1 Un processus stochastique (Ω, A, P, {ξ (t) , t ∈ F}) est la donnée d’une fonc-
tion aléatoire dependante du temps (t ∈ F) et du hasard (ω ∈ Ω)
ξ : F × Ω → S
: (t, ω) 7−→ ξ (t, ω)
telle que, pour t ∈ F, la fonction ω 7−→ ξ (t, ω) est une variable aléatoire sur (Ω, A, P ) à
valeurs dans (S, S) .
Pour un ω donné, la fonction t 7−→ ξ (t, ω) est la trajectoire du processus.
La notion de processus élargit la notion de variable aléatoire. Un processus sera noté
{ξ (t) , t ∈ F}.
Si S est fini ou dénombrable alors le processus {ξ (t) , t ∈ F} est à espace d’états discret.
Dans le cas contraire, {ξ (t) , t ∈ F} est un processus à espace d’états continu.
Si F = {t
n
} alors le processus est dit à temps discret. Si F est un intervalle de temps de
l’axe R ou si l’ensemble des valeurs de F est continu, alors {ξ (t) , t ∈ F} est un processus
à temps continu (Tableau II.1). Nous parlerons de processus quand l’ensemble des valeurs
de F est continu et de chaîne dans le cas contraire. Notons que la variable t représente en
général le temps mais t peut être de dimension multiple. Les résultats présentés dans cette
thèse concernent des processus à temps continu et à espace d’états fini.
Espace des temps F
Discret Continu
Espace
Discret
Chaîne stochastique
à espace d’état discret
Processus stochastique
à espace d’état discret
d’état K
Continu
Chaîne stochastique
à espace d’état continu
Processus stochastique
à espace d’état continu
Tab. II.1 – Processus stochastiques.
Exemple : Prenons l’exemple d’un service de chirurgie.
– Le nombre d’opérations en attente au temps de la t
`eme
opération est un processus à
espace de temps discret et à espace d’états discret (« nombre d’opérations » )
F = {1, 2, ...} et S = {0, 1, 2, ...}.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
24 Chapitre I I. Modèle de Markov homogène et extensions
– Le nombre d’opérations en cours au temps t, forme un processus à temps continu et
à espace d’états discret
F = {t | 0 6 t < ∞} et S = {0, 1, 2, ...}.
– Le temps d’attente pour la t
`eme
opération est un processus à espace de temps discret
et à espace d’états continu
F = {1, 2, ...} et S = {x | 0 6 x < ∞}.
– Le temps total cumulé de toutes les opérations en cours au temps t forme un processus
à temps continu et à espace d’états continu
F = {t | 0 6 t < ∞} et S = {x | 0 6 x < ∞}.
2.2 Processus Markovien
Un processus de Markov {X(t); t ∈ F} à temps continu et à espace d’états fini est un
processus dont l’évolution future {X(t); t > s} ne dépend de son passé qu’à travers son état
à l’instant s, pour tout t > s
Pr{X(t) = j | X(r) = x
r
, r 6 s} = Pr{X(t) = j | X(s) = x
s
}.
Cette définition signifie que tout le passé du processus est résumé dans l’état précédent
ou encore, le présent étant connu, le futur est indépendant du passé.
Définition 2 (Chaîne de Markov) Un processus de Markov à temps continu et à
espace d’états fini S = {1, ..., k} est complètement défini par
1. Son vecteur des probabilités initiales, noté P
0
tel que
P
0
[j] = Pr {X (0) = j}, j = 1, ..., k
avec
P
p
j=1
P {X (0) = j} = 1,
2. Sa matrice de probabilités de transition : P (s, t) = (p
ij
(s, t))
i,j
telle que
p
ij
(s, t) = Pr {X (t) = j | X (s) = i} ∀ s, t ∈ F et i, j ∈ S,
avec
P (s, s) = Id, et
k
X
j=1
p
ij
(s, t) = 1 pour tout h et 0 6 s 6 t.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Définitions et notations 25
Les probabilités de transition d’un processus Markovien vérifient la relation suivante,
∀i, j ∈ S = {1, ..., k} et ∀ 0 < s < u < t,
p
ij
(s, t) =
X
k∈S
p
ik
(s, u)p
kj
(u, t), (II.1)
Cette propriété est appelée équation de Chapman-Kolmogorov. Sous forme matricielle,
l’équation (II.1) s’écrit
P(s, t) = P(s, u)P(u, t) ∀ s 6 u 6 t.
Les intensités de transition sont d’autres paramètres qui permettent de définir un pro-
cessus de Markov. Soit Q(.)= (q
ij
(.))
i,j
la matrice k × k des intensités de transition,
q
ij
(t) = lim
∆t→0
p
ij
(t, t + ∆t)
∆t
, i 6= j,
q
ii
(t) = −
X
i6=j
q
ij
(t), i = 1, ..., k.
Remarque 3 La propriété de Markov définie ici est dite d’ordre 1 car seul l’état précé-
dent résume le passé. De manière similaire, on définit les chaînes de Markov d’ordre r pour
lesquelles le passé sera résumé par les r états précédents. Ces processus peuvent être inté-
ressants dans les cas où l’évolution du processus est fortement liée au passé (étude d’une
maladie par exemple). Cependant, ils sont peu étudiés et peu utilisés car les définitions des
paramètres font intervenir des temps de transition supplémentaires, ce qui complique consi-
dérablement les définitions et la méthodologie. Dans le cas des chaînes de Markov à temps
discret, il est plus simple d’utiliser des ordres supérieurs mais le nombre de paramètres aug-
mente exponentiellement avec la mémoire de la chaîne ce qui rend la méthode peu exploitable
en pratique.
2.3 Processus Markovien homogène
Un processus de Markov est homogène si la probabilité de transition de l’état i vers j
est définie par
p
ij
(s, t) = Pr {X (t) = j | X (s) = i},
= p
ij
(0, t − s) ,
= P
ij
(t − s) .
Les probabilités de transition dépendent uniquement du temps entre deux transitions et
non du moment où se produisent ces transitions. Dans ce cas particulier, les intensités de
transition du processus sont indépendantes du temps, pour tout i 6= j,
q
ij
(s) = lim
∆t→0
p
ij
(s, s + ∆t)
∆t
= lim
∆t→0
P
ij
(∆t)
∆t
= q
ij
.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
26 Chapitre I I. Modèle de Markov homogène et extensions
A l’aide de l’équation de Chapman-Kolmogorov (II.1), on obtient une équation diffé-
rentielle qui fait le lien entre la matrice des probabilités de transition et les intensités de
transition,
∂P(0, t)
∂t
= P(0, t)Q.
Sachant que P
ii
(0) = 1 et P
ij
(0) = 0, la solution de cette équation est donnée par,
P(0, t) = exp(Q × t). (II.2)
Ainsi, pour le terme P
ii
(.), i ∈ S, cette équation donne,
P
ii
(t) = exp(q
ii
× t)
= exp(−
X
j6=i
q
ij
× t).
P
ii
(t) = p
ii
(0, t) correspond à la probabilité que le processus soit dans l’état i au temps
t sachant qu’il était dans l’état i au temps 0 (L’équation de Chapman-Kolmogorov (II.1)
exprime le fait que le processus a pu transiter par d’autres états pendant cette période).
En pratique, les observations des sujets sont discrètes : on ne dispose d’aucune information
sur l’état du patient entre deux consultations, ainsi, un nombre quelconque de transitions
(non observées) peuvent avoir eu lieu. Par conséquent, dans le cas des modèles avec des états
réversibles, les durées de séjour dans un état donné ne sont pas disponibles. Par contre, si les
états du modèle sont hiérarchiques (pas de retour possible), ce problème ne se p ose plus (car
si l’individu est observé dans le même état, il n’y a pas eu de transitions non observées).
Dans certaines applications, on peut régler le problème de la réversibilité en supposant
que les temps d’observation sont suffisamment rapprochés pour pouvoir considérer qu’il
s’agit d’une observation continue du sujet. Dans ce cas, tous les changements d’états sont
observés et les durées de séjour dans les états sont disponibles. La variable aléatoire T =
« temps passé dans l’état i avant de le quitter » suit une loi exponentielle de paramètre
P
j6=i
q
ij
. Dans les modèles Markoviens homogènes, les distributions du temps d’attente dans
un état sont définies de manière implicite et suivent toujours des lois exponentielles. Ces
lois sont dites sans mémoire car les fonctions de risque associées sont constantes au cours
du temps. On peut aussi noter que le temps moyen passé dans l’état i avant de le quitter
vaut E(T ) = 1/
P
j6=i
q
ij
.
3 Modèle de Markov homogène
En épidémiologie, par exemple, les processus de Markov homogènes peuvent être uti-
lisés pour modéliser l’évolution d’une maladie. L’hypothèse d’homogénéité permet d’avoir
une définition simplifiée des probabilités de transition à partir des intensités de transition
(constantes).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Modèle de Markov homogène 27
3.1 Vraisemblance
Soit {X(t), t ∈ F} un processus de Markov homogène à espace d’états fini S = {1, ..., k}.
Supposons que chaque individu se déplace indépendamment entre les états suivant le pro-
cessus X. Les données observées pour le sujet h , h = 1, ..., n sont
– les temps successifs de suivi T
h,0
< T
h,1
< ..., < T
h,n
h
– les états occupés x
h,j
= X(T
h,j
), j = 0, 1, ..., n
h
.
La contribution à la vraisemblance pour un individu, est le produit des probabilités asso-
ciées à chaque transition observée. Ainsi, la contribution de l’individu h à la vraisemblance
est
l
h
= P
0
[x
h,0
] ×
n
h
Y
j=1
P
x
h,j−1
,x
h,j
(T
h,j
− T
h,j−1
).
La vraisemblance totale est le produit des contributions individuelles,
L =
n
Y
h=1
l
h
. (II.3)
Les probabilités dans la vraisemblance s’obtenant par l’équation (II.2 ), la vraisemblance
dépend alors uniquement des intensités de transition. La méthode du maximum de vraisem-
blance permet d’obtenir les estimations des paramètres. La méthode de la diagonalisation
ou un développement en série entière p euvent être utilisés pour calculer l’exponentielle
matricielle. L’algorithme de quasi-Newton est une méthode simple et efficace p our calculer
l’estimateur du maximum de vraisemblance. Les estimations des écarts-types asymptotiques
peuvent être obtenues à partir de la matrice d’information empirique. Pour une discussion
plus approfondie sur l’estimation dans ces modèles, on pourra consulter Kalbfleisch et Law-
less [1985].
3.2 Incorporation de covariables
Dans bien des applications, on dispose de covariables sur chaque individu et il est parti-
culièrement intéressant d’étudier l’impact de ces covariables sur les paramètres du modèle.
Le modèle peut être étendu de manière simple en considérant un modèle de régression à
intensités proportionnelles (Cox [1972]). Les intensités de transition peuvent s’écrire
q
ij
(z) = q
ij0
exp(β
′
ij
z) i 6= j, (II.4)
avec z un vecteur de covariables indép endantes du temps de dimension s, β
ij
un vecteur de
s coefficients de régression et q
ij0
l’intensité de transition de base associée à la transition
de l’état i vers l’état j. Ce modèle log-linéaire pour les intensités de transition est souvent
utilisé dans la littérature (Andersen et al. [1991], Marshall et Jones [1995]). En effet, les
estimations des intensités de transition sont toujours positives quelles que soient les valeurs
de z et de β
ij
. De plus, ce modèle fournit des résultats en terme de risques relatifs qui sont
facilement interprétables (comme dans le modèle de Cox à risques proportionnels). D’autres
paramétrisations p euvent être plus appropriées dans des applications particulières.
Le modèle peut être adapté afin de prendre en compte des covariables dépendantes
du temps. En effet, la vraisemblance est le produit des contributions associées à chaque
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
28 Chapitre I I. Modèle de Markov homogène et extensions
transition observée dans la base. Le terme P
ij
(t−s | z), peut être remplacé par P
ij
(t−s | z(s))
en supposant que les valeurs des covariables dépendantes du temps restent constantes entre
les deux temps consécutifs s et t. Cette hypothèse de constance des covariables entre deux
consultations peut cependant être forte dans certaines situations, en particulier, lorsque le
temps entre deux consultations est important.
3.3 Modèle de Markov homogène par périodes
Le modèle de Markov homogène avec covariables dépendantes du temps permet de consi-
dérer un modèle non-homogène ou plus précisément un modèle homogène par périodes. L’hy-
pothèse d’homogénéité étant une hypothèse forte, il est utile de la relâcher en considérant
un modèle où les intensités de transition sont constantes au sein d’une même période mais
sont différentes d’une période à une autre.
Considérons une subdivision de l’axe du temps [τ
l−1
, τ
l
), où l = 1, ..., r + 1, τ
0
= 0
et τ
r+1
= +∞, et supposons que pour chaque transition, les intensités sont constantes
dans chaque intervalle. Le temps est mesuré depuis l’origine du processus. Soit z
∗
(t) =
(z
∗
0
(t), z
∗
1
(t), ..., z
∗
r
(t))
′
un vecteur de covariables artificielles défini par
z
∗
0
(t) = 0 ∀t
z
∗
l
(t) =
½
0
1
si τ
0
6 t < τ
l
si t > τ
l
pour l = 1, 2, ..., r.
Les intensités de transition sont données par (i 6= j),
q
ij
(t | z
∗
(t)) = q
ij0
exp{α
′
ij
z
∗
(t)}
=
q
ij0
q
ij1
= q
ij0
exp{α
ij,1
}
.
.
.
q
ijr
= q
ij0
exp{α
ij,1
+ α
ij,2
+ ... + α
ij,r
}
if τ
0
6 t < τ
1
if τ
1
6 t < τ
2
if t > τ
r
.
Les paramètres du modèle sont l’intensité de transition de base q
ij0
et le vecteur des coef-
ficients de régression α
ij
Les intensités de transition sont des fonctions en escalier définies
sur les intervalles pré-spécifiés. On note que ce modèle généralise le modèle homogène en
considérant r = 0.
Pour ajuster ce modèle, la vraisemblance doit être modifiée. En effet, les intensités de
transition sont constantes sur un même intervalle mais sont différentes d’un intervalle à
l’autre. Pour tout i, j ∈ S, p
(l)
ij
(t) représente la probabilité de transition associée à l’intervalle
[τ
l−1
, τ
l
) , ainsi pour l = 1, ..., r + 1,
p
ij
(s, s + t) = p
(l)
ij
(t) si τ
l−1
6 s < s + t < τ
l
.
Pour tout t, considérons I
t
∈ {1, 2, ..., r+1} qui renseigne sur l’intervalle de temps de la forme
[τ
l−1
, τ
l
) contenant t. Pour simplifier les notations, considérons X
1
et X
2
les états occupés
par un individu pour deux temps consécutifs de consultation T
1
et T
2
. Les contributions à la
vraisemblance pour lesquelles les temps consécutifs T
1
et T
2
n’appartiennent pas aux mêmes
intervalles doivent être réécrites à l’aide de l’équation de Chapman-Kolmogorov (II.1). De
manière générale, la contribution à la vraisemblance pour cette observation s’écrit
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Modèle de Markov homogène 29
p
X
1
X
2
{T
1
, T
2
| z
∗
(t), T
1
6 t < T
2
} =
P
k
1
∈S
P
k
2
∈S
...
P
k
v
∈S
[p
(I
T
1
)
X
1
k
1
{τ
I
T
1
− T
1
| z
∗
(T
1
)}
×p
(I
T
1
+1)
k
1
k
2
{τ
I
T
1
+1
− τ
I
T
1
| z
∗
(τ
I
T
1
)} × ···
×p
(I
T
2
)
k
v
X
2
{T
2
− τ
I
T
2
−1
| z
∗
(τ
I
T
2
−1
)}],
où v = I
T
2
− I
T
1
. La vraisemblance s’obtient comme précédemment et l’estimation des
paramètres par maximisation de cette vraisemblance (Kay [1986], Alioum et Commenges
[2001]).
Il est important de noter que le modèle homogène par périodes peut aisément être com-
biné avec le modèle avec covariables de manière à prendre en compte dans la modélisation à
la fois des covariables et des intensités constantes par p ériodes. Cette extension est naturelle
car les deux modèles sont pertinents et mieux adaptés que le modèle homogène simple. Ce-
pendant, en pratique, on peut vite être confronté à un nombre trop important de paramètres
à estimer.
L’utilisation des modèles de rupture peut permettre de déterminer les seuils de la parti-
tion. Par exemple, dans le cas où r = 1 (modèles avec deux périodes), ces modèles peuvent
permettre de déterminer de manière statistique la valeur optimale pour la partition. Ce seuil
permet d’obtenir la meilleure approximation des intensités de transition par une fonction
constante par morceaux.
3.4 Tests d’hypothèses et d’adéquation
Au cours de l’analyse et dans l’interprétation des résultats, il est souvent intéressant et
nécessaire de tester les paramètres et les hypothèses du modèle. Nous rapp elons ici succinc-
tement certains tests possibles dans ce type de modèle.
Afin de simplifier le modèle et de réduire le nombre de paramètres, on peut tester des
hypothèses de la forme H
0
: q
ij
= 0, H
0
: q
ij
= q
hk
ou encore H
0
: β
ij,k
= 0 à l’aide du
test du rapp ort de vraisemblance ou du test de Wald (Cook et al. [2002], Marshall et Jones
[1995], Self et Liang [1987]). Il est particulièrement intéressant d’étudier les coefficients de
régression. En effet, si le coefficient β
ij,k
est statistiquement différent de zéro, alors il y aura
une relation entre la transition de l’état i vers l’état j et la k
i`eme
covariable.
Une hypothèse importante du modèle est l’hypothèse d’homogénéité (intensités de tran-
sitions constantes au cours du temps). Cette hypothèse peut par exemple être testée en
comparant le modèle homogène par périodes avec un modèle homogène : si le modèle ho-
mogène par périodes s’ajuste mieux, alors l’hypothèse d’homogénéité sera trop restrictive
(Kalbfleisch et Lawless [1985], de Stavola [1988]). L’hypothèse de Markov peut être testée
en considérant par exemple une covariable « durée de séjour dans l’état » (Dans un modèle
Markovien, les intensités de transition ne dépendent pas du temps écoulé dans l’état avant
de transiter). L’hypothèse de prop ortionnalité des risques peut être vérifiée en utilisant des
covariables artificielles par exemple (cf. chapitre IV page 96). Plusieurs autres hypothèses
peuvent également être testées en incluant des covariables spécifiques dans le modèle (Kay
[1986]). Enfin, il est possible de se faire une idée de l’adéquation du modèle en comparant
les effectifs observés et les effectifs théoriques obtenus par le modèle (Kalbfleisch et Lawless
[1985], Aguirre-Hernandez et Farewell [2002]).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
30 Chapitre I I. Modèle de Markov homogène et extensions
4 Application à l’asthme
L’ensemble de l’analyse statistique présente dans ce document a été réalisé avec le logiciel
S-P lus (et/ou avec le logiciel R). Les fonctions optim() de R et nlminb() de S-P lus sont
utilisées pour obtenir les estimateurs du maximum de vraisemblance. La fonction optim()
fournit une estimation de la matrice hessienne. Ces fonctions font appel à l’algorithme de
quasi-Newton (Nocedal et Wright [1999]). En ce qui concerne l’initialisation des paramètres,
ceux associés aux intensités de transition sont estimés à partir de simples proportions et ceux
associés aux coefficients de régression sont initialisés à 0 (aucun effet).
4.1 Modèle à trois états
Dans cette partie, un modèle de Markov à trois états (Figure II.1) est considéré pour
modéliser l’évolution du contrôle de l’asthme. La notion de contrôle permettant de définir
les états de santé et le modèle sont présentés au chapitre I page 9.
Etat 2
Contrôle sous
optimal
Etat 1
Contrôle optimal
Etat 3
Contrôle
inacceptable
Fig. II.1 – Modèle à trois états de contrôle pour l’asthme.
Les résultats présentés concernent les covariables dépendantes du temps suivantes :
– l’indice de masse corporelle à chaque consultation : codée 0 si IMC < 25, 1 sinon,
– La sévérité de l’asthme à chaque consultation : codée 0 si le patient est non sévère, 1
sinon,
– La dose de corticoïdes oraux à chaque consultation : codée 0 si la dose est égale à 0
mg, 1 sinon.
Dans un premier temps, un modèle avec une covariable est ajusté pour chacune des
covariables décrites précédemment. Le tableau II.2 fournit les résultats des estimations des
coefficients de régression, des écarts-types et le maximum des p obtenus en testant β
ij
= 0
par le test de Wald et par le test du maximum de vraisemblance (LRT).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
4. Application à l’asthme 31
Transition IMC Sévérité Corticoïdes Oraux
ˆ
β (ec)
1
(p)
2
ˆ
β (ec)
1
(p)
2
ˆ
β (ec)
1
(p)
2
1 → 2 -0.835 (0.537) (0.12) -0.974 (0.439) (0.03) -1.194 (0.482) (0.01)
1 → 3 -0.227 (0.463) (0.62) -0.581 (0.473) (0.22) -1.229 (0.506) (0.01)
2 → 1 -0.693 (0.510) (0.17) -1.615 (0.453) (<0.01) -2.080 (0.480) (<0.01)
2 → 3 -0.029 (0.467) (0.95) 4.715 (0.524) (<0.01) 3.995 (0.545) (<0.01)
3 → 1 -1.424 (0.370) (<0.01) -1.805 (0.306) (<0.01) -1.350 (0.402) (<0.01)
3 → 2 -0.158 (0.354) (0.65) 0.746 (0.438) (0.09) -0.761 (0.487) (0.11)
1
estimations des écarts-types.
2
maximum de p avec le test de Wald et du LRT pour H
0
: β
ij
= 0.
Tab. II.2 – Estimations des coefficients de régression dans un modèle homogène avec une
covariable.
Plusieurs covariables influencent de manière significative les différentes transitions du
modèle, en particulier l’indice de masse corporelle : le coefficient associé à la transition
3 → 1 est le plus important et il est négatif (β
31
= −1.424). Ce résultat peut être interprété
en terme de risques relatifs : en effet, le risque associé à la transition 3 → 1 est divisé
par exp(1.424) pour les patients en surpoids. Autrement dit, les patients en surpoids ont
moins de chances de passer d’un état inacceptable vers un état optimal. Les patients sévères
ont plus de chances de passer de 2 → 3 (β
23
= 4.715) et moins de chances de passer de
3 → 1 (β
31
= −1.805). Ces résultats sur la sévérité confirment ceux obtenus précédemment
(Combescure et al. [2003]) en stratifiant la base de données (résultats non présentés). Les
effets négatifs du traitement par corticoïdes oraux s’expliquent par le fait que ce sont souvent
les patients avec un asthme difficile à contrôler qui ont ce type de traitement. Il serait
intéressant d’utiliser un modèle avec plusieurs covariables pour avoir des résultats ajustés
et pour éviter les biais de confusion. Mais, avec cette base de données, on rencontre des
difficultés dans les procédures de maximisation de la vraisemblance. Dans un mo dèle avec
deux covariables, les estimations sont peu fiables et dépendent fortement des conditions
initiales.
Transition Modèle deux périodes (τ
1
= 100)
ˆ
β (ec)
1
(p)
2
1 → 2 -0.945 (0.417) (0.02)
1 → 3 -1.232 (0.384) (<0.01)
2 → 1 -1.703 (0.437) (<0.01)
2 → 3 2.923 (0.535) (<0.01)
3 → 1 -2.825 (0.474) (<0.01)
3 → 2 0.025 (0.378) (0.93)
1
estimations des écarts-types.
2
maximum des p avec le test de Wald et du LRT pour H
0
: β
ij
= 0.
Tab. II.3 – Estimations des coefficients de régression dans un modèle homogène par période
(2 p ériodes, τ
1
= 100).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
32 Chapitre I I. Modèle de Markov homogène et extensions
Dans un second temps, un modèle homogène par périodes est ajusté afin de vérifier
la validité de l’hypothèse d’homogénéité. Un modèle avec deux périodes est utilisé : les
intensités de transition sont constantes sur [0, τ
1
[ et sur [τ
1
, ∞[. Le tableau II.3 donne
les estimations des coefficients de régression dans un modèle homogène par périodes (deux
périodes, τ
1
= 100 jours). Seul le coefficient associé à la transition 3 → 2 n’est pas significatif.
Le coefficient β
23
est statistiquement p ositif donc le risque pour cette transition est accéléré
dans l’intervalle [100, ∞[, les autres coefficients sont négatifs i.e, le risque diminue avec le
temps. Le test du rapport de vraisemblance et le test de Wald peuvent être utilisés pour
comparer le modèle homogène par périodes et le modèle homogène (modèles emboités).
Pour les seuils suivants : τ
1
= 50, 100, 150, 200, 250 et 300 jours, le modèle homogène par
périodes s’ajuste toujours mieux que le modèle homogène. Ainsi, il semble que l’hypothèse de
constance des intensités de transition au cours du temps (homogénéité) soit trop restrictive
dans le cas de l’asthme.
En supposant que l’information est disponible en continu, tous les changements d’états
sont observés et les durées de séjours sont connues (cette hypothèse entraîne une suresti-
mation des durées de séjours). Ainsi, on peut tester l’hypothèse de Markov en considérant
une covariable « temps de séjour dans l’état avant de transiter ». Si cette variable influence
significativement l’évolution du processus alors l’hypothèse de Markov sera abusive. En effet,
l’hypothèse de Markov implique que les intensités de transition ne dépendent pas du temps
de séjour. On peut par exemple considérer une covariable binaire pour coder la durée de sé-
jour avec plusieurs seuils différents (t = 50, 100, 150, 200, 250, 300). Dans le cas de l’asthme,
si on suppose que les patients viennent consulter quand ils ressentent un changement d’état
et que les temps de consultation sont suffisament proches, on peut considérer que toutes
les transitions sont observées (durées de séjour connues). Dans notre cas, la covariable ar-
tificielle binaire renseignant sur la durée dans l’état avant de transiter modifie de manière
significative les intensités de transition (pour plusieurs seuils) : le plus souvent, plus la du-
rée écoulée avant de transiter est grande moins l’individu a de chances de changer d’état
(résultats non présentés). Ces résultats montrent les limites de l’hypothèse de Markov et
suggèrent l’utilisation de modèles de semi-Markov.
4.2 Modèle à deux états
L’objectif de cette section est de :
(i) compléter la présentation des résultats obtenus en appliquant les mo dèles décrits dans
ce chapitre,
(ii) fournir des résultats aboutissant à des orientations cliniques.
Dans ce qui suit, les résultats portent sur un modèle avec uniquement deux états de
contrôle présenté au chapitre I page 14 (Figure II.2). En effet, un récent rapport de l’ANAES
(Agence National d’Accréditation et d’Evaluation en Santé) (ANAES [2004]) préconisent de
définir le contrôle de l’asthme en deux états afin de bien différencier le stade le plus grave
de la maladie.
Cette considération clinique fournit un modèle plus simple ce qui permet en contre
partie d’introduire plus de covariables dans la modélisation. Le modèle à deux états permet
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
4. Application à l’asthme 33
Etat 1
Contrôle
acceptable
Etat 2
Contrôle
inacceptable
Fig. II.2 – Modèle à deux états de contrôle pour l’asthme.
d’inclure jusqu’à quatre covariables tout en conservant des estimations fiables. Les résultats
ainsi obtenus sont ajustés sur plusieurs covariables ce qui permet de réduire les biais de
confusion et d’avoir des résultats plus intéressants d’un point de vue clinique.
L’impact du surpoids sur l’évolution de l’asthme nous a particulièrement intéressé. En
effet, plusieurs publications récentes montrent que le surpoids semble avoir un lien avec
l’évolution de l’asthme. Cependant, un des biais les plus communs quand on étudie le sur-
poids est lié au traitement par corticoïdes oraux. En effet, la prise de poids est un effet
secondaire de ces traitements. De ce fait, il peut y avoir une confusion entre l’influence
des médicaments et l’influence du surpoids. L’utilisation d’un modèle avec plusieurs cova-
riables permet d’observer l’effet du surpoids en ajustant les résultats sur ces traitements.
Les résultats obtenus ont fait l’objet d’un article soumis dans une revue de pneumologie
(Saint-Pierre et al. [2005a]). Cet article intitulé « Overweighted asthmatics are more diffi-
cult to control », approche le problème d’un point de vue clinique : il donne entre autres,
plusieurs références bibliographiques sur la relation entre l’asthme et le surpoids et présente
une discussion clinique détaillée des résultats.
L’objectif étant d’étudier l’impact du surpoids en tenant compte des possibles facteurs
de confusion, les covariables suivantes sont sélectionnées :
– l’indice de masse corporelle à chaque consultation : codée 0 si IMC < 25, 1 sinon,
– la sévérité à chaque consultation : codée 0 si le patient est non sévère, 1 sinon,
– la dose de corticoïdes oraux à chaque consultation : codée 0 si la dose est égale à 0
mg, 1 sinon,
– la dose cumulée de corticoïdes oraux pendant l’année avant l’inclusion : codée 0 si le
patient a une dose cumulée inférieure ou égale à 2 grammes, 1 sinon.
Le tableau II.4 présente les résultats des estimations des coefficients de régression dans
un modèle avec uniquement l’IMC en covariable (univarié) et dans un modèle avec les quatre
covariables (multivarié).
Le modèle univarié montre un effet significatif du surpoids sur l’évolution de la maladie.
Les patients en surpoids ont un risque plus faible (divisé par exp(0.801) ≈ 2.2) de passer d’un
état de contrôle inacceptable vers un état acceptable (2 → 1). Dans le modèle multivarié,
l’effet du surpoids est toujours significatif même s’il est légèrement atténué (β
21
= −0.637).
Ainsi après ajustement sur certains facteurs de confusion connus, le surpoids diminue de
manière significative le risque de retour vers un état stable (divisé par 1.9). Ces résultats
confirment ceux obtenus avec un modèle à trois états à savoir que les patients en surpoids
avaient un risque plus faible de quitter l’état inacceptable.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
34 Chapitre I I. Modèle de Markov homogène et extensions
Transition Covariables Modèle univarié (IMC) Modèle multivarié
ˆ
β (ec)
1
(p)
2
ˆ
β (ec)
1
(p)
2
IMC -0.129 (0.247) (0.60) -0.174 (0.278) (0.53)
1 → 2 Sévérité 0.665 (0.272) (0.04) 0.820 (0.305) (<0.01)
Corticoïdes Oraux 0.110 (0.269) (0.68) -0.422 (0.305) (0.17)
Antécédent Corticoïde 0.651 (0.262) (0.01) 0.498 (0.299) (0.10)
IMC -0.801 (0.184) (<0.01) -0.637 (0.219) (<0.01)
2 → 1 Sévérité -0.726 (0.203) (<0.01) -0.062 (0.255) (0.81)
Corticoïdes Oraux -1.002 (0.209) (<0.01) -0.693 (0.248) (<0.01)
Antécédent Corticoïde -0.852 (0.212) (<0.01) -0.312 (0.266) (0.24)
1
estimations des écarts-types.
2
maximum des p avec le test de Wald et du LRT pour H
0
: β
ij
= 0.
Tab. II.4 – Estimations des coefficients de régression dans un modèle homogène avec une
covariable (IMC) et dans un mo dèle avec quatre covariables.
Dans les modèles de Markov, il est particulièrement intéressant d’étudier les probabilités
de transition au cours du temps. Ces courbes sont facilement interprétables et permettent
de comparer les probabilités de transition en fonction des caractéristiques des patients. Les
probabilités sont obtenues par l’équation suivante :
P(0, t) = exp(Qt)
avec P (0, t) = (Pr {X (t) = j | X (0) = i})
i,j
, Q = (q
ij
)
i,j
et
q
ij
= q
ij0
exp(β
T
ij
Cov)
La figure II.3 permet d’observer l’impact du surpoids sur la probabilité Pr(X(t) = 1 |
X(0) = 2). Soit Cov, le vecteur composé des quatres covariables suivantes : l’IMC, la
sévérité, le traitement par corticoïdes oraux et les antécédent de corticoïdes oraux. Les
courbes correspondent à différentes valeurs du vecteur Cov :
– les deux courbes du haut représentent les probabilités de transition pour
– Cov = (0, 0, 0, 0) : courbe en trait plein
– Cov = (1, 0, 0, 0) : courbe en pointillé
– les deux courbes du bas représentent les probabilités de transition pour
– Cov = (0, 1, 1, 1) : courbe en trait plein
– Cov = (1, 1, 1, 1) : courbe en pointillé
Sur les deux paires de courbes, la probabilité associée à la transition 2 → 1 est toujours
plus faible pour les patients en surpoids.
5 Discussion
Ce chapitre présente la méthodologie des modèles de Markov homogènes. En particulier,
une extension de ce modèle à un modèle de Markov non-homogène par périodes est proposée.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
5. Discussion 35
0 2 4 6 8 10 12 14
0.0 0.2 0.4 0.6 0.8 1.0
Temps (mois)
Probababililité de transition de l’état 2 vers l’état 1
Fig. II.3 – Probabilités de transition de l’état inacceptable vers l’état acceptable. Les deux
courbes du haut (foncées) sont associées aux patients non sévères, sans corticothérapie orale
et sans antécédents majeurs de corticoïdes oraux. Les deux courbes du bas (claires) sont
associées aux patients sévères, avec une corticothérapie orale et avec des antécédents de
corticoïdes oraux. IMC < 25 : courbes en trait plein, IMC > 25 : courb es en pointillé.
Cette extension permet d’affaiblir l’hypothèse d’homogénéité dans la modélisation et de
pouvoir tester cette hypothèse en comparant les deux modèles. Nous avons ensuite discuté
l’application de ces méthodes au cas de l’asthme et particulièrement étudié l’impact du
surpoids sur l’évolution de la maladie dans un modèle à deux états de contrôle. Les résultats
sont très intéressants, en effet, un patient en surpoids dans un état de contrôle inacceptable a
moins de chances de revenir vers un contrôle acceptable indépendamment de son traitement
et de sa sévérité. Ce résultat qui fait l’objet d’une publication dans une revue médicale
corrobore et renforce les conclusions de plusieurs travaux visant à montrer un lien entre
l’asthme et le surpoids.
Ces modèles s’avèrent être des outils attractifs pour la modélisation des données lon-
gitudinales. Les modèles Markoviens continus permettent de modéliser des données où les
individus sont observés en des temps différents, c’est-à-dire que les dates de consultation
peuvent être quelconques pour chaque patient et que le temps entre deux consultations n’est
pas constant. L’hypothèse d’homogénéité facilite l’approche méthodologique et la program-
mation des méthodes. De plus, dans le modèle homogène, les résultats obtenus à partir des
coefficients de régression et des probabilités de transition sont facilement interprétables d’un
point de vue clinique. Ces modèles représentent ainsi une alternative de plus en plus utilisée
dans la modélisation des suivis médicaux.
Cependant, on rencontre quelques difficultés dans l’estimation quand le nombre de pa-
ramètres du modèle est trop important ce qui nous conduit à restreindre la complexité du
modèle. Il y a aussi des limites dues aux hypothèses du modèle. En particulier, l’hypothèse
d’homogénéité est souvent trop restrictive : en effet la durée du suivi peut comme dans
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
36 Chapitre I I. Modèle de Markov homogène et extensions
l’asthme influencer les probabilités de transition. L’hypothèse de Markov peut aussi être
une hypothèse forte, puisqu’elle suppose que le temps écoulé dans un état avant de transiter
n’influence pas les intensités de transition.
Au vue des résultats obtenus sur la base, l’hypothèse d’homogénéité est trop contrai-
gnante. Ainsi, les modèles Markoviens non-homogènes semblent une alternative intéressante
puisque qu’ils considèrent que les intensités de transition d’un état à un autre de la mala-
die dépendent de la durée du suivi. De même, il semble que la durée écoulée dans un état
avant de transiter influence l’évolution de l’asthme. Cela suggère l’ajustement d’un modèle
semi-Markovien afin d’accorder de l’importance à cette échelle de temps. Dans ce modèle,
les distributions des temps de séjour ne sont plus des lois exponentielles comme dans le cas
Markovien homogène : on peut choisir d’autres distributions paramétriques ce qui conduit
à augmenter le nombre de paramètres à estimer.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
Chapitre III
Modèle semi-Markovien homogène
1 Introduction
Les modèles Markoviens homogènes ont été appliqués avec succès dans de nombreux
domaines et sont utilisés de plus en plus fréquemment. Cependant, dans ces modèles, l’évo-
lution du processus est indépendante du temps déjà passé dans l’état actuel. Dans le do-
maine clinique par exemple, cette hypothèse correspond rarement à la réalité. Les processus
semi-Markoviens constituent alors une alternative intéressante puisqu’ils intègrent dans la
définition du modèle les lois de temps de séjour dans l’état. Un processus semi-Markovien
dont les temps de séjour suivent des lois exponentielles devient un processus Markovien
homogène. Les modèles semi-Markoviens généralisent ainsi les modèles Markoviens dans le
sens où ils permettent de définir explicitement les lois des temps de séjour dans les états.
Les modèles semi-Markoviens commencent à être utilisés dans plusieurs domaines. En
épidémiologie, Huber-Carol et Pons [2004] ont appliqué ces modèles à la transplantation
cardiaque, Heutte et al. [2001] ont modélisé l’évolution d’un patient atteint du VIH, alors
que Dabrowska et al. [1994] ont étudié la greffe de moelle osseuse. Ils sont aussi appliqués
en fiabilité, Perez-Ocon et Torres-Castro [2002], dans les sciences sociales p our la recherche
d’emploi, par exemple Vassiliou et Papadopoulou [1992], et en finance, Janssen et al. [1997].
Dans la littérature, on rencontre plusieurs méthodes d’estimation correspondant à différentes
utilisation de ces modèles dans un cadre discret ou continu, à espace d’états fini ou non.
On peut citer par exemple les ouvrages de Janssen [1986] et de Janssen et Limnios [1999]
qui présentent de nombreuses méthodes d’estimation dans un cadre paramétrique et non-
paramétrique. Les modèles semi-Markoviens ont été étudiés dans un cadre non-homogène par
Vassiliou et Papadopoulou [1992] et Papadopoulou et Vassiliou [1994], alors que Sternberg et
Satten [1999] se sont intéressés aux problèmes de données censurées par intervalles ou tron-
quées. On peut ajouter qu’il est aussi possible d’obtenir des estimations non-paramétriques
dans les modèles semi-Markoviens en utilisant la théorie des processus de comptage comme
nous le verrons au chapitre suivant (Gill [1980], Andersen et al. [1993]).
Après avoir présenté les processus semi-Markoviens, nous étudierons deux méthodes
pour estimer les paramètres de tels modèles. Dans un premier temps, nous étudierons une
méthode d’estimation non-paramétrique des intensités de transition du processus. L’esti-
mation consiste à approximer ces intensités par des fonctions constantes par morceaux et
37
38 Chapitre I II. Modèle semi-Markovien homogène
à maximiser la vraisemblance modifiée. Après avoir obtenu les estimations des intensités
du processus, il sera possible de déduire un estimateur de la matrice des probabilités du
processus semi-Markovien. Les estimateurs présentés dans ce travail sont une généralisa-
tion des estimateurs obtenus par Ouhbi et Limnios [1999] dans le cas d’un seul processus
censuré. Les estimateurs sont adaptés au cas de plusieurs processus afin d’obtenir des esti-
mations à partir d’un échantillon de processus. De plus, ces estimateurs sont présentés sous
une forme plus générale permettant de prendre en compte des modèles avec un ou plusieurs
états absorbants. Ces généralisations sont très utiles dans l’étude des maladies où l’on utilise
souvent des modèles avec des états absorbants et où l’on dispose d’un processus pour chaque
individu inclus dans l’étude.
Nous présenterons ensuite une méthode d’estimation dite paramétrique qui consiste à
modéliser la distribution du temps de séjour dans l’état par une fonction paramétrique
(Perez-Ocon et Ruiz-Castro [1999], Foucher et al. [2004]). L’approche présentée permet de
choisir une distribution de temps de séjour et un nombre spécifique de covariables pour
chaque transition. Plusieurs distributions sont utilisées pour la modélisation des temps de
séjours : exponentielle, Weibull et Weibull généralisée qui sont particulièrement bien adap-
tées pour la modélisation des données médicales. La méthode du maximum de vraisemblance
permet d’obtenir les estimations des distributions des temps de séjour et des intensités de
transition du processus semi-Markovien.
Ce chapitre se terminera par l’application des modèles semi-Markoviens à la base de
données de patients asthmatiques. En effet, comme nous l’avons vu dans le chapitre pré-
cédent, l’hypothèse d’intensités de transition constantes au cours du temps des modèles
Markoviens homogènes semble abusive. De plus, dans le cas de l’asthme, il semble que le
temps passé dans un état ait un impact sur l’évolution des patients. Les cliniciens pensent
qu’un individu qui a déjà passé un temps important dans un état stable sera d’autant plus
stable dans son évolution future. Nous discuterons l’application des méthodes étudiées, nous
comparerons les méthodes d’estimations et nous interprèterons les résultats obtenus afin de
mieux comprendre l’apport de ces modèles dans le cas de l’asthme.
2 Préliminaires
Cette partie, inspirée des travaux de Foucher [2004], Ouhbi et Limnios [1999] et Da-
browska et al. [1994], présente les processus semi-Markoviens homogènes à temps continu.
Sont rappelées notamment les définitions et les propriétés de ces pro cessus, les équations
permettant d’obtenir les probabilités de transition du processus et l’écriture de la vraisem-
blance dans les modèles semi-Markoviens.
2.1 Définitions
On considère (J
n
, S
n
)
n>0
un processus semi-Markovien, où 0 = S
0
< S
1
< ··· < S
n
<
··· sont les temps consécutifs d’entrée dans les états J
0
, J
1
, ..., J
n
, ... avec J
n
6= J
n+1
, ∀n > 0.
(J
n
)
n>0
est une chaîne de Markov homogène à valeurs dans l’espace d’état fini E = {1, ..., s}.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Préliminaires 39
X
0
, X
1
, X
2
, ... définis par X
0
= 0 et X
n
= S
n
−S
n−1
, représentent les temps de séjour dans
ces états.
Un pro cessus semi-Markovien homogène peut être entièrement déterminé par
(i) sa loi initiale : Pr(J
0
= k) = p(k)
(ii) le noyau semi-Markovien
Q
ij
(d) = Pr(J
n+1
= j, X
n+1
6 d | J
0
, ..., J
n
= i, X
1
, ..., X
n
)
= Pr(J
n+1
= j, X
n+1
6 d | J
n
= i), (III.1)
Les probabilités de transition de la chaîne de Markov (J
n
)
n>0
sont définis par
p
ij
= lim
d→∞
Q
ij
(d)
= Pr(J
n+1
= j | J
0
, J
1
, ..., J
n
= i)
= Pr(J
n+1
= j | J
n
= i) (III.2)
Le processus (J
n
)
n>0
est une chaîne de Markov sous-jacente qui ne gère pas le temps,
mais seulement la séquence des états. Les temps de séjour dans les états sont renseignés
par le processus (X
n
)
n>0
. D’après (I II.1), les distributions des temps de séjour dépendent
uniquement des états contigus : en effet, le passé de l’individu est résumé uniquement par
le dernier état visité (Markov d’ordre 1). De plus, les distributions des temps de séjour sont
des variables aléatoires positives indépendantes sachant la séquence des états. Notons que
dans les définitions (III.1) et (III.2), l’indice n n’a pas d’importance, ce qui signifie que le
processus est homogène sur le temps chronologique. Grâce à l’hypothèse d’homogénéité, ces
quantités dépendent de l’état précédent et non du couple (état, temps d’entrée). Notons que
J
n
6= J
n+1
, c’est-à-dire qu’une transition vers le même état est impossible, ainsi, Q
ii
(d) ≡ 0
∀i ∈ E, (p
ii
= 0, ∀i ∈ E).
La fonction de distribution du temps de séjour dans l’état i avant d’aller dans l’état j,
est définie par
F
ij
(d) = Pr(X
n+1
6 d | J
n
= i, J
n+1
= j)
=
(
Pr(X
n+1
6d,J
n+1
=j|J
n
=i)
Pr(J
n+1
=j|J
n
=i)
0
si Pr(J
n+1
= j | J
n
= i) > 0
sinon
=
(
Q
ij
(d)
p
ij
0
si p
ij
> 0
sinon
S
ij
(.) = 1 − F
ij
(.) est la fonction de survie correspondant à F
ij
(.). Dans la pratique, l’état
dans lequel va passer le processus est incertain. Ainsi, on définit la fonction de distribution
du temps de séjour dans l’état i,
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
40 Chapitre I II. Modèle semi-Markovien homogène
H
i
(d) = Pr(X
n+1
6 d | J
n
= i)
=
s
X
j=1
Pr(X
n+1
6 d, J
n+1
= j | J
n
= i)
=
s
X
j=1
Q
ij
(d) (III.3)
=
s
X
j=1
F
ij
(d)p
ij
On peut définir les fonctions de survie correspondantes, S
i
(.) = 1−H
i
(.) et S
ij
(.) = 1−F
ij
(.),
S
i
(d) = Pr(X
n+1
> d | J
n
= i)
=
s
X
j=1
p
ij
S
ij
(d) (III.4)
S
i
(d) représente la probabilité que l’individu survive dans l’état J
n
= i jusqu’au temps
S
n
+ d.
En supposant que Q
ij
(.) est absolument continue par rapport à la mesure de Lebesgue,
on peut définir q
ij
(.) la densité de Q
ij
(.),
q
ij
(d) = lim
∆d→0
1
∆t
Pr(J
n+1
= j, d < X
n+1
6 d + ∆d | J
n
= i),
et f
ij
(.) la densité de F
ij
(.),
f
ij
(d) = lim
∆d→0
1
∆d
Pr(d < X
n+1
6 d + ∆d | J
n
= i, J
n+1
= j)
=
(
q
ij
(d)
p
ij
0
si p
ij
> 0
sinon.
(III.5)
Par définition, les intensités de transition instantanées du noyau semi-Markovien, ∀i, j ∈
E, sont données par l’expression suivante
λ
ij
(d) = lim
∆d→0
1
∆d
Pr(J
n+1
= j, d < X
n+1
6 d + ∆d | J
n
= i, X
n+1
> d)
= lim
∆d→0
1
∆d
Pr(J
n+1
= j, d < X
n+1
6 d + ∆d, X
n+1
> d | J
n
= i)
Pr(X
n+1
> d | J
n
= i)
=
(
q
ij
(d)
1−H
i
(d)
0
si p
ij
> 0 et H
i
(d) < 1
sinon.
=
(
p
ij
f
ij
(d)
S
i
(d)
0
si p
ij
> 0 et S
i
(d) > 0
sinon.
(III.6)
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Préliminaires 41
En fait, λ
ij
(d)∆d+o(∆d), i 6= j, représente la probabilité que le processus transite dans l’état
j dans ]d, d + ∆d] sachant qu’il est resté un temps d dans l’état i. La force de changement
d’état λ
ij
(.) sera d’autant plus grande que la densité f
ij
(.) et la probabilité p
ij
seront grandes
et que la survie S
i
(.) sera petite.
Cette fonction de risque du processus semi-Markovien ne doit pas être confondue avec
la fonction de risque de la loi des temps de séjour qui suppose, par définition, que l’état
d’arrivée est connu. Les fonctions de risque des temps de séjour sont données par
˜α
ij
(d) = lim
∆d→0
1
∆d
Pr(d < X
n+1
6 d + ∆d | X
n+1
> d, J
n
= i, J
n+1
= j). (III.7)
Remarque 4 Dans les définitions, l’indice n renseigne sur le numéro de la transition, S
n
sur les temps de sauts, J
n
sur les états et X
n+1
sur la durée écoulé dans l’état J
n
. D’autres
notations issues des processus de comptage peuvent être utilisées. On considère N
ij
(t) un
processus de comptage du nombre de transitions observées de l’état i vers l’état j dans [0, t],
où t est le temps chronologique,
N
ij
(t) =
X
n>0
11
{S
n
6t,J
n
=i,J
n+1
=j}
(t).
N
ij
(.) est un processus cadlag avec des sauts de 1, N
ij
(0) = 0 (cf. chapitre IV). On définit
ensuite
N(t) =
X
i,j∈E
N
ij
(t),
comptant le nombre total de transitions observées dans [0, t]. Ainsi, l’état du processus au
temps t (souvent noté J(t) dans la littérature) peut s’écrire J
N(t)
. (J
N(t)
, t ∈
¯
R
+
) contient
la même information que le processus Z = (J
n
, S
n
)
n>0
.
2.2 Probabilités de transition du processus semi-Markovien
Dans cette section, on s’intéresse à la probabilité de transition du processus semi-
Markovien. Comme nous l’avons vu dans la section précédente (cf. Remarque 4), le processus
semi-markovien Z = (J
n
, S
n
)
n>0
peut aussi s’écrire Z(t) = J
N(t)
. J
N(t)
représente l’état du
processus au temps t, ou l’état après N(t) sauts. Les probabilités de transition du processus
P
ij
(s, t) sont définies par
P
ij
(s, t) = Pr(J
N(t)
= j | J
N(s)
= i)
Par la propriété d’homogénéité de la chaîne de Markov sous-jacente (J
n
)
n>0
, les probabilités
de transition vérifient la propriété suivante,
P
ij
(t, t + d) = Pr(J
N(t+d)
= j | J
N(t)
= i)
= Pr(J
N(d)
= j | J
N(0)
= i)
= P
ij
(0, d)
= Ψ
ij
(d).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
42 Chapitre I II. Modèle semi-Markovien homogène
La propriété d’homogénéité de la chaîne de Markov est transmise au processus semi-Markovien.
Les probabilités de transition du processus semi-Markovien homogène sont définies par
l’équation suivante,
Ψ
ij
(t) = Pr(Z(t) = j | Z(0) = i)
=
s
X
r=1
Z
t
0
p
ir
f
ir
(u)Ψ
rj
(t − u)du + δ
ij
s
X
r=1
p
ir
S
ir
(t) (III.8)
où δ
ij
= 1 si i = j et 0 sinon. Afin d’obtenir l’écriture des probabilités Ψ
ij
(t), on peut
considérer les deux cas suivants :
– Cas i 6= j : dans ce cas, au moins un événement s’est produit entre [0, t] (car une
transition vers le même état est impossible). Pour écrire la probabilité de transition,
on considère un conditionnement sur le premier événement qui est couramment utilisé
dans la théorie du renouvellement. Ainsi la probabilité Ψ
ij
(t) peut s’écrire,
Ψ
ij
(t) = Pr(J
N(t)
= j | J
N(0)
= i)
= Pr(J
N(t)
= j, X
1
6 t | J
0
= i)
=
s
X
r=1
Pr(J
N(t)
= j, X
1
6 t, J
1
= r | J
0
= i) (III.9)
Il faut déterminer la probabilité que le processus soit dans l’état j sachant que l’état
initial est i et que le premier nouvel état est r. Le calcul de cette probabilité peut
s’obtenir dans un cadre formel à l’aide du produit de convolution. Cependant, l’écri-
ture de cette probabilité peut aussi s’obtenir de manière plus intuitive. En effet, en
considérant x le temps d’entrée dans le premier état, la probabilité cherchée s’écrit
comme le produit des probabilités suivantes :
– la probabilité que le sujet reste dans l’état i un temps x, i.e, S
i
(x),
– la probabilité qu’il transite de l’état i vers l’état r au temps x, i.e, λ
ir
(x),
– la probabilité que l’individu soit dans l’état j au temps t sachant qu’il était dans
l’état r au temps x, i.e, P
rj
(x, t) = Ψ
rj
(t − x).
La probabilité Ψ
ij
(t) s’exprime ensuite à l’aide d’une intégrale afin de prendre en
compte tous les temps x ∈ [0, t],
Pr(J
N(t)
= j, X
1
6 t, J
1
= r | J
0
= i) =
R
t
0
S
i
(u)λ
ir
(u)Ψ
rj
(t − u)du
=
R
t
0
p
ir
f
ir
(u)Ψ
rj
(t − u)du.
L’équation (III.9) permet ensuite d’obtenir la probabilité cherchée.
– Cas i = j : dans ce cas, soit au moins deux événements se produisent dans [0, t] soit
aucun événement ne se produit. Ψ
ij
(t) peut alors s’écrire
Ψ
ij
(t) = Pr(J
N(t)
= i | J
N(0)
= i)
=
Pr(J
N(t)
= i, N(t) > 0 | J
0
= i)
|
{z }
+ Pr(J
N(t)
= i, N(t) = 0 | J
0
= i)
|
{z }
A B
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Préliminaires 43
A se calcule de manière identique au cas i 6= j. La probabilité B s’exprime en terme
de survie (III.4),
B = Pr(X
1
> t | J
N(0)
= i) = S
i
(t) =
s
X
r=1
p
ir
S
ir
(t).
Ainsi la probabilité cherchée est,
Ψ
ij
(t) =
s
X
r=1
Z
t
0
p
ir
f
ir
(u)Ψ
rj
(t − u)du +
s
X
r=1
p
ir
S
ir
(t).
L’utilisation du symbole de Kroneker δ
ij
permet de généraliser l’écriture des Ψ
ij
(t)
aux deux cas possibles.
2.3 Fonction de vraisemblance
Considérons un échantillon de n individus (h = 1, ..., n). Pour l’individu h, considérons
0 = S
h,0
< S
h,1
< ··· < S
h,N
h
les temps de sauts. A ces temps, l’individu a successivement
occupé les états J
h,0
, J
h,1
, ..., J
h,N
h
avec J
h,p
6= J
h,p+1
, où N
h
est le nombre de sauts du
processus associé à l’individu h à la date de point (N
h
> 0). En utilisant ces notations,
S
h,N
h
représente le dernier temps d’entrée dans un état et J
h,N
h
le dernier état occupé
par l’individu h. Considérons X
h,p
= S
h,p
− S
h,p−1
, le temps de séjour dans l’état J
h,p−1
,
p = 1, ..., N
h
.
Dans tout ce chapitre, on considère le cas de données censurées à droite. De plus, on
suppose que la censure n’apporte aucune information sur l’événement étudié (censure indé-
pendante). Le phénomène de censure à droite est étudié plus en détails aux chapitres IV
page 76. Dans le cas semi-Markovien, la censure à droite empêche l’observation du temps
de séjour dans le dernier état visité. Notons qu il est supposé que les temps de transition
entre les états correspondent aux temps d’observation (de la base de données). Dans le cas
des mo dèles avec états absorbants, on rencontre de deux types d’« histoires ».
– Soit l’individu h rentre dans un état absorbant, son « histoire » n’est pas censurée,
H
h
(t) = (J
h,0
, J
h,1
, ..., J
h,N
h
, X
h,1
, X
h,2
, ··· , X
h,N
h
).
– Soit l’individu h n’entre pas dans un état absorbant. Dans ce cas, le temps de séjour
dans le dernier état visité (J
h,N
h
) est censuré à la date de fin d’étude. L’« histoire »
de l’individu est
H
h
(t) = (J
h,0
, J
h,1
, ..., J
h,N
h
, X
h,1
, X
h,2
, ··· , X
h,N
h
, U
h
).
où U
h
représente la durée écoulée entre S
h,N
h
et la date de fin d’étude.
Ainsi, deux types de contribution à la vraisemblance sont possibles.
(i) Soit l’individu reste un temps d dans l’état i et ensuite, il transite dans l’état j (j 6= i),
dans ce cas où la transition est observée, la contribution à la vraisemblance est
S
i
(d)λ
ij
(d) = p
ij
f
ij
(d) = q
ij
(d).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
44 Chapitre I II. Modèle semi-Markovien homogène
(ii) Soit l’individu reste un temps d dans l’état i et il est censuré. Dans ce cas de censure à
droite où le temps de séjour est censuré, la contribution à la vraisemblance s’exprime
en terme de survie par
S
i
(d) =
s
X
j=1
p
ij
S
ij
(d).
Ainsi, en considérant δ
h
qui vaut 1 si l’individu est censuré et 0 sinon, la contribution à
la vraisemblance de l’individu h s’écrit
L
h
=
N
h
Y
k=1
p
J
h,k−1
J
h,k
f
J
h,k−1
J
h,k
(X
h,k
) ×
h
S
J
h,N
h
(U
h
)
i
δ
h
La vraisemblance totale est obtenue en faisant le produit des contributions individuelles,
L =
n
Y
h=1
L
h
. (III.10)
3 Estimation paramétrique des temps de séjour
3.1 Introduction
La méthode d’estimation paramétrique repose sur une estimation des lois des temps de
séjour par des fonctions paramétriques. Rappelons la définition des fonctions de risque des
temps d’attente dans les états,
˜α
ij
(d) = lim
∆t→0
1
∆d
Pr(d < X
n+1
6 d + ∆d | X
n+1
> d, J
n
= i, J
n+1
= j)
=
½
α
ij
(d)
0
si J
n
= i et X
n+1
> d,
sinon.
L’estimation paramétrique va supposer que les fonctions de risque α
ij
(.) appartiennent à une
classe de fonctions paramétriques. Les fonctions S
ij
(.) et f
ij
(.) correspondant respectivement
aux fonctions de survie et de densité associées aux fonctions de risque α
ij
(.) peuvent s’écrire
à partir de α
ij
(.).
∂S
ij
(d)
∂d
= − lim
∆d→0
1
∆d
Pr(d < X
n+1
6 d + ∆d | J
n
= i, J
n+1
= j)
= − lim
∆d→0
1
∆d
Pr(d < X
n+1
6 d + ∆d | X
n+1
> d, J
n
= i, J
n+1
= j)
× Pr(X
n+1
> d | J
n
= i, J
n+1
= j)
= −S
ij
(d) × lim
∆d→0
1
∆d
Pr(d < X
n+1
6 d + ∆d | X
n+1
> d, J
n
= i, J
n+1
= j)
= −S
ij
(d) × α
ij
(d).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Estimation paramétrique des temps de séjour 45
La résolution cette équation différentielle sachant que S
ij
(0) = 1, donne
S
ij
(d) = exp(−
Z
d
0
α
ij
(u)du). (III.11)
De plus, comme S
ij
(.) = 1 − F
ij
(.) et comme f
ij
(.) est la densité de F
ij
(.), on peut déduire
l’écriture suivante pour f
ij
(.)
f
ij
(d) = −
∂S
ij
(d)
∂d
= S
ij
(d)α
ij
(d). (III.12)
3.2 Modèle à risques proportionnels
Dans l’étude des maladies chroniques, il est important d’étudier l’impact de divers fac-
teurs sur l’évolution de la maladie. En effet, l’utilisation de covariables permet de prendre
en compte l’hétérogénéité de la population et d’obtenir des résultats adaptés aux caracté-
ristiques des patients. L’utilisation de cette méthode paramétrique permet d’incorporer des
covariables dans la modélisation des fonctions de risque des temps d’attente. Nous utiliserons
à cet effet, un modèle à risques proportionnels (Cox [1972]).
Considérons (J
n
, S
n
)
n>0
un processus semi-Markovien. Les covariables sont introduites
dans les fonctions de risque des temps d’attente dans les états. La chaîne de Markov sous-
jacente (J
n
)
n>0
ne dépend pas du vecteur de covariables et ainsi la chaîne conserve la
probabilité de transition p
ij
= Pr(J
n+1
= j | J
n
= i). Les fonctions de risque du processus
semi-Markovien ne dépendent pas directement des covariables. Cependant comme ils sont
définis à l’aide des risques de temps d’attente, l’effet des covariables sera quand même
répercuté même s’il ne pourra pas s’interpréter en termes de risque relatif. En reprenant les
notations utilisant le processus de comptage N(t), les fonctions d’intensité ˜α
ij
(t) peuvent
s’écrire
˜α
ij
(t − S
N(t
−
)
) = 11
{J
N(t
−
)
=i}
α
ij
(t − S
N(t
−
)
).
où t représente le temps chronologique.
Considérons z
ij
(.) = (z
1
ij
(.), z
2
ij
(.), ..., z
n
ij
ij
(.)) un vecteur de covariables associé à la tran-
sition de l’état i vers l’état j, tel que n
ij
soit le nombre de covariables pour cette transition.
Cette notation permet d’ajuster un modèle où le nombre de covariables est spécifique à
chaque transition. Les covariables peuvent être dépendantes du temps, cependant il est né-
cessaire de supposer que la valeur des covariables ne change pas entre deux consultations.
Afin de simplifier les calculs et les écritures, on supposera dans ce qui suit que les covariables
sont fixées au cours du temps d’attente : z
ij
(t) = z
ij
. On suppose que les covariables vont
modifier les fonctions d’intensité en suivant un modèle à risques proportionnels de Cox.
˜α
ij
(t − S
N(t
−
)
) = 11
{J
N(t
−
)
=i}
α
ij,0
(t − S
N(t
−
)
) exp(β
T
ij
z
ij
), (III.13)
où β
ij
est le vecteur des coefficients de régression associés à z
ij
et α
ij,0
(.) est le risque
de base. Dans ce modèle, la proportionnalité des risques est supposée au sein d’une même
transition.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
46 Chapitre I II. Modèle semi-Markovien homogène
Intéressons nous maintenant aux fonctions de survie et de densité correspondant à des
fonctions de risque de temps d’attente dépendantes de covariables. Considérons ∀i, j ∈ E,
α
ij
(d, z) = α
ij,0
(d)e
β
T
ij
z
ij
, alors d’après les équations (I II.11) et (III.12) les fonctions de
survie correspondantes sont données par
S
ij
(d, z) = exp(−
Z
d
0
α
ij
(u)du) (III.14)
= exp(−
Z
d
0
α
ij,0
(u)e
β
T
ij
z
ij
du)
= S
ij,0
(d)
e
β
T
ij
z
ij
où S
ij,0
(d) = exp(−
R
d
0
α
ij,0
(u)du) et les fonctions de densité sont
f
ij
(d, z) = S
ij
(d, z)α
ij
(d, z) (III.15)
= α
ij,0
(d)e
β
T
ij
z
ij
S
ij,0
(d)
e
β
T
ij
z
ij
.
Remarque 5 Afin de prendre en compte les covariables, on utilise un modèle log-linéaire
utilisant la fonction exponentielle. Ce modèle est attractif car il permet d’avoir des fonctions
définies positives et permet d’éviter les estimations sous contraintes. De plus, les coefficients
de régression peuvent être interprétés en terme de risques relatifs. Ce modèle log-linéaire est
le modèle le plus couramment utilisé dans la littératurre (Cox [1972], Andersen et al. [1993])
Cependant, d’autres choix de fonctions sont possibles.
3.3 Modélisation paramétrique de la loi de séjour dans l’état
La modélisation paramétrique consiste à estimer les fonctions de risque des temps d’at-
tente dans les états par des fonctions paramétriques. Ainsi, on suppose que α
ij
(t) = g
ij
(t, θ
ij
),
où g
ij
est une fonction paramétrique intégrable. L’estimation de α
ij
(.) consiste à estimer le
vecteur de paramètres θ
ij
(qui inclut les coefficients de régression).
D’après l’équation (III.4), la vraisemblance (III.10) peut s’écrire
L =
n
Y
h=1
N
h
Y
k=1
p
J
h,k−1
J
h,k
f
J
h,k−1
J
h,k
(X
h,k
) ×
s
X
j=1
p
J
h,N
h
j
S
J
h,N
h
j
(U
h
)
δ
h
. (III.16)
A partir des équations (III.14) et (III.15), la vraisemblance (III.16) peut s’écrire en fonc-
tion des paramètres p
ij
et θ
ij
. L’estimation des paramètres se fait ensuite par maximisation
de la vraisemblance. On obtient ainsi les estimations ˆp
ij
des probabilités de la chaîne de Mar-
kov et les estimations ˆα
ij
(.) des fonctions de risque des temps de séjour. On en déduit les
estimateurs
ˆ
f
ij
(.) des fonctions de densité et
ˆ
S
ij
(.) des fonctions de survie. De plus, d’après
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Estimation paramétrique des temps de séjour 47
(III.6) et (III.4), il est possible de déduire les estimeurs
ˆ
λ
ij
(.) des intensités du processus
semi-Markovien par la formule suivante
ˆ
λ
ij
(d) =
ˆp
ij
ˆ
f
ij
(d)
P
s
j=1
ˆp
ij
ˆ
S
ij
(d)
. (III.17)
On peut noter que la notation α
ij
(d) = g
ij
(d, θ
ij
) permet de considérer des natures de
fonctions différentes suivant la transition étudiée. De plus, le nombre de paramètres qui
définissent la fonction est spécifique à chaque transition. En pratique, cette écriture est
très utile car elle permet d’adapter la modélisation à chaque transition et elle permet ainsi
d’optimiser le nombre de paramètres. En effet, un des problèmes majeurs de l’estimation est
dû au nombre de paramètres : s’il est trop grand (pour la base de données), les estimations
seront peu fiables. Il est donc important de conserver uniquement les paramètres nécessaires
en considérant une loi et un vecteur de covariables spécifiques à chaque transition.
Dans les études de survie de données épidémiologiques, les familles de fonctions les plus
couramment utilisées pour modéliser les risques sont les lois exponentielles, les lois de Weibull
et les lois de Weibull généralisées. Pour la modélisation de l’asthme, nous utiliserons ces
mêmes familles de lois car elles sont bien adaptées aux problèmes épidémiologiques et elles
ont l’avantage d’être « emboîtées », dans le sens où la loi de Weibull généralisée généralise la
loi de weibull qui généralise la loi exponentielle. Il sera ainsi possible de juger la pertinence
d’une loi en analysant les coefficients. D’autres choix de distributions sont possibles, mais il
est important de faire un compromis entre la taille de la base et le nombre de paramètres
qui définissent la loi. Dans la suite, nous présentons les fonctions de risque, de densité et de
survie asso ciées aux lois utilisées.
3.3.1 Loi de Weibull
La loi de Weibull possède de bonnes propriétés pour la modélisation des données de
survie. Elle permet de prendre en compte une évolution monotone du risque instantané au
cours du temps. Si la loi de Weibull sans covariable est utilisée pour modéliser le risque
alors, ∀i, j ∈ E, i 6= j,
α
ij
(d) = ν
ij
µ
1
σ
ij
¶
ν
ij
d
ν
ij
−1
, ∀d > 0, ∀ν
ij
> 0, ∀σ
ij
> 0.
La distribution exponentielle, qui est sous jacente à une modélisation Markovienne homogène
est obtenue pour ν
ij
= 1. Le modèle semi-Markovien avec loi de Weibull constitue ainsi une
généralisation du modèle Markovien homogène à temps continu. En supposant le modèle à
risques prop ortionnels, la fonction de risque avec covariables s’écrit,
α
ij
(d, z) = ν
ij
µ
1
σ
ij
¶
ν
ij
d
ν
ij
−1
exp(β
T
ij
z
ij
).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
48 Chapitre I II. Modèle semi-Markovien homogène
En suivant la définition (I II.14), la fonction de survie est
S
ij
(d, z) = S
ij
(d)
e
β
T
ij
z
ij
=
·
exp(−
Z
d
0
ν
ij
µ
1
σ
ij
¶
ν
ij
u
ν
ij
−1
du)
¸
e
β
T
ij
z
ij
=
·
exp(−(
d
σ
ij
)
ν
ij
)
¸
e
β
T
ij
z
ij
.
avec S
ij
(d) la fonction de survie associée à une Weibull sans covariable. D’après (III.15), la
densité correspondante est
f
ij
(d, z) = S
ij
(d, z)α
ij
(d, z)
=
·
exp(−(
d
σ
ij
)
ν
ij
)
¸
e
β
T
ij
z
ij
ν
ij
µ
1
σ
ij
¶
ν
ij
d
ν
ij
−1
exp(β
T
ij
z
ij
).
Remarque 6 Si ν
ij
= 1, on retrouve les fonctions associées à la loi exponentielle avec
covariables :
α
ij
(d, z) =
1
σ
ij
exp(β
T
ij
z
ij
)
S
ij
(d, z) = exp(−
d
σ
ij
)
e
β
T
ij
z
ij
f
ij
(d, z) =
1
σ
ij
exp(β
T
ij
z
ij
) exp(−
d
σ
ij
)
e
β
T
ij
z
ij
3.3.2 Loi de Weibull généralisée
La loi de Weibull est intéressante pour modéliser des risques monotones. Cependant, elle
devient mal adaptée quand les risques ne sont pas monotones : par exemple les formes en
cloches qui sont souvent présentes dans les études du vivant. Dans ces cas là, une alternative
est l’utilisation de la loi de Weibull généralisée qui permet de modéliser des fonctions de
risque instantané en forme de ∪ ou ∩. La fonction de risque (sans covariable) est donnée
par
α
ij
(d) =
1
θ
ij
µ
1 +
µ
d
σ
ij
¶
ν
ij
¶
1
θ
ij
−1
ν
ij
µ
1
σ
ij
¶
ν
ij
d
ν
ij
−1
,
∀d > 0, ∀ν
ij
> 0, ∀σ
ij
> 0, ∀θ
ij
> 0. En supposant les risques proportionnels, on a
α
ij
(d, z) =
1
θ
ij
µ
1 +
µ
d
σ
ij
¶
ν
ij
¶
1
θ
ij
−1
ν
ij
µ
1
σ
ij
¶
ν
ij
d
ν
ij
−1
exp(β
T
ij
z
ij
).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Estimation paramétrique des temps de séjour 49
Temps
Fonction de risque
0 20 40 60 80 100
0.8 0.9 1.0 1.1 1.2
mu=1, sigma=1
Temps
Fonction de risque
0 20 40 60 80 100
0 10 20 30 40 50
mu=2, sigma=2
Temps
Fonction de risque
0 20 40 60 80 100
0.1 0.2 0.3 0.4 0.5
mu=0.5, sigma=1
Temps
Fonction de risque
0 20 40 60 80 100
2 4 6 8 10 12 14 16
mu=1.5, sigma=1
Fig. III.1 – Exemple de fonctions de risque d’une loi de Weibull.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
50 Chapitre I II. Modèle semi-Markovien homogène
En utilisant les définitions (III.14) et (III.15), la fonction de survie est
S
ij
(d, z) = S
ij
(d)
e
β
T
ij
z
ij
= exp
Ã
1 −
µ
1 +
µ
d
σ
ij
¶
ν
ij
¶
1
θ
ij
!
exp(β
T
ij
z
ij
)
avec S
ij
(d), la fonction de survie sans covariable et la densité correspondante est
f
ij
(d, z) = S
ij
(d, z)α
ij
(d, z)
=
1
θ
ij
µ
1 +
µ
d
σ
ij
¶
ν
ij
¶
1
θ
ij
−1
ν
ij
σ
ij
µ
d
σ
ij
¶
ν
ij
−1
exp(β
T
ij
z
ij
) exp
Ã
1 −
µ
1 +
µ
d
σ
ij
¶
ν
ij
¶
1
θ
ij
!
exp(β
T
ij
z
ij
)
Remarque 7 Si θ
ij
= 1, on retrouve les fonctions associées à la loi de Weibull. Si θ
ij
= 1
et ν
ij
= 1 on retrouve les fonctions associées à la loi exponentielle.
Temps
Fonction de risque
0 20 40 60 80 100 120 140
0.0 0.02 0.04 0.06
mu=5, sigma=130, teta=1
Temps
Fonction de risque
0 20 40 60 80 100 120 140
0.02 0.04 0.06
mu=5, sigma=130, teta=0.1
Temps
Fonction de risque
0 20 40 60 80 100 120 140
0.0005 0.0010 0.0015
mu=0.5, sigma=130, teta=4
Temps
Fonction de risque
0 20 40 60 80 100 120 140
0.010 0.014 0.018 0.022
mu=0.5, sigma=10, teta=4
Fig. III.2 – Exemple de fonctions de risque d’une loi de Weibull généralisée.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Estimation paramétrique des temps de séjour 51
3.4 Extension à un modèle semi-Markovien non-homogène
Dans le modèle semi-Markovien homogène, l’évolution du processus dép end uniquement
de la durée écoulée dans l’état. En effet, comme la chaîne de Markov sous-jacente est ho-
mogène (probabilités de transition indép endantes du temps chronologique), les probabilités
de transition du processus sont aussi homogènes dans le sens où elles ne dépendent pas
du temps chronologique où se produit la transition. Cette hypothèse d’homogénéité peut,
dans certaines applications, être trop restrictive. Dans le cas de l’asthme par exemple, les
patients sont traités et éduqués, ainsi on peut espérer que les probabilités de rester dans un
état stable augmentent avec la durée du suivi.
Afin de rendre le modèle non-homogène, on peut considérer que les probabilités de la
chaîne de Markov sous-jacente dépendent de la durée du suivi (temps depuis l’inclusion dans
l’étude). Ainsi, l’évolution du processus semi-Markovien dépend de la durée écoulée dans
l’état avant de transiter d, mais aussi de la durée du suivi t. On définit alors les probabilités
de transition de la chaîne de Markov sous-jacente, qui dépendent du temps t,
p
ij
(t) = Pr(J(t) = j | J(t
−
) = i),
où J(t) représente l’état occupé par le processus au temps t. Il est ensuite possible de
redéfinir les fonctions de survie, la fonction de vraisemblance et les probabilités de transition
du pro cessus de manière à prendre en compte la durée de suivi dans ces quantités.
La méthode d’estimation paramétrique présentée précédemment peut ensuite être éten-
due afin d’estimer de manière paramétrique les probabilités p
ij
(.). On peut supposer, par
exemple, que les probabilités sont de la forme
ˆp
ij
(t) =
V
ij
(t)
P
{(i,j)∈E×E}
V
ij
(t)
,
avec
V
ij
(t) =
(
exp(a
ij
×t+b
ij
)
1+exp(a
ij
×t+b
ij
)
0
i 6= j
i = j.
Le choix de ces fonctions est motivé par le fait que ˆp
ij
(.) est compris entre 0 et 1 et que
P
n
j=1
ˆp
ij
(.) = 1. L’estimation des p
ij
(.) consiste alors à estimer les paramètres a
ij
et b
ij
par
maximisation de la vraisemblance.
En pratique, ce mo dèle et cette méthode d’estimation sont difficilement utilisables. En
effet, le nombre de paramètres devient très important et les estimations deviennent difficiles.
Dans le cas de l’asthme par exemple, le nombre d’observations dans la base de données ne
permet pas d’appliquer ce modèle qui comprend trop de paramètres. L’augmentation du
nombre de paramètres pour définir les lois et les probabilités a aussi pour conséquence de
restreindre le nombre de covariables pouvant être incluses dans la modélisation. De plus,
les résultats obtenus avec ce type de modèle dépendent de deux échelles de temps ce qui
rend l’interprétation délicate. Ces modèles peuvent cependant être intéressants pour observer
l’impact de la durée du suivi dans un modèle semi-Markovien et pour étudier des maladies où
la durée du suivi et le temps de séjour dans l’état influencent l’évolution de la maladie. Pour
plus d’informations sur les modèles semi-Markoviens non-homogènes, on pourra consulter
Vassiliou et Papadopoulou [1992], Papadopoulou et Vassiliou [1994] et Janssen et Limnios
[1999].
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
52 Chapitre I II. Modèle semi-Markovien homogène
4 Estimation non-paramétrique des intensités du pro-
cessus semi-Markovien
4.1 Introduction
L’objectif de cette section est de proposer un estimateur du maximum de vraisemblance
non-paramétrique des intensités du processus semi-Markovien. L’estimateur est dit non-
paramétrique car il repose sur une approximation des intensités du processus par des fonc-
tions constantes par morceaux. Cette méthode ne fait aucune hypothèse sur la forme des
distributions, cependant, elle nécessite de définir une subdivision sur laquelle les intensi-
tés sont constantes. L’estimation consiste à obtenir les valeurs de la fonction sur chaque
intervalle. Ses valeurs sont estimées par la méthode du maximum de vraisemblance.
L’estimateur présenté est une généralisation de l’estimateur de Ouhbi et Limnios [1999].
En effet, Ouhbi et Limnios [1999] ont obtenu un estimateur non-paramétrique des intensités
du processus semi-Markovien dans le cas d’un seul processus censuré. La généralisation
consiste à adapter cet estimateur :
– au cas de pro cessus pouvant être censurés ou non (p our prendre en compte des modèles
avec états absorbants),
– au cas de plusieurs processus.
Cette généralisation a été motivée par des raisons pratiques. En effet, dans de nombreuses
applications et en particulier dans l’étude des maladies, on utilise souvent des modèles avec
états absorbants pour prendre en compte par exemple le décès ou le rejet de greffe. De
plus, on dispose souvent d’un échantillon où un processus est associé à chaque individu.
Il était alors important d’adapter l’estimateur proposé par Ouhbi et Limnios [1999] afin
qu’il soit applicable à des problèmes pratiques où l’on dispose de plusieurs processus. L’es-
timateur proposé ici permet d’obtenir un estimateur non-paramétrique des intensités du
processus semi-Markovien dans un modèle avec (ou sans) état absorbant quand on dispose
d’un échantillon de processus.
Remarque 8 La différence avec la méthode de Ouhbi et Limnios [1999] (dans le cas d’un
seul processus censuré) tient à ce que les résultats de convergence asymptotique sont dus
à t → ∞ alors que pour plusieurs processus censurés ou non, les résultats de convergence
asymptotique sont dus à n → ∞ (n nombre d’individus).
Remarque 9 La méthode d’estimation non-paramétrique considérée dans cette section re-
pose sur le choix déterministe d’une subdivision. Il serait préférable d’utiliser une méthode
NPML (Non Parametric Maximum Likelihood) qui considère une subdivision aléatoire fonc-
tion des données (Huber-Carol et Pons [2004], Chang et al. [2000], Andersen et al. [1993],
Gill [1980]).
4.2 Ecriture de la vraisemblance
D’après la définition (III.5), la vraisemblance (III.10) est donnée par :
L =
n
Y
h=1
N
h
Y
k=1
q
J
h,k−1
J
h,k
(X
h,k
) ×
h
S
J
h,N
h
(U
h
)
i
δ
h
(III.18)
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
4. Estimation non-paramétrique des intensités du pro cessus semi-Markovien 53
Afin d’obtenir la vraisemblance en fonction des λ
ij
(.), les paramètres S
ij
(.) et q
ij
(.) doivent
être écrits sous une autre forme. Par la définition de S
ij
(.),
∂S
i
(d)
∂d
= − lim
∆d→0
1
∆d
Pr(d < X
n+1
6 d + ∆d | J
n
= i)
= − lim
∆d→0
1
∆d
Pr(d < X
n+1
6 d + ∆d | J
n
= i, X
n+1
> d) × Pr(X
n+1
> d | J
n
= i)
= −S
i
(d) × lim
∆d→0
1
∆d
s
X
j=1
Pr(J
n+1
= j, d < X
n+1
6 d + ∆d | J
n
= i, X
n+1
> d)
= −S
i
(d) ×
s
X
j=1
λ
ij
(d).
La solution de cette équation différentielle sachant que S
i
(0) = 1 est
S
i
(d) = exp(−
s
X
j=1
Z
d
0
λ
ij
(u)du)
= exp(−Λ
i
(d)). (III.19)
où Λ
i
(.) =
P
s
j=1
Λ
ij
(.) avec Λ
ij
(d) =
R
d
0
λ
ij
(u)du est l’intensité cumulée de l’état i vers
l’état j au temps d.
En utilisant la définition de l’intégrale et l’équation (III.19), le noyau de transition du
processus semi-Markovien peut s’écrire ∀i, j ∈ E et d ∈
¯
R
+
,
Q
ij
(d) = Pr(J
n+1
= j, X
n+1
6 d | J
n
= i)
=
Z
d
0
Pr(J
n+1
= j, X
n+1
∈]u, u + du] | J
n
= i)
=
Z
d
0
Pr(X
n+1
> u | J
n
= i) × Pr(J
n+1
= j, X
n+1
∈]u, u + du] | X
n+1
> u, J
n
= i)
=
Z
d
0
S
i
(u) × λ
ij
(u)du
=
Z
d
0
exp(−Λ
i
(u)) × λ
ij
(u)du. (III.20)
Ainsi,
∂Q
ij
(d)
∂d
= q
ij
(d) = exp(−Λ
i
(d)) × λ
ij
(d). (III.21)
En utilisant les équations (III.19) et (III.21) on peut, sans perte d’information, réécrire la
vraisemblance (III.18) sous la forme suivante,
L =
n
Y
h=1
N
h
Y
k=1
exp(−Λ
J
h,k−1
(X
h,k
)) × λ
J
h,k−1
J
h,k
(X
h,k
) ×
h
exp(−Λ
J
h,N
h
(U
h
))
i
δ
h
et par conséquent la log-vraisemblance est
l =
n
X
h=1
"
N
h
X
k=1
¡
log λ
J
h,k−1
J
h,k
(X
h,k
) − Λ
J
h,k−1
(X
h,k
)
¢
− δ
h
Λ
J
h,N
h
(U
h
)
#
(III.22)
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
54 Chapitre I II. Modèle semi-Markovien homogène
avec δ
h
vaut 1 si l’individu est censuré en S
h,N
h
et 0 sinon.
4.3 Estimation non-paramétrique des intensités
L’intensité de transition du processus semi-Markovien λ
ij
(d), peut être approximée par
une fonction constante par morceaux λ
∗
ij
(d) définie par λ
∗
ij
(d) = λ
ij
(υ
l
) = λ
ijl
pour d ∈ I
l
=
]υ
l
, υ
l+1
], où (υ
l
)
06l6M−1
est une subdivision régulière de [0, D], avec
D = max
h=1,...,n
[max(X
h,1
, ..., X
h,N
h
, U
h
)] .
D représente la plus grande durée écoulée dans un état parmi tous les individus. Notons que,
dans le cas d’observations discrètes, les durées de séjour sont disponibles uniquement si les
états du modèle sont hiérarchiques. Pour considérer que les durées de séjour sont observées
dans le cas des modèles avec états réversibles, il faut supposer que le sujet ne change pas
d’état entre deux consultations consécutives (observation continue du sujet).
Dans le cas où D est connue, on peut considérer la subdivision suivante,
0 = υ
0
< υ
1
< υ
2
< ··· < υ
M−1
< υ
M
= D,
avec des sauts ∆
D
= D/M où M = [D
1+α
] avec 0 < α < 1 et [x] représente la partie entière
de x. Ouhbi et Limnios [1999] montrent que ∆
D
est asymptotiquement équivalent à D
−α
quand D tend vers l’infini. Cette considération est aussi utilisée dans Colvert et Boardman
[1999]. Ainsi, l’approximation de λ
ij
(d) est donnée par
λ
∗
ij
(d) =
M−1
X
l=0
λ
ijl
11
]υ
l
,υ
l+1
]
(d).
En remplaçant λ
ij
(.) par λ
∗
ij
(.) dans (III.22), la log-vraisemblance peut s’écrire sous la forme
suivante :
l =
n
X
h=1
X
i,j∈E
M−1
X
l=0
³
log (λ
ijl
) d
h
ijl
− λ
ijl
ν
h
il
´
, (III.23)
où ν
h
il
est la fonction du temps de séjour dans l’état i, pour l’individu h, sur l’intervalle de
temps I
l
, i.e
ν
h
il
=
N
h
X
k=1
(X
h,k
∧υ
l+1
−υ
l
)11
{J
h,k−1
=i,X
h,k
>υ
l
}
+δ
h
×(U
h
∧υ
l+1
−υ
l
)11
{J
h,N
h
=i,U
h
>υ
l
}
(III.24)
et d
h
ijl
est le nombre de transitions, pour l’individu h, de l’état i vers l’état j pour lesquelles
le temps de séjour observé dans l’état i appartient à I
l
, i.e
d
h
ijl
=
N
h
X
k=1
11
{J
h,k−1
=i,J
h,k
=j,X
h,k
∈I
l
}
. (III.25)
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
4. Estimation non-paramétrique des intensités du pro cessus semi-Markovien 55
Preuve D’après la définition de λ
∗
ij
(.), on peut définir
Λ
∗
i
(d) =
s
X
j=1
Z
d
0
λ
∗
ij
(u)du
=
s
X
j=1
M−1
X
l=0
λ
ijl
Z
d
0
11
]υ
l
,υ
l+1
]
(u)du
=
s
X
j=1
M−1
X
l=0
λ
ijl
× (d ∧ υ
l+1
− υ
l
)11
{d>υ
l
}
. (III.26)
Ainsi,
Λ
∗
J
h,k
(d) =
s
X
j=1
M−1
X
l=0
λ
J
h,k
jl
× (d ∧ υ
l+1
− υ
l
)11
{d>υ
l
}
=
X
i,j∈E
M−1
X
l=0
λ
ijl
× (d ∧ υ
l+1
− υ
l
)11
{J
h,k
=i,d>υ
l
}
. (III.27)
De plus,
log λ
∗
J
h,k−1
J
h,k
(d) = log
Ã
M−1
X
l=0
λ
J
h,k−1
J
h,k
l
11
]υ
l
,υ
l+1
]
(d)
!
=
X
i,j∈E
log
Ã
M−1
X
l=0
λ
ijl
11
]υ
l
,υ
l+1
]
(d)
!
11
{J
h,k−1
=i,J
h,k
=i}
=
X
i,j∈E
M−1
X
l=0
log (λ
ijl
) 11
{J
h,k−1
=i,J
h,k
=i,d∈I
l
}
, (III.28)
comme λ
ijl
est constant sur I
l
. En utilisant les équations (III.27) et (III.28) et en remplaçant
λ
ij
(.) par λ
∗
ij
(.) et Λ
i
(.) par Λ
∗
i
(.) dans la log-vraisemblance (III.22) on a
l =
n
X
h=1
"
N
h
X
k=1
³
log λ
∗
J
h,k−1
J
h,k
(X
h,k
) − Λ
∗
J
h,k−1
(X
h,k
)
´
− δ
h
Λ
∗
J
h,N
h
(U
h
)
#
=
n
X
h=1
X
i,j∈E
M−1
X
l=0
"
N
h
X
k=1
³
log (λ
ijl
) 11
{J
h,k−1
=i,J
h,k
=i,X
h,k
∈I
l
}
− λ
ijl
(X
h,k
∧ υ
l+1
− υ
l
)11
{J
h,k−1
=i,X
h,k
>υ
l
}
´
− δ
h
× λ
ijl
(U
h
∧ υ
l+1
− υ
l
)11
{J
h,N
h
=i,U
h
>υ
l
}
io
.
Pour simplifier les écritures, on utilise les quantités suivantes
d
h
ijl
=
N
h
X
k=1
11
{J
h,k−1
=i,J
h,k
=j,X
h,k
∈I
l
}
.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
56 Chapitre I II. Modèle semi-Markovien homogène
et
ν
h
il
=
N
h
X
k=1
(X
h,k
∧ υ
l+1
− υ
l
)11
{J
h,k−1
=i,X
h,k
>υ
l
}
+ δ
h
(U
h
∧ υ
l+1
− υ
l
)11
{J
h,N
h
=i,U
h
>υ
l
}
En utilisant les quantités précédentes, la log-vraisemblance devient
l =
n
X
h=1
X
i,j∈E
M−1
X
l=0
³
log (λ
ijl
) d
h
ijl
− λ
ijl
ν
h
il
´
.
¥
A partir de cette écriture, on peut obtenir les dérivées de la log-vraisemblance (III.23),
∀i, j ∈ E et ∀l = 0, ..., M − 1,
∂l
∂λ
ijl
=
P
n
h=1
d
h
ijl
λ
ijl
−
n
X
h=1
ν
h
il
Un estimateur du maximum de vraisemblance de λ
ijl
est donné pour ∀i, j ∈ E et ∀l =
0, ..., M − 1, par
ˆ
λ
ijl
=
(
P
n
h=1
d
h
ijl
P
n
h=1
ν
h
il
0
si
P
n
h=1
ν
h
il
> 0
sinon,
(III.29)
avec la convention 0/0 = 0 (le numérateur sera nul quand
P
n
h=1
ν
h
il
= 0) et δ
h
égale à 1 si
l’individu h est censuré, 0 sinon. L’estimateur de λ
ij
(.) est finalement défini par
ˆ
λ
ij
(d) =
M−1
X
l=0
ˆ
λ
ijl
11
]υ
l
,υ
l+1
]
(d).
Remarque 10
–
L’estimateur non-paramétrique présenté ici est bien une généralisation de l’estimateur
proposé par Ouhbi et Limnios [1999]. En effet, si on considère un seul processus cen-
suré, alors n = 1 et δ
h
= 1. On retrouve ainsi l’estimateur
ˆ
λ
ijl
= d
ijl
/ν
il
obtenu par
Ouhbi et Limnios [1999].
– L’estimateur du maximum de vraisemblance utilisé est une généralisation aux mo-
dèles semi-Markoviens de l’estimateur du maximum de vraisemblance de la fonction
de risque associée à une variable aléatoire à densité continue à partir d’un échantillon
de variable i.i.d (Singpurwalla et Wong [1983]).
4.4 Estimateurs dérivés
A partir de l’estimateur non-paramétrique des intensités de transition du processus semi-
Markovien,
ˆ
λ
ij
(.), on peut déduire un estimateur du noyau semi-Markovien Q
ij
(.) et un
estimateur de la matrice des probabilités de transition du processus semi-Markovien.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
4. Estimation non-paramétrique des intensités du pro cessus semi-Markovien 57
4.4.1 Estimateur du noyau semi-Markovien
En utilisant l’estimateur constant par période
ˆ
λ
ij
(.) et la relation (III.20), un estimateur
du noyau semi-Markovien (III.1) est donné par
ˆ
Q
ij
(d) =
Z
d
0
exp(−
ˆ
Λ
i
(u))
ˆ
λ
ij
(u)du.
où
ˆ
Λ
i
(d) =
P
s
j=1
R
d
0
ˆ
λ
ij
(u)du. Cet estimateur peut s’écrire pour tous les temps d de la
subdivision υ
0
< υ
1
··· < υ
M
. En utilisant le fait que exp(−
ˆ
Λ
i
(u))
ˆ
λ
ij
(u) est constant
∀u ∈ I
k
, on obtient
ˆ
Q
ij
(d) =
Z
d
0
exp(−
ˆ
Λ
i
(u))
ˆ
λ
ij
(u)du.
=
X
k:06υ
k
6d
Z
I
k
exp(−
ˆ
Λ
i
(u))
ˆ
λ
ij
(u)du
= ∆
D
X
k:06υ
k
6t
exp(−
ˆ
Λ
ik
)
ˆ
λ
ijk
avec ∀k = 1, ..., M,
ˆ
Λ
ik
=
P
s
j=1
P
k−1
l=0
ˆ
λ
ijl
∆
D
et ∆
D
= υ
k
− υ
k−1
(d’après l’équation
(III.26)).
4.4.2 Estimateur des probabilités du processus semi-Markovien
L’estimateur
ˆ
λ
ij
(.) permet aussi de déduire un estimateur de la matrice des probabilités
de transition du processus semi-Markovien. A partir de la définition des probabilités du
processus (III.8) et des équations (III.3), (III.4) et (III.5), on peut écrire,
Ψ
ij
(t) =
s
X
r=1
Z
t
0
p
ir
f
ir
(u)Ψ
rj
(t − u)du + δ
ij
S
i
(t) (III.30)
=
s
X
r=1
Z
t
0
Q
ir
(du)Ψ
rj
(t − u) + δ
ij
(1 −
s
X
j=1
Q
ij
(t))
Considérons le produit de convolution entre deux matrices A ={a
ij
(t)} et B ={b
ij
(t)} noté
C ={c
ij
(t)},
(A ∗ B)(t) = C(t) avec c
ij
(t) =
s
X
r=1
Z
t
0
a
ir
(t − u)b
rj
(du)
Ainsi, en considérant, les matrices Q(.) ={Q
ij
(.)}
i,j∈E
, P(.) = {Ψ
ij
(.)}
i,j∈E
et la matrice
diagonale S(.) = diag(S
i
(.))
i∈E
, les probabilités du pro cessus peuvent s’écrire sous forme
matricielle
P(t) = (P ∗Q)(t) + S(t).
En définissant A
(−1)
l’inverse de la matrice A au sens de la convolution et I = diag(1
1
{t>0}
(t)), alors si les fonctions S
i
(.) sont intégrables, on a
P(t) = (I(t) −Q(t))
(−1)
∗ S(t).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
58 Chapitre I II. Modèle semi-Markovien homogène
A partir de cette écriture, on peut en déduire un estimateur non-paramétrique de la matrice
des probabilités P(.)
ˆ
P(t) = (I −
ˆ
Q(t))
(−1)
∗
ˆ
S(t),
où
ˆ
Q(.) est l’estimateur de Q(.) et
ˆ
S(.) l’estimateur de S(.). La matrice (I −
ˆ
Q(t))
(−1)
, qui
est l’inverse au sens de la convolution, peut être soit approximée par un développement en
serie entière (Limnios [1997]), soit calculée par la formule d’algèbre suivante
(I −
ˆ
Q(t))Com(I −
ˆ
Q(t))
t
= det(I −
ˆ
Q(t))Id
où Id est la matrice identité, Com(A) est la comatrice de A. La seule différence avec le cas
classique d’inversion de matrice réside dans le calcul du déterminant où le produit usuel est
remplacé par le produit de convolution (Limnios [1997]).
4.5 Propriétés asymptotiques des estimateurs
Dans le cas d’un seul processus censuré, Ouhbi et Limnios [1999] ont démontré que les
estimateurs
ˆ
λ
ij
(.),
ˆ
Q
ij
(.),
ˆ
P
ij
(.) étaient uniformément consistants et convergeaient faible-
ment vers des variables aléatoires normales quand le temps de censure tend vers l’infini (Les
auteurs obtiennent les variances asymptotiques).
Dans le cas de plusieurs processus censurés ou non, les mêmes types de résultats asymp-
totiques peuvent être obtenus en considérant que n (nombre d’individus) tend vers l’infini.
L’adaptation des démonstrations au cas de plusieurs processus semble possible en considé-
rant que les n processus forment un seul « super » processus.
5 Application à l’asthme
Dans la plupart des maladies chroniques comme l’asthme, le temps passé dans un état
de santé représente un facteur important de l’évolution de la maladie. Les modèles semi-
Markoviens prennent en compte cette échelle de temps et représentent ainsi un outil inté-
ressant pour l’étude de l’asthme.
Le modèle à trois états de contrôle (Figure III.3) est considéré pour étudier la base de
données présentée au chapitre I page 9.
L’écriture de la vraisemblance dans les mo dèles semi-Markoviens fait intervenir, pour
chaque individu censuré, la durée entre la dernière consultation et la date de fin de l’étude.
On définit la date de fin d’étude comme la dernière consultation renseignée dans la base.
L’objectif de ce travail est d’étudier l’évolution de l’asthme en prenant en compte certains
facteurs de risque. Nous considérons des covariables indépendantes du temps afin de pouvoir
stratifier la base de données. Les covariables étudiées sont les suivantes :
– l’indice de masse corporelle à la première consultation : co dée 0 si IMC < 25, 1 sinon ;
– la sévérité de l’asthme à la première consultation : codée 0 si le patient est non sévère,
1 sinon.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
5. Application à l’asthme 59
Etat 2
Contrôle sous
optimal
Etat 1
Contrôle optimal
Etat 3
Contrôle
inacceptable
Fig. III.3 – Modèle à trois états de contrôle pour l’asthme.
5.1 Application de l’estimation paramétrique
Les lois de Weibull et de Weibull généralisée sont utilisées pour la modélisation paramé-
trique des distributions des temps de séjour. Afin d’interpréter les résultats obtenus, nous
étudierons particulièrement les intensités des temps de séjour (Equation (III.7)) et les
intensités du processus semi-Markovien (Equation (III.6)).
– Les intensités des temps de séjour sont modélisées par des lois paramétriques.
Des covariables peuvent être incorporées dans la définition de ces intensités par l’in-
termédiaire d’un modèle à risques proportionnels (Equation III.13). Ainsi, l’effet des
covariables s’interprète en termes de risques relatifs par l’intermédiaire des co efficients
de régression. Cependant, la définition de ces intensités fait apparaître un condition-
nement sur le fait que l’individu est dans l’état i et qu’il sera ensuite dans l’état
j.
– Les intensités du processus semi-Markovien sont les paramètres que l’on cherche
à estimer. Ces intensités sont plus intéressantes pour l’interprétation car elles repré-
sentent le risque d’un individu de passer dans l’état j sachant qu’il est dans l’état
i. Dans l’estimation non-paramétrique, ces intensités sont estimées (directement) par
des fonctions constantes par morceaux. Dans le cadre de l’estimation paramétrique,
d’après les équations (III.6), (III.15) et (III.4), les intensités de transition du processus
semi-Markovien sont estimées par
ˆ
λ
ij
(d) =
ˆp
ij
ˆ
S
ij
(d)ˆα
ij
(d)
ˆ
S
i
(d)
=
ˆp
ij
ˆ
S
ij
(d)ˆα
ij
(d)
P
s
j=1
ˆp
ij
ˆ
S
ij
(d)
. (III.31)
où ˆα
ij
(.) est l’estimation de l’intensité de temps de séjour. Pour ces intensités, l’in-
terprétation des coefficients de régression en terme de risque relatif devient complexe
(III.31). Cependant, si les estimations obtenues pour chaque valeur des covariables
sont à peu près parallèles, il est possible en faisant le rapport entre les deux courbes
d’obtenir un facteur multiplicatif constant qui est utile pour l’interprétation de ces
risques. Si les courbes ne sont pas parallèles, on obtient un facteur multiplicatif dé-
pendant du temps qui peut également être interprété.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
60 Chapitre I II. Modèle semi-Markovien homogène
Les fonctions optim() de R et nlminb() de S-P lus sont utilisées pour obtenir les esti-
mations par maximum de vraisemblance. En ce qui concerne l’initialisation des paramètres,
ceux associés à la définition des lois sont initialisés à 1, ceux associés à la chaîne de Markov
sous-jacente sont estimés à partir de simples proportions et ceux associés aux coefficients de
régression sont initialisés à 0 (aucun effet).
Dans un premier temps, un modèle sera ajusté pour chaque modalité des covariables.
Cette étape permettra d’identifier les facteurs influençant les intensités de temps de séjour
et d’évaluer graphiquement la validité de l’hypothèse de proportionnalité des risques pour
chaque transition et chaque covariable. Dans un second temps, on étudiera un modèle avec
une seule covariable influençant toutes les transitions. L’impact des covariables sur les dis-
tributions des temps de séjour pourra ainsi être mesuré par l’intermédiaire des coefficients
de régression. Enfin, il sera possible d’étudier un modèle avec des distributions et des effets
de covariables spécifiques à chaque transition. L’application de cette méthode d’estimation
à une base de données de patients atteints du VIH fait l’objet d’un travail soumis (Foucher
et al. [2004]).
5.1.1 Modèle stratifié
Dans un premier temps, un modèle est estimé pour chaque modalité des covariables
(analyse en sous-groupe). Cette étape possède plusieurs intérêts : elle permet
(i) d’identifier les variables qui semblent avoir un effet sur les estimations des intensités des
temps de séjour,
(ii) de vérifier que la loi utilisée est justifiée par rapport à une loi exponentielle (loi la plus
simple),
(iii) d’évaluer graphiquement la validité de l’hypothèse de proportionnalité des risques,
propre à chaque covariable et à chaque transition.
Des modèles de type Weibull et Weibull généralisé sont ajustés dans chaque strate. Les
graphiques présentant les estimations pour chaque transition ne sont pas présentés exhaus-
tivement pour des raisons de clarté. Afin de discuter les résultats, nous nous intéresserons
particulièrement à la transition 3 → 1 stratifiée sur l’IMC et à la transition 2 → 3 stratifiée
sur la sévérité.
De manière générale, les résultats de l’estimation des risques des temps de séjour (Equa-
tion (III.7)) montrent des écarts entre les courbes pour certaines transitions et pour certaines
covariables, ce qui souligne l’intérêt de prendre en compte ces facteurs dans l’étude des forces
de transition. Par exemple, les figures III.4 (a) et III.4 (b) montrent les écarts dans les es-
timations pour une stratification sur l’IMC et sur la sévérité. Pour une modélisation par loi
de Weibull ou Weibull généralisée, il semble que les patients en surpoids aient un risque plus
faible que les patients normaux pour la transition de l’état inacceptable vers l’état optimal.
Les patients sévères ont un risque plus important pour la transition de l’état sous-optimal
vers l’état inacceptable.
On peut aussi noter une différence entre les estimations par une loi de Weibull et par une
loi de Weibull généralisée, en particulier sur la forme des estimations. En effet, la majeure
partie des transitions répondent à des fonctions de risque en forme de ∩ qui ne sont pas prises
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
5. Application à l’asthme 61
Temps (annees)
Fonction de risque
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0 5 10 15
(a)
Temps (annees)
Fonction de risque
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0.0 0.5 1.0 1.5 2.0
(b)
Fig. III.4 – Estimations des intensités du temps de séjour par des lois de Weibull (courbes
noires) et Weibull généralisée (courbes grises). (a) Temps de séjour dans un état inacceptable
vers un état optimal (3 → 1) dans les strates IMC < 25 (—–) et IMC 6 25 (- - -). (b) Temps
de séjour dans un état sous-optimal vers un état inacceptable (2 → 3) dans les strates non
sévère (—–) et sévère (- - -).
en compte par les lois de Weibull. Peu de temps après l’entrée dans un état, le risque croît
rapidement ce qui reflète le caractère d’instabilité du patient qui vient de changer d’état.
Ensuite, après un délai variable, le risque diminue, signe d’une stabilisation de la maladie :
plus la personne reste dans un état, moins elle a de chance d’en sortir. Par exemple, sur les
figures III.4 (a) et III.4 (b), la loi de Weibull généralisée est mieux adaptée pour modéliser
ces risques qui semblent être en forme de ∩. En effet, il apparaît (graphiquement) que la
monotonie de la loi de Weibull ne correspond pas aux données et fournit ainsi des estimations
peu fiables des risques. Ce résultat est confirmé par les estimations des paramètres associés
à la définition des lois : le paramètre θ
ij
de la loi de Weibull généralisée est toujours différent
de la valeur 1. Ceci signifie (cf. remarque page 50) que dans le cas de l’asthme, la loi de
Weibull généralisée semble mieux adaptée que la loi de Weibull (et exponentielle).
Afin d’étudier un modèle avec covariables pour les intensités des temps de séj our, il
est important de vérifier que l’hypothèse de proportionnalité des risques ne soit pas trop
contraignante. Une comparaison graphique des intensités des temps de séjour dans chaque
strate permet de sélectionner les transitions qui semblent vérifier l’hypothèse. Si les risques
dans chaque strate ne se croisent pas et sont à peu près parallèles, alors l’hypothèse de pro-
portionnalité sera considérée comme étant vérifiée. Pour chaque covariable et pour chacune
des lois utilisées, le tableau III.1 résume les transitions qui semblent vérifier l’hypothèse de
risques proportionnels. Le symbole × signifie que la transition ne vérifie pas l’hypothèse et
le symbole O signifient que la transition vérifie l’hypothèse. Par exemple, pour la transition
2 → 3 avec la sévérité comme variable de stratification (Figure III.4 (b)), les fonctions de
risque des deux strates se croisent ce qui reflète la non proportionnalité des risques. Inverse-
ment, la transition 3 → 1 (Figure III.4 (a)) semble être à risques prop ortionnels dans le cas
d’une loi de Weibull généralisée. On peut aussi noter, que pour certaines transitions, la forme
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
62 Chapitre I II. Modèle semi-Markovien homogène
Transition Loi
Covariable
IMC Sévérité
1 → 2
Weibull
Weibull G
O
×
×
×
1 → 3
Weibull
Weibull G
×
×
×
×
2 → 1
Weibull
Weibull G
×
×
×
×
2 → 3
Weibull
Weibull G
×
×
×
×
3 → 1
Weibull
Weibull G
O
O
×
O
3 → 2
Weibull
Weibull G
O
×
O
×
Tab. III.1 – Transitions qui semblent vérifier l’hypothèse de proportionnalité des risques.
de la loi de distribution diffère selon les modalités de la covariable. Dans de telles situations,
seule la stratification permet d’étudier les impacts des covariables sur les intensités.
Les figures III.5 (a) et III.5 (b) montrent les risques du processus semi-Markovien obte-
nus avec une loi de Weibull et Weibull généralisée pour la transition 3 → 1 avec stratification
sur l’IMC et les risques pour la transition 2 → 3 avec stratification sur la sévérité. Dans
l’ensemble, les estimations avec les deux lois sont assez proches même si les estimations par
loi de Weibull semblent sous-estimer et étaler la forme en ∩ du risque semi-Markovien. No-
tons qu’une modélisation des risques de temps de séjour par une loi de Weibull n’empêche
pas d’obtenir des formes en ∩ pour les risques du processus (III.31).
D’un point de vue clinique, les résultats (Figure III.5 (a)) confirment ceux obtenus au
chapitre II, à savoir un effet négatif du surpoids sur un retour vers un état de contrôle
optimal. En effet, avec une loi de Weibull et avec une loi de Weibull généralisée, le risque
de transiter vers un état optimal après être resté trois mois dans un état inacceptable est
deux fois plus grand pour les patients qui ne sont pas en surpoids. Ces risques sont différents
pendant les six premiers mois où la forme des risques est en cloche et sont voisins ensuite
quand les risques se stabilisent. Pour la sévérité (Figure III.5 (b)), la forme des risques est
différente dans chacune des strates, en cloche pour les patients sévères alors que le risque est
presque constant pour les patients non sévères. Les patients sévères dans un état de contrôle
sous-optimal, ont un risque plus important (surtout au début) de devenir mal contrôlés.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
5. Application à l’asthme 63
Temps (annees)
Fonction de risque SM
0.0 0.5 1.0 1.5 2.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6
(a)
Temps (annees)
Fonction de risque SM
0.0 0.5 1.0 1.5 2.0
0.0 0.05 0.10 0.15 0.20 0.25 0.30
(b)
Fig. III.5 – Estimations des intensités du processus semi-Markovien en utilisant des lois de
Weibull (courbes noires) et Weibull généralisée (courbes grises). (a) Intensité de transition
d’un état inacceptable vers un état optimal (3 → 1) dans les strates IMC < 25 (—–) et IMC
6 25 (- - -). (b) Intensité de transition d’un état sous-optimal vers un état inacceptable
(2 → 3) dans les strates non sévère (—–) et sévère (- - -).
5.1.2 Modèle univarié
Pour chaque covariable, nous ajustons un modèle « univarié » dans le sens où une
seule covariable est prise en compte dans la modélisation. Nous considérons un modèle à
risques proportionnels pour inclure les covariables dans la définition des intensités de temps
de séjour. Cette étape permet de tester l’impact des covariables sur chaque transition à
l’aide des tests de Wald. On p ourra ensuite interpréter les estimations des coefficients de
régression en termes de risques relatifs. En pratique, afin d’éviter les interprétations abusives,
on utilisera les résultats obtenus par stratification pour sélectionner de manière graphique
les transitions qui semblent vérifier l’hypothèse de risques proportionnels.
Les résultats des estimations des coefficients de régression, des écarts-types et les p-values
(test de β
ij
= 0 avec le test de Wald) pour chaque covariable et pour chaque loi utilisée sont
donnés dans le tableau III.2.
D’une manière générale, les estimations des coefficients avec des lois de Weibull et de
Weibull généralisée sont proches et vont dans le même sens. Les coefficients de régression
qui sont statistiquement différents de zéro et pour lesquels la transition semble vérifier l’hy-
pothèse de proportionnalité (Tableau III.1) peuvent être interprétés. Parmi ces coefficients,
on note en particulier que le coefficient associé à l’IMC pour la transition 3 → 1 est négatif
(avec les deux lois). Ainsi, sachant que le patient est dans l’état inacceptable et qu’il va
transiter dans un état optimal, le risque de transiter est plus faible pour les patients en
surpoids comparativement aux autres patients (le risque est divisé par exp(0.53) = 1, 7).
Ces résultats confirment ceux obtenus par stratification.
La comparaison des figures III.4 et III.6 reflète les difficultés d’interprétation. Les esti-
mations des intensités des temps de séjour pour la transtion 3 → 1 avec l’IMC en covariable
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
64 Chapitre I II. Modèle semi-Markovien homogène
Transition Loi IMC Sévérité
ˆ
β (ec)
1
(p)
2
ˆ
β (ec)
1
(p)
2
1 → 2
Weibull -0.36 (0.24) (0.12) -0.42 (0.24) (0.09)
Weibull G -0.38 (0.23) (0.10) -0.55 (0.23) (0.02)
1 → 3
Weibull -0.84 (0.35) (0.02) 0.03 (0.33) (0.94)
Weibull G -0.65 (0.35) (0.06) -0.07 (0.36) (0.84)
2 → 1
Weibull -0.02 (0.20) (0.90) -0.38 (0.26) (0.15)
Weibull G -0.06 (0.20) (0.78) -0.54 (0.24) (0.02)
2 → 3
Weibull -0.22 (0.28) (0.42) -0.97 (0.24) (<0.01)
Weibull G -0.14 (0.32) (0.65 -1.03 (0.24) (<0.01)
3 → 1
Weibull -0.58 (0.21) (<0.01) 0.52 (0.21) (0.01)
Weibull G -0.53 (0.22) (0.01) 0.38 (0.20) (0.07)
3 → 2
Weibull -0.16 (0.18) (0.39) 0.10 (0.19) (0.59)
Weibull G -0.24 (0.18) (0.18) 0.02 (0.18) (0.91)
1
estimations des écarts-types.
2
p avec le test de Wald pour H
0
: β
ij
= 0.
Tab. III.2 – Estimations des coefficients de régression dans un modèle semi-Markovien avec
une covariable.
(Figure III.6 (a)) et par stratification sur l’IMC (Figure III.4 (a)) sont assez proches et vont
dans le même sens. Par contre, pour la transition 2 → 3 avec la sévérité (Figures III.4 (b)
et III.6 (b)), les estimations par stratification et avec covariables conduisent à des résultats
contradictoires sur l’effet de la sévérité. Cette différence peut s’expliquer par le fait que, pour
la sévérité, l’hypothèse de proportionnalité ne semble vérifiée pour cette transition. Cette
exemple montre la prudence nécessaire pour l’interprétation clinique des résultats obtenus
avec un modèle à risques proportionnels.
Il est intéressant d’observer l’impact des covariables sur les intensités du processus semi-
Markovien. La figure III.7 (a) confirme l’impact négatif du surpoids pour un retour vers un
état de contrôle optimal même s’il est légèrement atténué par rapport au modèle stratifié
(Figure III.5 (a)). Les patients en surpoids ont un risque plus faible (divisé par 1.5 à t = 2
mois) les cinq premiers mois et ont ensuite un risque légèrement supérieur les six mois
qui suivent. Les résultats sur la sévérité (Figure III.7 (b)) sont différents de ceux obtenus
par stratification (III.5 (b)). Cependant, comme on l’a vu précédemment, ces résultats ne
doivent pas être retenus.
Le choix des distributions des temps de séjour peut s’effectuer en observant les coefficients
associés à la définition des lois. Dans notre cas, avec le modèle stratifié et avec le modèle
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
5. Application à l’asthme 65
Temps (annees)
Fonction de risque
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0 5 10 15
(a)
Temps (annees)
Fonction de risque
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0.0 0.5 1.0 1.5 2.0
(b)
Fig. III.6 – Estimations des intensités du temps de séjour par des lois de Weibull (courbes
noires) et Weibull généralisée (courbes grises). (a) Temps de séjour dans un état inacceptable
vers un état optimal (3 → 1) avec l’IMC en covariable (IMC < 25 (—–) ; IMC > 25 (- - -)).
(b) Temps de séjour dans un état sous-optimal vers un état inacceptable (2 → 3) avec la
sévérité en covariable (non sévère (—–) ; sévère (- - -)).
Temps (années)
Fonction de risque SM
0.0 0.5 1.0 1.5 2.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6
(a)
Temps (années)
Fonction de risque SM
0.0 0.5 1.0 1.5 2.0
0.0 0.05 0.10 0.15 0.20 0.25 0.30
(b)
Fig. III.7 – Estimations des intensités du processus semi-Markovien en utilisant des lois de
Weibull (courbes noires) et Weibull généralisée (courbes grises). (a) Intensité de transition
d’un état inacceptable vers un état optimal (3 → 1) avec l’IMC en covariable (IMC < 25
(—–) ; IMC > 25 (- - -)). (b) Intensité de transition d’un état sous-optimal vers un état
inacceptable (2 → 3) avec la sévérité en covariable (non sévère (—–) ; sévère (- - -)).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
66 Chapitre I II. Modèle semi-Markovien homogène
univarié, les coefficients θ
ij
sont tous différents de la valeur 1. Ce résultat montre bien
l’utilité de la loi de Weibull généralisée dans le cas de l’asthme où les lois exponentielles et
les lois de Weibull ne sont pas adaptées.
Remarque 11 L’hypothèse de proportionnalité des risques peut être testée et contournée
en considérant un modèle avec des coefficients de régresssion dépendants du temps. Cette
méthode est discutée au chapitre IV page 96. Dans notre cas, le nombre d’observations dans
la base de données n’est pas suffisant pour une estimation satisfaisante des paramètres.
5.1.3 Modèle multivarié avec transition spécifique
Suite à l’analyse des covariables par stratification et par un modèle univarié, il est pos-
sible de définir un modèle avec plusieurs covariables pour étudier d’éventuels facteurs de
confusion. Ce modèle pourra prendre en compte des lois de temps de séjour et des effets
de covariables spécifiques à chaque transition. Dans un premier temps, il est nécessaire de
sélectionner, pour chaque covariable, les transitions qui semblent à risques proportionnels.
Par cette sélection, on exclut inévitablement de la modélisation un certain nombre d’effets
des covariables. Ensuite, seuls les effets statistiquement différents de zéro dans le modèle
univarié sont pris en compte dans la modélisation. Il est ensuite possible de choisir une loi
spécifique à chaque transition en faisant un compromis entre le nombre de paramètres et
l’adéquation de la loi.
Dans le cas de l’asthme, les lois de Weibull généralisées sont les mieux adaptées à la
modélisation des risques. Cependant, pour un modèle de type de Weibull généralisé avec
deux covariables (5 × 6 + 3 paramètres), les estimations sont mauvaises et peu fiables. On
est confronté à un nombre trop important de paramètres pour le nombre d’observations de
la base de données. De plus, pour chaque covariable, peu de transitions vérifient l’hypothèse
de proportionnalité. Ainsi, les résultats obtenus avec ce type d’analyse ne sont pas présentés
car moins intéressants et moins fiables que ceux des analyses univariée et stratifiée.
5.2 Application de l’estimation non-paramétrique
Cette partie présente l’application de la méthode d’estimation non-paramétrique des
intensités du processus semi-Markovien (Equation I II.6).
Afin d’estimer les intensités par des fonctions constantes par morceaux, la méthode
nécessite de définir une subdivision régulière de [0, D], avec D représente la plus gr ande
durée écoulée dans un état parmi tous les individus. Le pas de la subdivision est donné par
∆
D
= D/M où M = [D
1+α
] avec 0 < α < 1 et [x] représente la partie entière de x. Le choix
de la subdivision revient alors à fixer une valeur de α ∈ ]0, 1[ . D’après (III.29) et (III.25),
la valeur de la fonction sur un intervalle est nulle si aucune transition ne se produit dans
cet intervalle. Afin d’améliorer la lisibilité des courbes, seules les valeurs différentes de zéro
sont conservées dans la représentation graphique.
La figure III.8 présente les estimations des intensités du processus semi-Markovien as-
sociées à la transition 3 → 1 dans les strates IMC < 25 et IMC > 25. Chaque graphique
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
5. Application à l’asthme 67
correspond à différentes valeurs de α (α = 0.05, α = 0.1, α = 0.3, α = 0.5). Suivant les
valeurs de α, les risques ont sensiblement la même allure, cependant, ils comportent des
différences importantes. Les valeurs des risques augmentent de manière significative avec la
valeur de α. L’impact du surp oids semble également différent : pour α = 0.05 et α = 0.1,
les patients en surpoids semblent avoir un risque plus faible alors que ce n’est plus le cas
pour α = 0.3 et α = 0.5. Notons que les valeurs des fonctions peuvent varier fortement d’un
intervalle à un autre en fonction du nombre de transitions. D’un point de vue numérique, le
temps de calcul augmente considérablement avec la valeur de α.
Temps (années)
Fonction de risque du processus
0.0 0.5 1.0 1.5 2.0 2.5
0.0 0.1 0.2 0.3 0.4
alpha = 0.05
IMC<25
IMC>=25
Temps (années)
Fonction de risque du processus
0.0 0.5 1.0 1.5 2.0 2.5
0.0 0.1 0.2 0.3 0.4
alpha = 0.1
IMC<25
IMC>=25
Temps (années)
Fonction de risque du processus
0.0 0.5 1.0 1.5 2.0 2.5
0.0 0.1 0.2 0.3 0.4
alpha = 0.3
IMC<25
IMC>=25
Temps (années)
Fonction de risque du processus
0.0 0.5 1.0 1.5 2.0 2.5
0.0 0.1 0.2 0.3 0.4
alpha = 0.5
IMC<25
IMC>=25
Fig. III.8 – Estimations non-paramétrique des intensités du processus semi-Markovien asso-
ciée à la transition 3 → 1 dans les strates IMC < 25 et IMC > 25. Chaque figure correspond
à une valeur de α.
Afin de comparer les estimations paramétrique et non-paramétrique, la valeur de α est
fixée à 0.3. Ce choix correspond à un compromis mais reste arbitraire. Les figures III.9 (a)
et III.9 (b) présentent les estimations paramétrique et non-paramétrique des intensités du
processus semi-Markovien. Les deux estimations des risques pour la strate IMC < 25 (Figure
III.9 (a)), diffèrent dans leurs valeurs maximales. La valeur de stabilisation est différente
mais ne peut être interprétée car les valeurs nulles (nombreuses au delà de 7 ou 8 mois) sont
supprimées. Cependant, les deux estimations ont en commun leurs formes en cloche sur les
huit premiers mois. Dans la strate des patients en surpoids (Figure III.9 (b)), les valeurs
maximales des estimations sont proches et se produisent pour le même temps. Les deux
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
68 Chapitre I II. Modèle semi-Markovien homogène
estimations restent néanmoins différentes, en particulier à cause des natures paramétrique
et non-paramétrique.
Temps (années)
Fonction de risque du processus (IMC<25)
0.0 0.5 1.0 1.5 2.0 2.5
0.0 0.2 0.4 0.6
(a)
Estimation non-paramétrique
Estimation paramétrique
Temps (années)
Fonction de risque du processus (IMC>=25)
0.0 0.5 1.0 1.5 2.0 2.5
0.0 0.2 0.4 0.6
(b)
Estimation non-paramétrique
Estimation paramétrique
Fig. III.9 – Comparaison des estimations paramétrique et non-paramétrique (α = 0.3) des
intensités du processus semi-Markovien associées à la transition 3 → 1. (a) strate IMC < 25;
(b) strate IMC > 25.
6 Discussion
Dans ce chapitre, deux méthodes d’estimation pour mo dèles semi-Markoviens homogènes
ont été présentées. Nous avons proposé une extension de la méthode non-paramétrique
étudiée par Ouhbi et Limnios [1999]. Cette méthode permet d’estimer de manière non-
paramétrique les intensités d’un processus semi-Markovien (dans un modèle sans ou avec
états absorbants) à partir d’un échantillon i.i.d de processus. Nous avons également pré-
senté une méthode d’estimation paramétrique qui consiste à estimer les distributions des
temps de séjour et les probabilités de la chaîne de Markov sous-jacente par des fonctions
paramétriques. Il est ensuite possible de déduire des estimations des intensités du processus
semi-Markovien. La méthode est adaptée afin de pouvoir choisir des lois de temps de séjour
et un nombre de covariables spécifiques à chaque transition. Outre les lois exponentielles et
Weibull qui sont généralement utilisées, nous avons considéré pour la modélisation des lois
de Weibull généralisées pour prendre en compte les formes en ∪ et ∩ des distributions des
temps de séjour.
6.1 Application
Dans un premier temps, la méthode d’estimation paramétrique est appliquée au cas de
l’asthme. D’un point de vue clinique, les résultats sur l’impact de l’IMC sur l’évolution de la
maladie sont les plus intéressants. En effet, tous les résultats obtenus avec la stratification
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
6. Discussion 69
et avec les modèles univariés montrent qu’un patient en surpoids a moins de chances de
passer d’un état inacceptable vers un état optimal. Ces résultats sont à mettre en relation
avec ceux obtenus avec un modèle de Markov homogène (cf. chapitre II). En effet, avec les
deux modèles, le surpoids diminue la possibilité d’une transition de l’état inacceptable vers
un état optimal.
L’utilisation des modèles semi-Markoviens semble justifiée dans le cas de l’asthme. En
effet, les lois exponentielles (implicites à une modélisation Markovienne homogène) ne sont
pas retenues pour la modélisation des intensités de temps de séjour. Les lois de Weibull
généralisées sont toujours les mieux adaptées pour modéliser les formes en cloche des inten-
sités de temps de séjour dans les états de contrôle de l’asthme. Par conséquent, l’estimation
des risques de temps de séjour et des risques du processus est plus précise avec des lois de
Weibull généralisées. Cependant, dans notre cas, l’impact de la distribution est à relativiser.
En effet, les estimations des coefficients de régression et des intensités du processus obtenues
avec des lois de Weibull sont relativement proches de celles obtenues avec des lois de Weibull
généralisées.
Dans le cas de l’asthme, la méthode d’estimation non-paramétrique fournit moins de
résultats intéressants. En effet, les estimations des intensités varient fortement en fonction
du choix de la subdivision. De plus, la nature non-paramétrique des estimations rend les
résultats difficilement interprétables d’un point de vue clinique. Cependant, la comparai-
son des méthodes paramétrique et non-paramétrique montre que même si les estimations
diffèrent en plusieurs points, la forme en cloche de ces estimations est sensiblement la même.
6.2 Méthodes
La méthode d’estimation paramétrique fournit plusieurs résultats pouvant être interpré-
tés d’un point de vue clinique. Tout d’abord, l’effet des covariables sur les risques des temps
de séjour peut être quantifié par l’intermédiaire des coefficients de régression (même si les
risques des temps de séjour sont difficiles à interpréter de par leurs définitions). Ensuite, les
risques du processus semi-Markovien fournissent des résultats visuels faciles à interpréter en
terme d’évolution de la maladie.
Le modèle à risques proportionnels est très utile pour incorporer des covariables dans
la modélisation. Cependant, l’hypothèse de proportionnalité est souvent contraignante et
impose une prudence dans l’interprétation des résultats. L’utilisation de la stratification
permet d’observer l’impact des covariables sans avoir des résultats biaisés par l’hypothèse de
proportionnalité. Cependant, avec cette méthode, l’impact des covariables n’est pas quantifié
et on est confronté aux problèmes liés à l’analyse en sous-groupes.
Dans les différents choix de modélisation (distributions des temps de séjour, nombre
de covariables), on doit faire un compromis entre le nombre de paramètres du modèle et le
nombre d’observations de la base de données : si le nombre de paramètres est trop imp ortant,
les estimations sont peu fiables et difficilement interprétables.
La méthode d’estimation non-paramétrique est attractive car elle permet d’obtenir di-
rectement les estimations des intensités du processus semi-Markovien sans faire aucune
hypothèse sur la forme des distributions des temps de séjour. Cependant, la nature non-
paramétrique de l’estimation rend l’interprétation délicate. De plus, le choix de la subdi-
vision nécessaire à l’application de la méthode peut influencer fortement les estimations.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
70 Chapitre I II. Modèle semi-Markovien homogène
Notons également que la présentation actuelle de la méthode ne permet pas d’introduire des
covariables. L’estimation non-paramétrique reste néanmoins intéressante pour une première
analyse des données. En effet, cette méthode permet de se faire une idée générale de la forme
des intensités du processus semi-Markovien.
Afin de développer la méthode d’estimation non-paramétrique, il serait intéressant d’étu-
dier le choix optimal de la subdivision (par exemple, en choisissant la valeur de α qui maxi-
mise la vraisemblance). De même, on pourrait essayer d’introduire des covariables dans la
méthode. Il sera également important d’étudier les propriétés asymptotiques des estima-
teurs non-paramétriques en adaptant les démonstrations de Ouhbi et Limnios [1999]. Dans
un contexte paramétrique, on pourrait développer une méthode d’estimation des distribu-
tions des temps de séjour qui utiliserait les bases de fonctions splines (à noeuds fixes ou
variables) ou encore les bases de Fourier.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
Chapitre IV
Modèle de Markov non-homogène
1 Introduction
Les modèles de Markov homogènes (cf. chapitre I I page 21) sont de plus en plus ap-
pliqués en épidémiologie. La méthodologie est bien connue et plusieurs programmes sont
disponibles pour ajuster ce type de modèles (Alioum et Commenges [2001], Jackson [2005]).
Cependant, dans de nombreuses applications, l’hypothèse d’homogénéité (intensités de tran-
sition constantes au cours du temps) n’est pas adaptée et s’avère trop restrictive.
Les modèles de Markov non-homogènes comme les modèles semi-Markoviens, p euvent
être ajustés pour complexifier la modélisation de l’évolution du processus. Ces deux modèles
sont comparables en terme de flexibilité et le choix du modèle dépend de l’échelle de temps
la plus importante dans une application donnée. Un modèle semi-Markovien sera adapté
pour étudier l’impact de la durée écoulée dans un état avant de transiter alors qu’un modèle
non-homogène accordera de l’importance à la durée du suivi.
En 1975, Odd Aalen expose dans sa thèse des méthodes d’inférence statistique pour
une famille de processus de comptage (Aalen [1978]). Depuis, la théorie des processus de
comptage a été largement étudiée et a permis le développement de plusieurs estimateurs
(Andersen et al. [1993]). Elle fournit notamment, par l’intermédiaire de la théorie des mar-
tingales, un cadre rigoureux à de nombreuses problématiques (en particulier concernant les
propriétés asymptotiques des estimateurs). Le nombre de publications lié au sujet est très
important : on peut sans être exhaustif noter les nombreuses contributions de Aalen O., An-
dersen P.K., Gill R.D., Keiding N., Borgan ∅., Dabrowska D.M. ou encore de Hougaard P.
La théorie des processus de comptage permet d’obtenir des estimateurs non-paramétriques
dans les modèles de Markov non-homogènes. En particulier, l’estimateur Aalen-Johansen
(Aalen et Johansen [ 1978]) permet d’obtenir une estimation de la matrice des probabilités
de transition dans un modèle de Markov. Cet estimateur peut également être adapté à un
modèle de régression semi-paramétrique afin d’étudier les effets des covariables (Andersen
et al. [1991]). Les estimateurs ainsi obtenus par la théorie des processus de comptage, consti-
tuent une généralisation aux modèles Markoviens, des estimateurs de Kaplan-Meier et de
la vraisemblance partielle de Cox. Cette théorie confère une justification mathématique à
l’approche « heuristique » permettant la construction de ces estimateurs.
71
72 Chapitre IV. Modèle de Markov non-homogène
Ces méthodes constituent une alternative intéressante quand l’hypothèse d’homogénéité
est trop forte. Cep endant, l’utilisation de ces méthodes reste limitée car la théorie des pro-
cessus de comptage fait intervenir des notions mathématiques complexes et la programma-
tion des estimateurs apparaît compliquée. Même si, récemment, une macro SAS permettant
d’ajuster un modèle à deux états a été publiée (Paes et de Lima [2004]), il n’existe pas de
programme permettant d’obtenir ces estimateurs pour des modèles multi-états spécifiques.
Ce chapitre aborde des méthodes d’estimation basées sur la théorie des processus de
comptage. Afin de rendre ce travail accessible tant au mathématicien qu’à l’épidémiologiste,
les notions mathématiques complexes relatives à la théorie des processus de comptage sont
présentées en annexe page 161.
La première partie de ce chapitre, présente les résultats essentiels liés aux processus de
comptage et leur relation avec les processus de Markov. La prise en compte de la censure
et le cas particulier du modèle homogène sont également considérés. La deuxième partie
présente les estimateurs non-paramétriques de Nelson-Aalen et de Aalen-Johansen. La troi-
sième partie décrit l’adaptation de ces estimateurs à un modèle semi-paramétrique de type
Cox. Ensuite, l’adaptation de cette théorie au cas des modèles semi-Markoviens est abordée.
La dernière partie du chapitre considère l’application de ces méthodes à la base de données
sur l’asthme afin de modéliser l’évolution en prenant en compte la durée du suivi. Les résul-
tats de ce chapitre font l’objet d’une publication (Saint-Pierre et al. [2005c]) acceptée dans
la revue Far East Journal of Theoritical Statistics.
Nous présentons également en annexe (page 177), un « guide » détaillant la program-
mation des estimateurs à partir d’une matrice décrivant les données. L’objet de ce guide
est de permettre à chacun d’implémenter (dans tous les langages de programmation) un
modèle spécifique à l’application donnée (choix du nombre d’états, du nombre de transition,
du nombre de covariables). Notons que les programmes ont été validés sur le jeu de données
utilisé par Andersen et al. [1991] et Andersen et al. [1993]. Cette méthode de programmation
fait l’objet d’un travail (Saint-Pierre et al. [2004]) soumis dans la revue Computer Methods
and Programs in Biomedicine.
2 Processus de Markov et processus de comptage
2.1 Processus de Markov
Soit {X(t), t ∈ T = [0, τ ]} un processus de Markov non-homogène (à temps continu) à
espace d’états fini S = {1, . . . , k} sur (Ω, A, P) . X(t) représente l’état du processus au temps
t.
Définition 3 Un processus de Markov à temps continu est complètement défini par
1. Son vecteur des probabilités initiales, notées P
0
tel que
P
0
[j] = P {X(0) = j}, j = 1, ..., k.
avec
P
k
j=1
P {X(0) = j} = 1
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Processus de Markov et processus de comptage 73
2. Sa matrice de probabilités de transition entre les instants s et t : P(s, t) =
{p
hj
(s, t)}
h,j
telle que
p
hj
(s, t) = P{X(t) = j | X(s) = h}, ∀0 6 s 6 t,∀h, j ∈ S,
avec
P(s, s) = Id,
k
X
j=1
p
hj
(s, t) = 1 pour tout h et 0 6 s 6 t.
La mesure d’intensité cumulée est un autre paramètre qui permet de définir un pro-
cessus de Markov. C’est une matrice de fonctions de dimension k × k, notée A = {A
hj
}
h,j
,
telle que,
A
hh
(t) = −
X
j6=h
A
hj
(t) , pour tout t,
et telle que p our h 6= j, A
hj
(.) soit une fonction cadlag (continue à droite avec une limite
à gauche) non décroissante, nulle en zéro. A
hj
est la fonction d’intensité cumulée pour les
transitions de l’état h vers l’état j, alors que A
hh
est l’opposée de la fonction d’intensité
cumulée pour les transitions qui quittent l’état h. Les équations différentielles de Kolmogorov
définissent le lien entre la matrice de probabilité de transition et la matrice d’intensité
cumulée
– équation « forward » de Kolmogorov
∂P (s, t)
∂t
= P (s, t) A (dt) , (IV.1)
– équation « backward » de Kolmogorov
∂P (s, t)
∂s
= A (ds) P (s, t) . (IV.2)
Remarque 12 La notation A(dt) renvoie à l’écriture formelle de l’intégrale stochastique
(cf. page 161). Si A(t) est un processus croissant alors,
A(t) =
Z
t
0
dA(s)
=
Z
t
0
A(ds).
La notion de produit intégral est introduite pour écrire la vraisemblance du processus
et pour obtenir une relation entre la matrice des intensités de transition et la matrice des
probabilités de transition. Dans ce qui suit, la notation P
]s,t]
suggère une version continue
du pro duit ordinaire comme l’intégrale
R
généralise la somme
P
.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
74 Chapitre IV. Modèle de Markov non-homogène
Théorème 1 Soit A une matrice de fonctions de dimension k × k correspondant à une
mesure d’intensité (matrice des intensités cumulées). Soit Id la matrice identité.
Alors la matrice,
P (s, t) = P
u∈]s,t]
(Id + A (du)) , s 6 t, t, s ∈ T , (IV.3)
est la matrice de probabilité de transition d’un processus de Markov à espace d’états fini
{1, . . . , k}.
Quand la fonction A est une fonction en escalier (cadlag), le produit intégral (IV.3)
devient un produit fini sur les temps de sauts de A ; ainsi
P (s, t) =
n
Q
i=1
(Id + ∆A (T
k
)) , s 6 t,
où s < T
1
< ··· < T
n
= t sont les temps de sauts et ∆A (T
k
) = A (T
k
)−A (T
k−1
) et T
0
= 0.
Des résultats complémentaires sur le produit intégral sont données en annexe page 162.
2.2 Processus de comptage
La notion de processus de comptage constitue la base de la théorie des processus sto-
chastiques. A partir de ces processus ponctuels, différentes classes de processus avec des
trajectoires de saut peuvent être définies à savoir les processus de Markov ou semi-Markov.
Définition 4 Un processus aléatoire de comptage N (.) sur T est une fonction aléatoire
N : T × Ω −→ N
(t, ω) 7−→ N (t, ω) ,
cadlag, adaptée (cf. page 161), nulle en zéro, croissante et ayant des sauts d’amplitude 1.
Le concept de filtration permet de définir l’ensemble des événements observés à l’instant
t, c’est-à-dire toute l’information disponible à l’instant t. La filtration naturelle {F
t
: t ∈
T } associée au processus N est définie par la σ-algèbre
F
t
= σ (N (u) , 0 6 u 6 t) .
Définition 5 Un processus de comptage k-dimensionnel N = (N
1
, N
2
, ..., N
k
) est appelé
processus de comptage multivarié si chacune de ses composantes est un processus de
comptage univarié et s’il ne peut y avoir simultanéité des sauts de deux (ou plus) de ses
composantes.
La proposition qui suit, permet de faire le lien entre la théorie des processus de comptage
et l’écriture usuelle des processus Markoviens. Un processus de Markov à temps continu et
à espace d’états discret peut s’écrire comme un processus de comptage.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Processus de Markov et processus de comptage 75
Proposition 1 Soit A la mesure d’intensité d’un processus de Markov {X (t) , t ∈ T }. Dé-
finissons les fonctions suivantes
Y
h
(t) = 11
{X(t−)=h}
,
N
hj
(t) = card
©
s 6 t : X
¡
s
−
¢
= h, X (s) = j
ª
h 6= j.
N = (N
hj
; h 6= j) est un processus de comptage multivarié. Le processus d’intensité
cumulée (ou le compensateur de N) par rapport à σ {X (s) , s 6 t} est Λ = (Λ
hj
; h 6= j)
avec
Λ
hj
(t) =
Z
t
0
Y
h
(s) A
hj
(ds) . (IV.4)
De plus, les processus M
hj
définis par
M
hj
= N
hj
− Λ
hj
(IV.5)
sont des martingales.
Le processus de comptage N
hj
(t) compte le nombre de transitions observées (du proces-
sus X) de l’état h vers l’état j dans l’intervalle de temps [0, t] . La quantité Y
h
(t) renseigne
sur l’état du processus : si le processus X est dans l’état h juste avant l’instant t alors
Y
h
(t) = 1; Y
h
(t) = 0 sinon.
La décomposition (IV.5) du processus de comptage en son compensateur et une martin-
gale est un résultat essentiel de la théorie des processus de comptage. Cette décomposition
permet notamment d’obtenir les résultats asymptotiques par l’intermédiaire du théorème
de la limite centrale pour martingales.
Remarque 13
–
La connaissance du processus de comptage N = (N
hj
; h 6= j) sur [0, t] , apporte la
même information que l’observation du processus X (u) , 0 6 u 6 t.
– Des définitions complémentaires concernant les processus de comptages, les martin-
gales et les processus ponctuels marqués sont données en annexe page 163.
Désormais, les fonctions A
hj
(.) sont supposées absolument continues, c’est-à-dire qu’il
existe des fonctions d’intensité α
hj
telles que
A
hj
(t) =
Z
t
0
α
hj
(u)du.
Dans ce cas, la proposition précédente, implique que le processus N a un processus d’in-
tensité multiplicative λ = (λ
hj
; h 6= j) par rapport à F
t
= σ (N (u) , 0 6 u 6 t) telle
que
λ
hj
(t) = α
hj
(t)Y
h
(t).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
76 Chapitre IV. Modèle de Markov non-homogène
Notons que λ
hj
(.) est une variable aléatoire par l’intermédiaire de Y
h
(t) ; α
hj
(.) est déter-
ministe. Les fonctions α
hj
(.) sont appelées les intensités de transition et sont définies
par
α
hj
(t) = lim
∆t→0
p
hj
(t, t + ∆t)
∆t
, h 6= j,
α
hh
(t) = −
X
h6=j
α
hj
(t), h = 1, ..., k.
Le temps de séjour dans l’état h suit une loi continue de fonction de risque −α
hh
(.). La
probabilité de quitter l’état h, sachant une transition vers j 6= h au temps t, est donnée par
−α
hj
(t)/α
hh
(t).
2.3 Vraisemblance
Considérons, le processus de comptage N = {N
hj
(t) , h, j ∈ S, h 6= j}, sa filtration na-
turelle F
t
et Λ = (Λ
hj
; h, j ∈ S, h 6= j) son compensateur par rapport à F
t
.
La F
t
-vraisemblance basée sur l’observation de N (t) s’obtient par le théorème 6 page
166. Conditionnellement à l’état initial, la vraisemblance complète est donnée par
L = P
t∈[0,τ]
k
Q
h=1
Q
j6=h
[dΛ
hj
(t)]
∆N
hj
(t)
"
1 −
k
P
h=1
P
j6=h
Λ
hj
(t)
#
1−
k
P
h=1
P
j6=h
∆N
hj
(t)
. (IV.6)
où ∆Z(t) = Z(t) − Z(t
−
). D’après l’équation (IV.4) et comme A
hj
(t) =
R
t
0
α
hj
(u)du, la
vraisemblance s’écrit,
L = P
t∈T
k
Q
h=1
Q
j6=h
(α
hj
(t)Y
h
(t))
∆N
hj
(t)
Ã
1 −
k
P
h=1
P
j6=h
α
hj
(t)Y
h
(t)dt
!
1−
k
P
h=1
P
j6=h
∆N
hj
(t)
(IV.7)
2.4 Processus de comptage et censure à droite
2.4.1 Définitions
Définition 6 Une variable de censure U est définie par la possible non-observation de
l’événement. Si l’on observe U, et non T , et que l’on sait que T > U (respectivement
T < U, U
1
< T < U
2
), on dit qu’il y a censure à droite (respectivement censure à gauche,
censure par intervalle).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Processus de Markov et processus de comptage 77
X peut être considérée comme la durée séparant un événement initial A d’un événement
final B, ou comme la durée pendant laquelle un sujet reste dans un état donné (auquel cas A
désigne l’entrée dans cet état et B la sortie de cet état – par exemple le chômage). La censure
à droite, dont il sera essentiellement question par la suite, est due à la non-observation de
B, dont on sait seulement qu’il sera postérieur à la dernière date d’observation du sujet.
Dans les études de cohorte, on rencontre la censure à droite p our deux raisons :
(i) le sujet n’est pas rentré dans un état absorbant avant la fin de l’étude (date de point),
on parle « d’exclu vivant »,
(ii) le sujet a quitté l’étude en cours pour différentes raisons, par exemple un déménagement
ou un refus de continuer à participer à la cohorte, c’est ce que l’on nomme des « perdus
de vue ».
Par ailleurs, la censure se distingue de la troncature : une observation est dite tronquée
si elle est conditionnelle à un autre événement. Par exemple, pour des données de survie,
on dit qu’il y a troncature à gauche (respectivement à droite) lorsque la variable d’intérêt
T
i
(durée de vie du i
`eme
individu) n’est observable qu’à la condition T
i
> c (respectivement
T
i
< c), où c > 0 est un seuil fixé. La troncature élimine de l’étude une partie des T
i
, ce qui
a pour conséquence de faire porter l’analyse uniquement sur la loi de T conditionnellement
à l’événement {T < c} (respectivement {T > c})
Dans ce qui suit, nous verrons comment la censure à droite, une forme de données
incomplètes parmi les plus courantes, peut être prise en compte dans les modèles basés sur
les pro cessus de comptage.
2.4.2 Notations
Afin d’ab order la censure par les processus de comptage, considérons :
– N (t) le processus de comptage multivarié non censuré par rapport à la filtration
naturelle F
t
= σ (N (u) , 0 6 u 6 t),
N (t) = (N
hj
(t) , h, j = 1, ..., k, h 6= j) ,
où
N
hj
(t) = 11
{
T
hj
6t
}
avec T
hj
le temps d’apparition de la transition de l’état h vers j.
– Y
h
(t) les indicateurs permettant de savoir si le processus X est dans l’état h juste
avant le temps t,
Y
h
(t) = 11
{X(t−)=h}
, h = 1, . . . , k.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
78 Chapitre IV. Modèle de Markov non-homogène
– C (t) le processus de censure à droite,
C (t) = (C
h
(t) , h = 1, ..., k) ,
avec
C
h
(t) = I
{t6U
h
}
,
où U
h
est le temps de censure par rapport à l’état h.
Remarque 14 Dans la plupart des études épidémiologiques, le processus de censure ne
dépend que de l’individu et non du type d’événement. C’est pourquoi, dans la suite, l’indice
h est suprimé . Les résultats obtenus peuvent facilement être adaptés au cas de différents
mécanismes de censure pour différents types d’événements.
L’objectif est d’étudier le processus de comptage N (.) en tenant compte de la censure à
droite. Celle-ci introduit une variation aléatoire supplémentaire que la tribu F
t
ne prend pas
en compte. Cette dernière a donc besoin d’être élargie. Notons G
t
cette nouvelle filtration :
G
t
= F
t
∨ σ (C (u) , 0 6 u 6 t) ,
Considérons, les processus réellement observés après censure :
– N
c
(.) le processus de comptage censuré à droite qui représente la partie observable
de N (.) :
N
c
(t) =
¡
N
c
hj
(t) , h, j = 1, ..., k, h 6= j
¢
,
avec
N
c
hj
(t) =
Z
t
0
C (s) dN
hj
(s) ,
– Y
c
h
(t) tel que,
Y
c
h
(t) = C (t) Y
h
(t) , h = 1, . . . , k.
2.4.3 Censure à droite indépendante
Un problème fréquent avec la censure à droite est qu’elle peut modifier les intensités des
événements d’interêt. Si, par exemple, dans un essai clinique, les patients particulièrement
malades sont enlevés de l’étude, les patients qui restent à risque ne sont plus représentatifs
de l’échantillon total et ainsi les intensités sont différentes d’une situation sans censure. La
notion de censure à droite indépendante permet d’éviter ce problème.
Définition 7 Soit N (.) un processus de comptage multivarié de compensateur Λ (.) par
rapport à la filtration F
t
. Soit C (.) un processus de censure à droite prévisible par rapport
à G
t
⊇ F
t
.
Alors, la censure à droite générée par C (.) est indépendante si le compensateur de
N (.) par rapport à G
t
est aussi Λ (.).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Processus de Markov et processus de comptage 79
Autrement dit, la connaissance des temps de censure juste avant t ne modifie pas l’in-
tensité du processus N au temps t. Lorsque la censure est indépendante, la répartition des
temps de décès est la même pour les patients censurés et pour les patients non censurés.
En pratique, cela signifie, que les individus ne doivent pas être censurés parce qu’ils ont
un risque de décès particulièrement élévé ou faible. La censure devient dépendante si, par
exemple, certains patients ne sont plus suivis car leur état s’est sérieusement dégradé (les
personnes les plus à risque sont enlevées de l’étude).
Proposition 2 Sous l’hypothèse de censure à droite indépendante,
(1) la mesure d’intensité (le compensateur) de N
c
(.) par rapport à G
t
est
Λ
c
hj
(t) =
Z
t
0
C (s) dΛ
hj
(s) .
(2) si le processus N (.) a une intensité multiplicative par rapport à G
t
alors N
c
(.) a aussi
une intensité multiplicative par rapport à G
t
.
Proposition 3 Soit N
c
(t) =
³
N
c
hj
(t) ; h, j = 1, ..., k, h 6= j
´
un processus de comptage cen-
suré. Si la censure à droite est indépendante alors la vraisemblance du modèle s’écrit
L
c
= P
t∈[0,τ]
k
Q
h=1
Q
j6=h
£
dΛ
c
hj
(t)
¤
∆N
c
hj
(t)
[1 − dΛ
c
..
(t)]
1−∆N
c
..
(t)
. (IV.8)
où
Λ
c
..
=
k
P
h=1
P
j6=h
Λ
c
hj
,
et
N
c
..
(t) =
k
P
h=1
P
j6=h
N
c
hj
(t) .
A la vue des propositions précédentes, la vraisemblance partielle avec censure a la même
forme que la vraisemblance sans censure (IV.6). Le fait que la forme de la vraisemblance soit
préservée par la censure indépendante implique que les propriétés des martingales restent
les mêmes. Ainsi, lorsque la censure est indépendante, l’inférence et la théorie asymptotique
sont toujours applicables de la même manière que pour des données non censurées (par la
structure de martingale).
Des résultats complémentaires sur la censure indépendante sont donnés page 172. En
particulier, le principe général de la vraisemblance partielle est décrit page 167. Ce dernier
est utilisé pour construire la vraisemblance associée à un processus censuré (IV.8). La notion
de censure non-informative est également définie page 174.
Désormais, nous nous placerons dans le cadre d’un mécanisme de censure indépen-
dante. Dans tout ce qui suit, les processus considérés seront des versions censurées mêmes
si les notations ne le feront plus apparaître.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
80 Chapitre IV. Modèle de Markov non-homogène
Remarque 15 Dans certaines situations, la censure apporte une information sur l’état de
santé du patient est devient dépendante. L’expression de la vraisemblance ne correspond plus
à une vraisemblance complète car toute l’information n’est pas utilisée. Cette vraisemblance
peut toujours être utilisée mais cela entraîne un biais dans l’estimation.
2.4.4 Caractéristique de la censure à droite
Afin de simplifier les différentes définitions et les exemples, les mécanismes de censure
à droite sont décrits dans le cadre des données de survie. En effet, les mêmes principes
s’appliquent aux processus Markov.
Dans le cas de l’analyse de la survie, les données observées sont :
³
˜
T
i
, D
i
, i = 1, ..., n
´
avec
– T
i
est la date de survenue de l’événement chez l’individu i;
– U
i
la date de censure correspondante ;
–
˜
T
i
= min (T
i
, U
i
) , le temps d’observation ;
– D
i
= 11
{
˜
T
i
=T
i
}
, un indicateur de censure.
Quand l’événement se produit, T
i
est « réalisée » (D
i
= 1). Quand il ne se produit pas
(individu étant perdu de vue ou bien exclu vivant), c’est U
i
qui est « réalisée » (D
i
= 0).
Censure non aléatoire de type I :
Les observations pour chaque individu sont arrêtées à un temps fixé u commun à tous,
i.e.
½
˜
T
i
= min (T
i
, u)
D
i
= 11
{T
i
6u}
Ce mécanisme de censure est couramment utilisé dans l’industrie pour tester la durée
de vie de n objets identiques sur un intervalle d’observation fixé [0, u] . En biologie, afin de
tester l’efficacité d’une molécule sur un lot de souris, les souris survivantes sont sacrifiées au
bout d’un temps déterminé u.
Remarque 16 Bien que similaires dans l’écriture de leur définition, la censure non-aléatoire
de type I à droite et la troncature à droite doivent être distinguées : en effet, l’inférence statis-
tique diffère selon qu’elle s’applique à l’un ou l’autre de ces deux types de données de survie.
Dans le cas de données censurées, la vraisemblance sera le produit d’un nombre aléatoire de
facteurs ; dans le cas de données tronquées, la vraisemblance sera le produit d’un nombre fixe
de facteurs.
Censure aléatoire de type I :
Les observations pour chaque individu sont :
½
˜
T
i
= min (T
i
, U
i
)
D
i
= I
{T
i
6U
i
}
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Estimation non-paramétrique 81
où U
i
est un temps de censure aléatoire indépendant de T
i
. Si, de plus, les (U
i
)
i=1,...,n
sont
i.i.d. la censure aléatoire de type I est dite « classique ».
Cette censure est l’une des plus utilisées pour l’analyse de données de survie. Par exemple,
dans un essai thérapeutique, on admet que les sujets entrent de façon aléatoire. Si la date
d’analyse est fixée a priori, le délai entre la date d’entrée et la date de point, c’est-à-dire le
temps de participation des exclus-vivants, est aléatoire. La censure aléatoire de type I est
indépendante quand le processus d’événement et le processus de censure sont indépendants.
Censure de type II :
Les observations pour chaque individu sont arrêtées à un temps aléatoire commun à
tous, i.e.
(
˜
T
i
= min
¡
T
i
, T
(r)
¢
D
i
= I
{
T
i
6T
(r)
}
où r est un entier fixé, 1 6 r 6 n. T
(1)
, ..., T
(r)
, ..., T
(n)
est la statistique d’ordre, i.e. T
(r)
correspond au r
i`eme
temps de décès.
Ce mécanisme de censure est utilisé dans le monde industriel, par exemple lorsque l’on
veut observer la durée de fonctionnement de n machines tant que r d’entre elles ne tombent
pas en panne. En biologie, pour tester l’efficacité d’un poison sur un lot de souris, la durée
de l’étude correspond au temps que mettent r souris à mourir.
Notons, que dans le cas des processus de Markov, la censure peut dépendre des condi-
tions initiales. Par exemple, on pourrait avoir une censure aléatoire avec des distributions
différentes suivant l’état de l’individu au temps 0.
Par la suite, nous considérerons un mécanisme de censure aléatoire de type I et
indépendante.
3 Estimation non-paramétrique
3.1 Observations et notations
Considérons un échantillon X
1
(.) , ..., X
n
(.) de processus de Markov indépendants et
identiquement distribués à espace d’états fini S = {1, . . . , k}. Le processus X
i
(.) associé à
l’individu i représente l’état de l’individu au temps t. On pose T = [0, τ ] , où τ est la date
de p oint. On défini également, pour i ∈ {1, . . . , n}
– Les processus de comptage N
hji
(t) qui comptent le nombre de transitions de l’état h
vers l’état j dans [0, t] pour l’individu i,
N
hji
(t) = card
©
s 6 t : X
i
¡
s
−
¢
= h, X
i
(s) = j
ª
, ∀h, j = 1, . . . , k, h 6= j.
– Y
hi
(t) qui est un indicateur pour savoir si X
i
est dans l’état h juste avant le temps t,
Y
hi
(t) = 11
{X
i
(t−)=h}
, h = 1, . . . , k.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
82 Chapitre IV. Modèle de Markov non-homogène
– Le pro cessus de comptage N
hj+
(t) qui compte le nombre total de transitions de l’état
h vers l’état j dans [0, t] (dans toute la population),
N
hj+
(t) =
n
X
i=1
N
hji
(t) , ∀h, j = 1, . . . , k, h 6= j..
– Y
h+
(t) renseigne sur le nombre total de personne « à risque » dans l’état h juste avant
l’instant t, c’est-à-dire le nombre de personnes succeptibles de subir une transition à
partir de l’état h,
Y
h+
(t) =
n
X
i=1
Y
hi
(t) h = 1, . . . , k.
Proposition 4 Le processus N
hji
(t) satisfait aux conditions d’un modèle à intensité mul-
tiplicative, i.e. ∀i = 1, . . . , n; ∀h, j = 1, . . . , k, h 6= j,
λ
hji
(t) = α
hji
(t)Y
hi
(t)
La population étant supposée homogène, α
hji
(t) = α
hj
(t) pour tout i, ainsi
λ
hji
(t) = α
hj
(t)Y
hi
(t). (IV.9)
D’après l’équation (IV.7), la vraisemblance complète associée au processus de comp-
tage N = {N
hji
(t) , i = 1, . . . , n; h, j ∈ S, h 6= j} conditionnellement aux données initiales
est donnée par,
L = P
t∈T
Y
i
Y
h6=j
(α
hj
(t)Y
hi
(t))
∆N
hji
(t)
1 −
X
i
X
h6=j
α
hj
(t)Y
hi
(t)dt
1−
P
i
P
h6=j
∆N
hji
(t)
= P
t∈T
Y
h6=j
(α
hj
(t))
∆N
hj+
(t)
1 −
X
h6=j
α
hj
(t)Y
h+
(t)dt
1−
P
h6=j
∆N
hj+
(t)
.
Par conséquent, le processus agrégé N
hj+
(t) est un processus de comptage ayant pour
intensité
λ
hj
(t) = α
hj
(t)Y
h+
(t), h 6= j.
où le premier terme est une intensité au niveau individuel et le second est un processus
renseignant sur les personnes à risque.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Estimation non-paramétrique 83
3.2 Estimation des intensités cumulées
Pour les démonstrations des propriétés de cette section, nous renvoyons le lecteur à
l’ouvrage de référence (Andersen et al. [1993]).
Dans la suite, nous considérons le processus N = {N
hj+
(t) , h, j ∈ S, h 6= j} obtenu
après agrégation des observations (censurées ou non). Ce processus a une intensité λ =
{λ
hj
(t) , h, j ∈ S, h 6= j} satisfaisant aux conditions d’un modèle à intensité multiplicative
décrit précédemment.
Les intensités de transition vérifient
R
t
0
α
hj
(u)du < ∞ pour tout h 6= j et pour tout
t ∈ T . On considère une estimation non-paramétrique des intensités cumulées. Ainsi, aucune
hypothèse supplémentaire n’est faite sur les fonctions α
hj
.
Un estimateur des intensités cumulées A
hj
(t) =
R
t
0
α
hj
(u)du est obtenu par Nelson en
1972 pour des données censurées et par Aalen en 1978 dans le cadre des processus de
comptage.
Définition 8 L’estimateur de Nelson-Aalen des fonctions d’intensité cumulée est défini
ˆ
A
hj
(t) =
Z
t
0
J
h
(u)
Y
h+
(u)
dN
hj+
(u), ∀h 6= j, (IV.10)
où J
h
(t) = 11
{Y
h+
(t)>0}
.
Notons que J
h
(s)/Y
h+
(s) est interprété comme étant 0 quand Y
h+
(s) = 0. L’origine «
naturelle » de cet estimateur provient de l’équation (IV.5) qui peut s’écrire symboliquement
sous la forme
dN
hj+
(t) = Y
h+
(t)α
hj
(t)dt + dM
hj+
(t),
où dM
hj+
(t) peut être considéré comme un bruit aléatoire.
Remarque 17 Soit T
hj,1
< T
hj,2
< ··· les temps de saut successifs de N
hj+
. N
hj+
attribue
une masse 1 à chacun de ces temps de saut et une masse 0 ailleurs. Il s’ensuit qu’on peut
écrire
ˆ
A
hj
(t) comme une simple somme
ˆ
A
hj
(t) =
X
{
k:T
hj,k
6t
}
1
Y
h+
(T
hj,k
)
.
Ainsi
ˆ
A
hj
est une fonction en escalier, croissante, continue à droite, de saut 1/Y
h+
(T
hj,k
)
au temps de saut T
hj,k
de N
hj
.
Proposition 5 Un estimateur de la variance de
ˆ
A
hj
(t) est
σ
2
hj
(t) =
Z
t
0
J
h
(u)
(Y
h+
(u))
2
dN
hj+
(u), ∀h 6= j.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
84 Chapitre IV. Modèle de Markov non-homogène
Proposition 6 Sous certaines conditions (pages 190-191 de Andersen et al. [1993]),
ˆ
A
hj
(t)
est un estimateur
– biaisé, tel que
E
³
ˆ
A
hj
(t)
´
− A
hj
(t) = −
Z
t
0
α
hj
(u)P (Y
h+
(u) = 0) du,
– uniformément consistant,
– et asymptotiquement normal, tel que
³
√
n
³
ˆ
A
hj
(t) − A
hj
(t)
´
; h 6= j
´
L
−→ (U
hj
; h 6= j) ,
avec U
hj
martingales gaussiennes indépendantes telle que
(
U
hj
(0) = 0
V(U
hj
(t)) =
R
t
0
α
hj
(u)
P
k
j=1
p
jh
(0,u)
du.
Le biais de cet estimateur est très faible puisqu’en pratique, la probabilité qu’à un instant
t tous les individus ne soient plus à risque est proche de zéro. Les hypothèses sont discutées
et les démonstrations sont données pages 179 et 190-199 de Andersen et al. [1993].
3.3 Estimation des probabilités de transition
Rappelons que la matrice des probabilités de transition est définie en fonction de la
matrice des intensités cumulées par le pro duit intégral (IV.3),
P (s, t) = P
u∈]s,t]
(Id + dA (u)) 0 < s 6 t, t, s ∈ T .
avec P (s, t) = {p
hj
(s, t)}
h,j
et A (t) = {A
hj
(t)}
h,j
. L’estimateur introduit par Aalen et
Johansen en 1978 utilise cette relation et l’estimateur de Nelson-Aalen pour obtenir une
estimation de la matrice des probabilités de transition.
Définition 9 L’estimateur de Aalen-Johansen de la matrice des probabilités de transition
est défini par
ˆ
P (s, t) = P
u∈]s,t]
³
Id + d
ˆ
A (u)
´
, 0 < s 6 t, t, s ∈ T , (IV.11)
où
ˆ
P (s, t) = {ˆp
hj
(s, t)}
h,j
et
ˆ
A (t) =
n
ˆ
A
hj
(t)
o
h,j
est l’estimateur de Nelson-Aalen.
Remarque 18 p
hj
(s, t) correspond à la probabilité de transiter dans l’état j à l’instant t
sachant que le patient est dans l’état h à l’instant s. En pratique, on interprètera souvent la
quantité p
hj
(0, t).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Estimation non-paramétrique 85
Remarque 19 En pratique, il y a un nombre fini de transitions. Soient s < T
1
< ... <
T
k
< t, les temps de transition entre deux états. L’estimateur de Aalen-Johansen devient un
produit fini de matrice tel que
ˆ
P(s, t) =
k
Y
l=1
³
Id + ∆
ˆ
A (T
l
)
´
.
Dans le cas d’un modèle à trois états, où toutes les transitions entre états sont possibles,
I+∆
ˆ
A (T
l
) =
1 −
∆N
12+
(T
l
)+∆N
13+
(T
l
)
Y
1+
(T
l
)
∆N
12+
(T
l
)
Y
1+
(T
l
)
∆N
13+
(T
l
)
Y
1+
(T
l
)
∆N
21+
(T
l
)
Y
2+
(T
l
)
1 −
∆N
21+
(T
l
)+∆N
23+
(T
l
)
Y
2+
(T
l
)
∆N
23+
(T
l
)
Y
2+
(T
l
)
∆N
31+
(T
l
)
Y
3+
(T
l
)
∆N
32+
(T
l
)
Y
3+
(T
l
)
1 −
∆N
31+
(T
l
)+∆N
32+
(T
l
)
Y
3+
(T
l
)
,
où pour un processus Z(.) cadlag, ∆Z(T
l
) = Z(T
l
)−Z(T
l−1
), pour l = 2, ..., k, et ∆Z (T
1
) =
Z (T
1
) .
Proposition 7 Un premier estimateur de la covariance de ˆp
hj
(s, t) et ˆp
mr
(s, t) est
d
Cov(ˆp
hj
(s, t) , ˆp
mr
(s, t)) =
k
X
l=1
X
g6=l
Z
t
s
ˆp
hg
(s, u) ˆp
mg
(s, u) {ˆp
lj
(u, t) − ˆp
gj
(u, t)}
× {ˆp
lr
(u, t) − ˆp
gr
(u, t)}J
g
(u) (Y
g+
(u))
−2
dN
gl+
(u).
L’estimateur de la variance de ˆp
hj
(s, t) est
ˆ
V(ˆp
hj
(s, t)) =
k
X
l=1
X
g6=l
Z
t
s
(ˆp
hg
(s, u))
2
{ˆp
lj
(u, t) − ˆp
gj
(u, t)}
2
J
g
(u) (Y
g+
(u))
−2
dN
gl+
(u).
Proposition 8 Un deuxième estimateur, de type Greenwood, de la covariance de ˆp
hj
(s, t)
et ˆp
mr
(s, t) est
d
Cov(ˆp
hj
(s, t) , ˆp
mr
(s, t)) =
k
X
l=1
X
g6=l
Z
t
s
ˆp
hg
¡
s, u
−
¢
ˆp
mg
¡
s, u
−
¢
{ˆp
lj
(u, t) − ˆp
gj
(u, t)}
× {ˆp
lr
(u, t) − ˆp
gr
(u, t)}J
g
(u) (Y
g+
(u) − 1) (Y
g+
(u))
−3
dN
gl+
(u).
L’estimateur corresp ondant de la variance de ˆp
hj
(s, t) est
ˆ
V(ˆp
hj
(s, t)) =
k
X
l=1
X
g6=l
Z
t
s
¡
ˆp
hg
¡
s, u
−
¢¢
2
{ˆp
lj
(u, t) − ˆp
gj
(u, t)}
2
J
g
(u)
(Y
g+
(u) − 1)
(Y
g+
(u))
3
dN
gl+
(u).
Aalen et Johansen (1978) utilisent la décomposition en martingales (IV.5) et le théorème
de limite centrale pour martingales (cf. page 175) pour obtenir les propriétés asymptotiques
de
ˆ
P quand n → ∞.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
86 Chapitre IV. Modèle de Markov non-homogène
Proposition 9 Sous le même type de condition que pour l’estimateur de Nelson-Aalen
(pages 317-319 de Andersen et al. [1993]), ˆp
hj
(s, t) est un estimateur
– biaisé, tel que
E
³
ˆ
P (s, t)
´
> P (s, t) ,
– uniformément consistant,
– et asymptotiquement normal, tel que
√
n
³
ˆ
P (s, .) −P (s, .)
´
L
−→
Z
.
s
P (s, u) dU(u)P (u, .) ,
avec U = {U
hj
}
hj
où U
hj
martingales gaussiennes indépendantes telle que
(
U
hj
(0) = 0
V (U
hj
(t)) =
R
t
0
α
hj
(u)
P
k
j=1
p
jh
(0,u)
du.
Les démonstrations de ces propositions sont données pages 197 ; 289-290 et 317-321 de
Andersen et al. [1993].
3.4 Test des intensités de transition
Cette méthode d’estimation ne prend pas en compte l’effet des covariables dans la modé-
lisation. L’effet de certaines covariables peut cependant être testé en comparant les intensités
de transition obtenues dans chacune des strates. Considérons par exemple, le cas de deux
bras de traitements. Il est intéressant de comparer les intensités de transition dans chacune
des strates afin de comparer les deux traitements.
Proposition 10 Soit un processus de comptage N = (N
1
, N
2
) avec un processus d’intensité
λ = (λ
1
, λ
2
) tel que λ
h
(t) = α
h
(t)Y
h
(t). Soit l’hypothèse nulle,
H
0
: α
1
= α
2
, (IV.12)
Alors la statistisque de test X
2
(t) suit asymptotiquement une loi du χ
2
à un degré de liberté
sous l’hypothèse (IV.12), où
X
2
(t) =
H
2
(t)
σ(t)
,
avec,
H(t) =
Z
t
0
L(u)d
ˆ
A
1
(u) −
Z
t
0
L(u)d
ˆ
A
2
(u),
σ(t) =
Z
t
0
L
2
(u) {Y
1
(u)Y
2
(u)}
−1
d(N
1
+ N
2
)(u),
L(t) = K(t)Y
1
(t)Y
2
(t) {Y
1
(u) + Y
2
(u)}
−1
.
Le test du Log-rank est obtenu avec
K(t) = 11
{Y
1
(t)+Y
2
(t)>0}
. (IV.13)
Le test de Gehan-Wilcoxon est obtenu avec
K(t) = Y
1
(t) + Y
2
(t). (IV.14)
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Estimation non-paramétrique 87
La proposition précédente est un cas particulier (k = 2) d’une classe de statistiques de
test p our l’hypothèse suivante,
H
0
: α
1
= α
2
= ··· = α
k
,
(cf. page 345 Andersen et al. [1993]).
3.5 Cas particulier : données de survie
L’analyse des données de survie est l’étude de la survenue au cours du temps d’un
événement précis pour un groupe d’individus.
« L’événement étudié » est le passage irréversible entre deux états fixés. Le premier
état est généralement nommé « vivant » et l’état absorbant est communément appelé «
décès ». Le terme « décès » représente un changement d’état irréversible qui peut aussi
bien représenter la mort d’un individu, l’apparition d’une maladie, ou encore une panne de
machine.
Le modèle de survie peut être considéré comme un modèle de Markov non-homogène par-
ticulier comportant deux états avec une seule transition possible (Figure IV.1). Le processus
est Markovien dans le sens où le passé du processus se résume à l’état présent.
Etat 1
Décès
Etat 0
Vivant
Fig. IV.1 – Modèle de survie à deux états : vivant et décès.
Le processus ponctuel de comptage associé est un processus dont les marques sont : état
0 (vivant), état 1 (décès). La matrice des probabilités de transition associée est définie par
P (s, t) =
µ
p
00
(s, t) p
01
(s, t)
0 1
¶
,
et la matrice des intensités cumulées par
A (t) =
µ
A
00
(t) A
01
(t)
0 0
¶
.
L’application de l’équation différentielle « forward » de Kolmogorov (IV.1) aux matrices A
et P donnent l’équation suivante
∂P
00
(s, t)
∂t
= P
00
¡
s, t
−
¢
dA
00
(t) .
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
88 Chapitre IV. Modèle de Markov non-homogène
En intégrant par rapport à t, nous obtenons alors la probabilité de rester dans l’état 0 entre
les instants s et t sous la forme d’une équation de type Volterra
P
00
(s, t) =
Z
t
s
∂P
00
(s, t)
∂t
dt,
=
Z
t
s
P
00
¡
s, v
−
¢
dA
00
(v) .
Or, comme A est une matrice d’intensité de transition d’un processus Markovien, dA
00
(v) =
−dA
01
(v) . La probabilité P
00
(s, t) est de la forme
Z (s, t) = W (s, t) +
Z
t
s
Z
¡
s, v
−
¢
dX (v) ,
avec
Z (s, t) = P
00
(s, t) ,
W (s, t) = 0,
X (v) = −A
01
(v) .
Par le théorème 3 page 163, il existe une unique solution de la forme
P
00
(s, t) = P
u∈]s,t]
{1 − dA
01
(u)}. (IV.15)
P
00
(0, t) est la probabilité d’être vivant au temps t (sachant qu’on est vivant au temps 0),
c’est-à-dire que P
00
(0, t) représente la fonction de survie. Ainsi, on peut déduire de l’équation
(IV.15) et de l’estimateur de Nelson-Aalen, l’estimateur bien connu Kaplan-Meier.
Proposition 11 Soient, pour tout i = 1, ..., n,
– T
i
la date de survenue de l’événement,
– C
i
la date de censure,
–
˜
T
i
= min(T
i
, C
i
),
– Y
i
(t) = 11
{
˜
T
i
>t
}
, vaut 1 si l’individu est à risque l’instant t, 0 sinon.
– N
i
(t) = 11
{T
i
6t}
, vaut 1 si l’individu est décédé à l’instant t, 0 sinon.
Enfin, définissons
– Y
+
(t) =
P
n
i=1
Y
i
(t), le nombre total de survenues de l’événement à l’instant t,
– N
+
(t) =
P
n
i=1
N
i
(t), le nombre total d’individus à risque juste avant l’instant t,
– J (t) = 11
{Y
+
(t)>0}
.
Alors l’estimateur de Kaplan-Meier de la fonction de survie est défini par (Kaplan et
Meier [1958])
ˆ
S(t) = P
u6t
(1 − dA(u)) ,
où A est l’estimateur de Nelson-Aalen,
dA(u) =
J (u)
Y
+
(u)
dN
+
(u).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
4. Estimation semi-paramétrique 89
En pratique, le nombre d’évements est fini. Soient s < T
1
< ... < T
k
< t, les temps de
transition entre deux états. L’estimateur de Kaplan-Meier devient
ˆ
S(t) =
Y
{l;T
l
6t}
µ
1 −
1
Y
+
(T
l
)
¶
.
Remarque 20 La construction de l’estimateur Kaplan et Meier [1958], repose sur l’idée
intuitive qu’être encore en vie après l’instant t, c’est être en vie juste avant t et ne pas
mourir en t. Cette idée traduite en termes probabilistes mène à l’estimateur
S(t) = P(T > t)
= P(T > t | T > t − 1)P(T > t − 1)
= ···
= P(T > t | T > t − 1) . . . P(T > 1 | T > 0)P(T > 0).
4 Estimation semi-paramétrique
Cette section, présente un modèle de régression permettant d’ajuster les intensités de
transition en fonction de la valeur des covariables. Les estimateurs de Nelson-Aalen et de
Aalen-Johansen p euvent être étendus au cas d’un modèle où chaque intensité de transition
suit un modèle de régression à intensités proportionnelles de type Cox. La méthodologie de
la vraisemblance partielle de Cox permet d’estimer l’effet des covariables dépendantes et
indépendantes du temps.
4.1 Définitions et notations
Considérons un échantillon X
1
(.) , ..., X
n
(.) de processus de Markov indépendants et
identiquement distribués à espace d’états fini S = {1, . . . , k}. Soit τ la date de point. Soient
également, pour i ∈ {1, . . . , n}
– N
hji
(t) qui compte le nombre de transitions de l’état h vers l’état j dans [0, t] pour
l’individu i;
– Y
hi
(t) = 11
{X
i
(t−)=h}
, 1 si l’individu i est à risque dans l’état h juste avant le temps t,
0 sinon ;
– Z
i
= (Z
1i
, . . . , Z
pi
), le vecteur de covariables de dimension p.
– N
hj+
(t) =
P
n
i=1
N
hji
(t) et Y
h+
(t) =
P
n
i=1
Y
hi
(t) , les processus agrégés.
– β
hj
= (β
hj,1
, . . . , β
hj,p
), le vecteur de dimension p des coefficients de régression ;
– N = {N
hji
, h, j ∈ S, h 6= j; i = 1, . . . , n}, le processus de comptage multivarié associé
aux n individus ;
– λ = {λ
hji
, h, j ∈ S, h 6= j; i = 1, . . . , n}, le processus d’intensité par rapport à la fil-
tration F
t
.
Le modèle considéré se caractérise par une structure multiplicative des processus d’in-
tensité individuelle
λ
hji
(t) = Y
hi
(t) α
hji
(t; Z
i
),
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
90 Chapitre IV. Modèle de Markov non-homogène
où α
hji
spécifie la dépendance avec les covariables Z
i
. De plus, il est supposé que les intensités
de transition α
hji
suivent un modèle semi-paramétrique à risque multiplicatif, c’est-à-dire,
α
hji
(t; Z
i
) = α
hj0
(t) exp(β
T
hj
Z
i
), h, j ∈ S, h 6= j, i = 1, . . . , n. (IV.16)
où α
hj0
(t) est l’intensité de transition de base associée à la transition de l’état h vers l’état
j. Plus précisement, α
hj0
(.) est la fonction de risque des sujets pour lesquels toutes les
covariables explicatives sont nulles. Ce modèle est dit semi-paramétrique du fait de la
présence, dans la définition des intensités de transition, d’une partie paramétrique (la partie
de régression exp(β
T
hj
Z
i
)) et d’une partie non-paramétrique (le risque de base α
hj0
(.)).
De plus, le modèle (IV.16) est dit à risques proportionnels car, par définition, quels
que soient deux individus (1 et 2), le rapport des intensités de transition ne varie pas au
cours du temps
α
hj1
(t)
α
hj2
(t)
= exp(β
T
hj
(Z
1
− Z
2
)). (IV.17)
Les intensités de transition sont donc proportionnelles. Ceci est une conséquence du modèle,
mais c’est aussi une hypothèse qu’il faudra vérifier.
Notons que tous les mo dèles à structure multiplicative, c’est-à-dire les modèles où les
intensités de transition sont séparables en deux termes dont l’un dépend uniquement du
temps et l’autre non (par exemple (IV.16)), ont cette propriété ; ce sont des mo dèles à
risques proportionnels. Dans ces modèles, le rapport des intensités de transition représente
un risque relatif à l’instant t des sujets de caractéristique Z
1
par rapport aux sujets de
caractéristique Z
2
.
Notons également que le modèle (IV.16) est log-linéaire, c’est à dire que le logarithme
de l’intensité de transition est une fonction linéaire de Z
i
,
log α
hji
(t) − log α
hj0
(t) = β
T
hj
Z
i
.
Cette hypothèse est contraignante lorsqu’on utilise une variable explicative continue. En
effet, l’hypothèse de log-linéarité suppose que le risque relatif est constant pour une augmen-
tation d’une unité quelle que soit la valeur de la covariable explicative. C’est une hypothèse
qu’il convient de vérifier ou tout au moins d’avoir à l’esprit quand on utilise ce modèle de
régression. Par exemple, si l’on considère l’âge comme variable explicative continue et que
l’on étudie une maladie qui touche essentiellement les personnes âgées, le modèle supposera
un même risque relatif pour une augmentation de 1 an, que ce soit pour un âge de 30 ans
ou pour un âge de 70 ans.
Cette relation log-linéaire est souvent utilisée dans la littérature (Cox [1972]) car elle
permet d’avoir des intensités définies positives quelle que soit la valeur des coefficients de
régression. De plus, les résultats obtenus sont bien connus des cliniciens et sont facilement
interprétables. Cependant, d’autres choix de fonctions sont possibles (m tel que m(Z) > 0
et m(0) = 1).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
4. Estimation semi-paramétrique 91
4.2 Estimation des intensités de base
Supposons pour l’estimation que les fonctions α
hj0
(.) sont positives et que A
hj0
(t) =
R
t
0
α
hj0
(u)du < ∞, ∀h 6= j.
Les résultats qui suivent reposent sur la partie théorie mathématique des processus de
comptage présentée en annexe page 161. Rappelons que d’après le théorème 6 page 166
et par la définition du compensateur (IV.4), la vraisemblance complète associée à un
processus non censuré N
∗
est
L
∗
(β) =
Y
t6τ
n
Y
i=1
Y
h6=j
n
(dA
hji
(t)Y
hi
(t))
∆N
∗
hji
(t)
o
× exp
−
X
h6=j
n
X
i=1
Z
τ
0
Y
hi
(t) dA
hji
(t)
.
De plus, d’après la proposition 3 page 79, la vraisemblance associée à un processus
censuré (censure à droite indépendante) a une forme identique à la vraisemblance complète.
Cette vraisemblance d’un processus censuré
N
est appelée la
vraisemblance partielle.
Dans le cadre d’un modèle semi-paramétrique multiplicatif, la vraisemblance partielle s’écrit
L(β) =
Y
t6τ
n
Y
i=1
Y
h6=j
n
¡
dA
hj0
(t)Y
hi
(t) exp(β
T
hj
Z
i
)
¢
∆N
hji
(t)
o
× exp
−
X
h6=j
Z
τ
0
S
(0)
hj
(β, u)dA
hj0
(u)
(IV.18)
avec
S
(0)
hj
(β, t) =
n
X
i=1
exp(β
T
hj
Z
i
)Y
hi
(t).
En considérant β fixé, la maximisation de la vraisemblance (IV.18) par rapport à
∆A
hj0
(.) conduit à
∆
ˆ
A
hj0
(t) =
∆N
hj+
(t)
S
(0)
hj
(β, t)
.
Proposition 12 Pour β fixé, A
hj0
(t) =
R
t
0
α
hj0
(u)du est estimé par l’estimateur de Bres-
low (Breslow [1974]),
ˆ
A
hj0
(t) =
Z
t
0
J
h
(u)
P
n
i=1
exp(β
T
hj
Z
i
)Y
hi
(t)
dN
hj+
(u), (IV.19)
avec J
h
(u) = 11
{Y
h+
(t)>0}
.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
92 Chapitre IV. Modèle de Markov non-homogène
4.3 Estimation des coefficients de régression
En remplaçant, dans (IV.18), A
hj0
(t) par son estimation obtenue en (IV.19), la vraisem-
blance partielle devient,
L(β) =
Y
t
Y
i
Y
h6=j
½
³
d
ˆ
A
hj0
(t)Y
hi
(t) exp(β
T
hj
Z
i
)
´
∆N
hji
(t)
¾
× exp
−
X
h6=j
Z
τ
0
S
(0)
hj
(β, u)d
ˆ
A
hj0
(u)
=
Y
t
Y
i
Y
h6=j
Y
hi
(t) exp(β
T
hj
Z
i
)
S
(0)
hj
(β, t)
∆N
hji
(t)
[J
h
(u)dN
hj+
(u)]
∆N
hji
(t)
× exp
−
X
h6=j
Z
τ
0
J
h
(u)dN
hj+
(u)
= L
Cox
(β) ×
Y
t
Y
i=1
Y
h6=j
[J
h
(u)dN
hj+
(u)]
∆N
hji
(t)
× exp
−
X
h6=j
Z
τ
0
J
h
(u)dN
hj+
(u)
,
avec
L
Cox
(β) =
Y
t
Y
i=1
Y
h6=j
Y
hi
(t) exp(β
T
hj
Z
i
)
S
(0)
hj
(β, t)
∆N
hji
(t)
. (IV.20)
La vraisemblance L(β) se décompose en une partie dépendante de β (L
Cox
) et une partie
indépendante de β. Par définition, L
Cox
(β) est la vraisemblance partielle de Cox. Cette
vraisemblance est introduite par Cox (1972) mais par une approche complètement différente.
La vraisemblance partielle de Cox n’est pas une vraisemblance dans le sens statistique du
terme, mais il est établi qu’elle peut être utilisée comme telle pour estimer les coefficients
de régression.
Considérons la fonction de log-vraisemblance partielle de Cox,
log L
Cox
(β) =
X
i
X
h6=j
Z
τ
0
h
β
T
hj
Z
i
− log S
(0)
hj
(β, t)
i
dN
hji
(t).
Les vecteurs scores (dérivées de la Log-Vraisemblance par rapport à β
hj
) sont donnés par
U
hj
(β) =
∂ log L
Cox
(β)
∂β
hj
=
X
i
Z
τ
0
Z
i
−
S
(1)
hj
(β, t)
S
(0)
hj
(β, t)
dN
hji
(t),
avec
S
(1)
hj
(β, t) =
∂S
hj
(β, t)
∂β
hj
=
n
X
i=1
Y
hi
(t)Z
i
exp(β
T
hj
Z
i
).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
4. Estimation semi-paramétrique 93
Proposition 13 L’estimateur
ˆ
β du maximum de la vraisemblance partielle de Cox vérifie
U
hj
(
ˆ
β) = 0.
De plus,
√
n
³
ˆ
β − β
0
´
L
−→ N (0, nI
−1
(
ˆ
β)),
où I(β) est la matrice d’information de Fisher :
I(β) = −
∂
2
log L
Cox
(β)
∂β
2
=
X
h6=j
Z
τ
0
h
S
(2)
hj
(β, t)S
(0)
hj
(β, t)
i
−
h
S
(1)
hj
(β, t)
i
2
³
S
(0)
hj
(β, t)
´
2
dN
hj+
(t),
avec
S
(2)
hj
(β, t) =
n
X
i=1
Y
hi
(t) (Z
i
)
2
exp(β
hj
Z
i
).
L’inverse de la matrice d’information de Fisher étant égale à la matrice de variance-
covariance, elle fournit une estimation de la variance de
ˆ
β
hj
. En pratique, les estimations
des coefficients de régression sont obtenues par maximisation de la log-vraisemblance à
l’aide d’algorithmes itératifs, comme par exemple l’algorithme de quasi-Newton (Nocedal et
Wright [1999]).
Remarque 21 Les vraisemblances successivement utilisées sont résumées par le schéma
suivant :
Vraisemblance complète
(relative à un processus non censuré)
L
∗
(β)
↓
Vraisemblance « partielle »
(relative à un processus censuré)
L(β)
↓
Vraisemblance partielle de Cox
L
Cox
(β)
Tab. IV.1 – Les vraisemblances successives.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
94 Chapitre IV. Modèle de Markov non-homogène
4.4 Estimation des probabilités de transition
A partir des estimateurs précédents (du risque de base et des coefficients), la matrice des
probabilités de transition s’obtient en suivant la démarche permettant d’obtenir l’estimateur
de Aalen-Johansen. Considérons Z
0
, la valeur des covariables pour un individu.
Proposition 14 Un estimateur de la matrice des probabilités de transition est donné par
le produit intégral
ˆ
P (s, t | Z
0
) = P
u∈]s,t]
³
Id + d
ˆ
A (u | Z
0
)
´
, s 6 t 6 τ,
avec
ˆ
A =
n
ˆ
A
hj
o
hj
,
d
ˆ
A
hj
(t | Z
0
) = d
ˆ
A
hj0
(t | Z
0
) × exp(
ˆ
β
T
hj
Z
0
)
=
J
h
(t) × exp(
ˆ
β
T
hj
Z
0
)
P
n
i=1
exp(
ˆ
β
T
hj
Z
0
)Y
hi
(t)
× ∆N
hj+
(t), h 6= j,
et
d
ˆ
A
hh
(t | Z
0
) = −
X
j6=h
d
ˆ
A
hj
(t | Z
0
), h = 1, ..., s.
Proposition 15
Les propriétés asymptotiques de
ˆ
P (s, t | Z
0
) s’obtiennent à partir de celles de
ˆ
β et
ˆ
A
hj0
(t) et de l’utilisation de la delta-méthode (Andersen et al. [1991]).
Proposition 16 Un estimateur de la covariance de ˆp
hj
(s, t | Z
0
) et ˆp
mr
(s, t | Z
0
) est
d
Cov(ˆp
hj
(s, t | Z
0
) , ˆp
mr
(s, t | Z
0
)) =
d
Cov
1
+
d
Cov
2
,
avec
d
Cov
1
=
X
g6=l
Z
t
s
ˆp
hg
(s, u | Z
0
) ˆp
mg
(s, u | Z
0
) {ˆp
lj
(u, t | Z
0
) − ˆp
gj
(u, t | Z
0
)}
× {ˆp
lr
(u, t | Z
0
) − ˆp
gr
(u, t | Z
0
)}J
g
(u)
n
exp(
ˆ
β
T
gl
Z
0
)
o
2
n
S
(0)
gl
(
ˆ
β, u)
o
−2
dN
gl+
(u),
et
d
Cov
2
=
Z
t
s
X
g,l
ˆp
hg
(s, u | Z
0
) dW
gl
(u)ˆp
lj
(u, t | Z
0
) × I
−1
(
ˆ
β)
×
Z
t
s
X
g,l
ˆp
mg
(s, u | Z
0
) dW
gl
(u)ˆp
lr
(u, t | Z
0
) ,
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
4. Estimation semi-paramétrique 95
où I
−1
(
ˆ
β) est la matrice de variance-covariance de
ˆ
β et pour tout g 6= l,
W
gl
(t) = exp(
ˆ
β
T
gl
Z
0
)
Z
t
0
Z
0
−
S
(1)
hj
(
ˆ
β, t)
S
(0)
hj
(
ˆ
β, t)
J
g
(u)
n
S
(0)
gl
(
ˆ
β, u)
o
−1
dN
gl+
(u),
et W
gg
= −
P
g6=l
W
gl
.
4.5 Covariables dépendantes du temps
Dans ce qui précède, la méthode d’estimation est présentée pour des covariables indépen-
dantes du temps afin de simplifier les écritures. Cependant, l’utilisation de la vraisemblance
partielle et tous les résultats précédents restent vrais pour des covariables dépendantes du
temps. Quand les covariables sont dépendantes du temps, le rapport des risques pour deux
individus n’est plus indépendant du temps mais l’impact relatif de deux valeurs données
d’une covariable (par exemple, un taux de cholestérol de 200 contre 250) est toujours ré-
sumé par un seul coefficient β
hj
. Ce n’est pas « l’effet » de la variable qui varie avec le temps
mais la variable elle-même.
L’utilisation de covariables dépendantes du temps est pertinente dans certaines situa-
tions. Par exemple, pour prendre en compte des informations qui sont recueillies au cours
du suivi : type de traitement ou mesures répétées d’un dosage biologique. On pourrait aussi
étudier l’effet du temps de séjour avant le prochain événement afin de vérifier l’hypothèse
de Markov qui suppose que cette durée n’influence pas le processus d’évolution.
Notons cependant quelques différences avec l’utilisation de covariables dépendantes du
temps.
– Afin de calculer la contribution à la vraisemblance partielle de Cox à chaque temps
d’événement, il est nécessaire de connaître la valeur de ces covariables pour tous ces
temps. Le plus souvent, ces valeurs ne sont pas disponibles. Ce problème de données
manquantes peut se résoudre en supposant que la valeur de la covariable à l’instant t
est la valeur enregistrée à la dernière consultation (avant t
−
). Ce choix semble naturel,
mais on p ourrait aussi utiliser la valeur enregistrée lors de la consultation la plus proche
de t.
– L’interprétation des résultats est moins aisée même si celle des coefficients de régres-
sion demeure identique. En effet, l’interprétation des probabilités de transition pour
des covariables dépendantes du temps devient délicate car il y a un estimateur des
probabilités de transition pour chaque « histoire » de covariable.
– Les temps de calcul peuvent singulièrement augmenter.
4.6 Tests des coefficients
Trois statistiques de test de l’hypothèse nulle « H
0
:
ˆ
β = β
0
» peuvent être déduites des
résultats concernant la convergence asymptotique de
ˆ
β.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
96 Chapitre IV. Modèle de Markov non-homogène
– Test du rapport de vraisemblance :
Ce test mesure les différences des valeurs prises par le logarithme de la vraisemblance
en
ˆ
β et β
0
,
2
h
log L
Cox
(
ˆ
β) − log L
Cox
(β
0
)
i
à χ
2
(p).
– Test de Wald :
Il mesure l’écart entre
ˆ
β et β
0
, qui est nul en moyenne sous H
0
car
ˆ
β est asymptoti-
quement sans biais,
(
ˆ
β − β
0
)
T
I(
ˆ
β)(
ˆ
β − β
0
) Ã χ
2
(p).
– Test du score :
Ce test mesure la pente de la tangente en β
0
,
U
hj
(β
0
)
T
I(β
0
)
−1
U
hj
(β
0
) Ã χ
2
(p).
4.7 Test de l’hypothèse de proportionnalité des risques
La méthode d’estimation semi-paramétrique suppose que les risques sont à hasards pro-
portionnels (IV.17). Les méthodes pour vérifier ce type d’hypothèses sont bien connues
dans les modèles de survie et certaines peuvent être adaptées au modèle multi-états. Une
alternative à l’hypothèse de proportionnalité des risques est d’utiliser un modèle avec des
coefficients de régression dépendants du temps. On peut écrire β
hj
(t) comme une régression
sur g(t),
β
hj
(t) = β
hj
+ γ
hj
× g(t).
où g(t) est une fonction du temps. L’hypothèse nulle de prop ortionnalité des risques corres-
pond alors à γ
hj
= 0. Ainsi, p our tester l’hypothèse de proportionnalité pour la covariable
Z
1
, le modèle suivant peut être considéré
α
hj
(t; Z
1
) = α
hj0
(t) exp(β
hj
Z
1
+ γ
hj
× g(t) × Z
1
), h, j = 1, ..., s; h 6= j.
Si γ
hj
est statistiquement différent de zéro, alors un coefficient de régression dépendant
du temps sera mieux adapté et l’hypothèse de proportionnalité ne sera pas respectée. Au
contraire, si γ
hj
= 0, la transition sera bien à risques proportionnels pour la variable Z
1
.
Différents choix sont possibles pour la fonction g(.), par exemple g(t) = log(t) ou g(t) = t.
Notons que cette méthode permet de tester uniquement un effet linéaire du coefficient avec
une fonction du temps. L’hypothèse de proportionnalité des risques peut également être
testée par des méthodes graphiques comme les résidus de Schoenfeld (Therneau et Grambsch
[2000]).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
4. Estimation semi-paramétrique 97
4.8 Cas particulier : données de survie
Le modèle de survie est un modèle à deux états où une seule transition est possible,
comme décrit page 87. La méthodologie présentée précédemment comprend ainsi le cas
particulier des données de survie.
En considérant l’espace d’états {0, 1} (« vivant » : Etat 0 et « décès » : Etat 1), la
vraisemblance partielle de Cox (IV.20) s’écrit
L
Cox
(β) =
Y
t
Y
i=1
"
Y
0i
(t) exp(β
T
01
Z
i
)
S
(0)
01
(β, t)
#
∆N
01i
(t)
,
où N
01i
(t) vaut 1 si l’individu i passe de l’état 0 à l’état 1 au temps t et 0 sinon ; β
01
représente
le coefficient de régression associé à la transition vers le « décès ». Cette expression est bien la
vraisemblance obtenue par Cox pour des données de survie. De même, l’estimateur (IV.19)
des intensités cumulées de base généralise l’estimateur de Breslow introduit en 1974 pour
des données de survie,
ˆ
A
010
(t) =
Z
t
0
J
0
(u)
P
n
i=1
exp(β
T
01
Z
i
)Y
0i
(t)
dN
01+
(u),
où
ˆ
A
010
(t) représente l’intensité cumulée de base associée au « décès ».
Le modèle de Cox à risques proportionnels qui est couramment utilisé représente ainsi
un cas particulier de la méthodologie présentée précédemment.
Remarque 22 Le concept de vraisemblance partielle est introduit par Cox en 1972. La
vraisemblance est scindée en deux parties de manière à conserver uniquement la partie de
la vraisemblance qui concerne les coefficients β que l’on cherche à estimer. Soient
T
(1)
< ··· < T
(m)
,
les différents temps de décès observés chez les sujets (1), . . . , (m). La probabilité condition-
nelle que le sujet (i) décède en T
(i)
sachant qu’il est à risque au temps T
(i)
et qu’il n’y a
qu’un seul décès en T
(i)
parmi les individus à risque en T
(i)
est égale à :
V
i
=
α
0
(T
(i)
) exp(β
T
Z
(i)
)
P
l∈R
(i)
α
0
(T
(i)
) exp(β
T
Z
(l)
)
=
exp(β
T
Z
(i)
)
P
l∈R
(i)
exp(β
T
Z
(l)
)
.
où R
(i)
représente l’ensemble des personnes à risque en T
(i)
. La vraisemblance partielle de
Cox correspond au produit de ces probabilités conditionnelles calculées à chaque temps de
décès,
L
Cox
=
m
Y
i=1
V
i
.
Cette quantité ne dépend pas de la fonction de risque de base α
0
. Ainsi, seul l’ordre et non
la valeur des temps d’évement est important.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
98 Chapitre IV. Modèle de Markov non-homogène
Remarque 23 La méthodologie présentée dans ce chapitre peut être adaptée au modèle
semi-Markovien (Huber-Carol et Pons [2004], Chang et al. [2000], Andersen et al. [1993],
Gill [1980]). La vraisemblance dans le cas semi-Markovien a exactement la même forme
que dans le cas Markovien. L’estimateur des intensités cumulées est la même fonction des
données dans chacun des cas et, de plus, les distributions pour les grands échantillons ont
la même forme.
5 Application à l’asthme
Les modèles de Markov non-homogènes supposent que la durée du suivi influence l’évolu-
tion de la maladie (les intensités de transition). Dans le cas de l’asthme, le modèle homogène
semble trop restrictif (cf. chapitre II). En effet, les patients sont traités et éduqués et les
intensités de transition en début de suivi peuvent ainsi être différentes de celles après trois
ans de suivi.
La méthodologie précédente est appliquée à la base de données présentée au chapitre I par
l’intermédiaire d’un modèle à trois états de contrôle (Figure IV.2). Les données observées
sont censurées à droite de manière aléatoire (car l’inclusion dans l’étude est aléatoire) à
cause de l’arrêt de l’étude (à la date point). Dans notre cas, la date de point correspond à
la dernière consultation enregistrée dans la base de données. Ainsi, il est supposé, qu’après
sa dernière consultation, le patient reste à risque jusqu’à la date de point.
Notons également que les temps d’événements sont supposés distincts. Cette hypothèse
découle de la définition d’un processus de comptage multivarié (cf. page 74). Ainsi, les
quelques temps ex-æquo présents dans la base de données sont légèrement modifiés en ajou-
tant ou en retranchant un ou deux jours.
Etat 2
Contrôle sous
optimal
Etat 1
Contrôle optimal
Etat 3
Contrôle
inacceptable
Fig. IV.2 – Modèle à trois états de contrôle pour l’asthme.
Les résultats présentés concernent l’indice de masse corporelle (IMC). Dans la méthode
d’estimation non-paramétrique, il est nécessaire de stratifier la base de données pour observer
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
5. Application à l’asthme 99
l’effet de la covariable. Ainsi, dans tout ce qui suit, l’IMC sera considéré comme une variable
indépendante du temps et sa valeur sera fixée à la première consultation. La variable IMC
sera
– codée 0 si l’IMC à la première consultation est inférieur à 25,
– codée 1 si l’IMC à la première consultation est supérieur ou égal à 25.
Les objectifs consistent à
– estimer les probabilités de transition du modèle par les méthodes non-paramétrique
et semi-paramétrique,
– observer et tester l’effet du surpoids,
– comparer les estimations des probabilités de transition obtenues avec un modèle ho-
mogène et un modèle non-homogène.
5.1 Estimation non-paramétrique
Dans un premier temps, l’estimateur de Aalen-Johansen (Equation (IV.11)) est utilisé
pour estimer les probabilités de transition du modèle. Cet estimateur ne prend pas en compte
de covariable dans sa construction. Ainsi, il est nécessaire d’appliquer les estimateurs dans
des sous-group es afin de pouvoir ensuite comparer les estimations.
La base est stratifiée en deux groupes suivant l’IMC :
– 260 patients ont un IMC < 25 à la première consultation,
– 146 patients ont un IMC > 25 à la première consultation.
Les figures IV.3 (a) et (b) présentent les estimateurs de Nelson-Aalen (Equation
(IV.10)) des intensités cumulées 1 → 3 et 3 → 1 dans les deux group es liés à l’IMC. L’inten-
sité cumulée de l’état optimal vers l’état inacceptable (1 → 3) est plus importante dans la
strate des patients en surpoids. Inversement, l’intensité cumulée de l’état inacceptable vers
l’état optimal (3 → 1) est plus faible dans cette strate.
Les estimateurs de Aalen-Johansen des probabilités de transition 1 → 3 et 3 → 1 dans
chacun des groupes sont représentés sur les figures IV.4 (a) et (b). Comme pour les intensités
cumulées, les estimations des probabilités de transition montrent de manière graphique les
effets négatifs du surpoids sur l’évolution de l’asthme.
Afin de confirmer statistiquement l’effet du surpoids, les tests du Log-rank et de Gehan-
Wilcoxon (Equations (IV.13) et (IV.14)) peuvent être utilisés pour comparer les intensités
de transition obtenues dans chaque groupe. Ces tests permettent de tester l’égalité des
intensités de transition de l’état h vers l’état j obtenues dans les deux groupes :
H
0
: α
0
hj
= α
1
hj
où α
0
hj
est l’intensité associée à la strate IMC < 25 et α
1
hj
est l’intensité associée à la
strate IMC > 25. Les résultats obtenus avec les deux statistiques de test sont présentés
dans le tableau IV.2. Il apparaît que les différences graphiques précédemment observées
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
100 Chapitre IV. Modèle de Markov non-homogène
Temps (mois)
Intensité cumulée 1 -> 3
0 1020304050
0.0 0.2 0.4 0.6 0.8 1.0
(a)
IMC < 25
IMC >= 25
Temps (mois)
Intensité cumulée 3 -> 1
0 1020304050
0.0 0.2 0.4 0.6 0.8 1.0 1.2
(b)
IMC < 25
IMC >= 25
Fig. IV.3 – Estimation non-paramétrique (Nelson-Aalen) des intensités cumulées dans les
strates IMC < 25 et IMC > 25 : (a) transition de l’état optimal vers l’état inacceptable
(1 → 3) ; (b) transition de l’état inacceptable vers l’état optimal (3 → 1).
Temps (mois)
Probabilité de transition 1 -> 3
0 1020304050
0.0 0.2 0.4 0.6 0.8 1.0
(a)
IMC < 25
IMC >= 25
Temps (mois)
Probabilité de transition 3 -> 1
0 1020304050
0.0 0.2 0.4 0.6 0.8 1.0
(b)
IMC < 25
IMC >= 25
Fig. IV.4 – Estimation non-paramétrique (Aalen-Johansen) des probabilités de transition
dans les strates IMC < 25 et IMC > 25 : (a) transition de l’état optimal vers l’état inac-
ceptable (1 → 3) ; (b) transition de l’état inacceptable vers l’état optimal (3 → 1).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
5. Application à l’asthme 101
sont confirmées par ces résultats. Les deux tests rejettent l’hypothèse d’égalité des intensités
pour les transitions de l’état optimal vers l’état inacceptable (1 → 3) et de l’état inacceptable
vers l’état optimal (3 → 1). Pour les autres intensités, les tests ne rejettent pas l’égalité des
intensités de transition.
Test
Hypothèse
H
0
p − value
Log-rank
p − value
Gehan-Wilcoxon
α
0
12
= α
1
12
0.29 0.19
α
0
13
= α
1
13
0.03 0.02
α
0
21
= α
1
21
0.88 0.98
α
0
23
= α
1
23
0.41 0.61
α
0
31
= α
1
31
< 0.01 < 0.01
α
0
32
= α
1
32
0.22 0.22
Tab. IV.2 – Test du Log-rank et de Gehan-Wilcoxon pour comparer les intensités de tran-
sition dans les strates IMC < 25 (codée 0) et IMC > 25 (codée 1).
Les résultats graphiques (Figures IV.3 et IV.4) et les tests (Log-rank et Gehan-Wilcoxon)
permettent de mettre en évidence l’effet du surp oids sur les intensités de transition. L’in-
tensité associée à la transition 1 → 3 est statistiquement plus grande pour les patients en
surpoids à l’inclusion. Inversement, l’intensité associée à la transition 3 → 1 est plus faible
pour ces mêmes patients. Les autres intensités ne montrent pas de différences significatives
5.2 Estimation semi-paramétrique
Un modèle semi-paramétrique à risques proportionnels (Equation (IV.16)) est ajusté
pour prendre en compte l’effet des covariables (et pour quantifier cet effet). Le modèle à
trois états de la figure IV.2 est utilisé.
Nous considérons deux modèles prenant en compte l’effet de l’IMC,
Modèle A : α
hj
(t) = α
hj0
(t) exp(β
hj
× Z
1
)
Modèle B : α
hj
(t) = α
hj0
(t) exp(β
hj
Z
1
+ γ
hj
Z
2
(t))
où Z
1
est la variable associée à l’IMC à la première consultation,
Z
1
=
½
0
1
si IMC < 25
sinon,
et Z
2
(t) est une covariable artificielle permettant de tester l’hypothèse de proportionnalité
des risques (cf. page 96),
Z
2
(t) = Z
1
× log(t/1000)
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
102 Chapitre IV. Modèle de Markov non-homogène
où t est le temps en jours.
Le modèle A permet de quantifier l’effet de l’IMC par l’intermédiaire de β
hj
. Si β
hj
est statistiquement différent de zéro alors le surpoids influence de manière significative la
transition de l’état h vers l’état j.
Le modèle B comprend la variable Z
1
et une interaction de cette variable avec le temps.
Ainsi, si le coefficient γ
hj
est différent de zéro, alors l’effet de Z
1
n’est pas constant au cours
du temps et l’hypothèse de proportionnalité n’est pas respectée pour la transition de h vers
j.
Type de Modèle A Modèle B
transition Covariable
ˆ
β (e.c)
1
(p)
2
ˆ
β (e.c)
1
(p)
2
optimal vers Z
1
-0.248 (0.236) (0.28) -0.143 (0.386) (0.54)
sous-optimal (1 → 2) Z
2
(t) 0.086 (0.240) (0.55)
optimal vers Z
1
0.655 (0.303) (0.03) 0.863 (0.509) (<0.01)
inacceptable (1 → 3) Z
2
(t) 0.176 (0.325) (0.36)
sous-optimal vers Z
1
-0.030 (0.203) (0.88) -0.197 (0.442) (0.33)
optimal (2 → 1) Z
2
(t) -0.089 (0.215) (0.37)
sous-optimal vers Z
1
0.204 (0.249) (0.42) 0.426 (0.320) (0.10)
inacceptable (2 → 3) Z
2
(t) 0.281 (0.259) (0.15)
inacceptable vers Z
1
-0.595 (0.220) (<0.01) -0.479 (0.515) (0.02)
optimal (3 → 1) Z
2
(t) 0.047 (0.210) (0.57)
inacceptable vers Z
1
-0.234 (0.191) (0.21) -0.260 (0.296) (0.16)
sous-optimal (3 → 2) Z
2
(t) -0.021 (0.152) (0.83)
1
estimations des écarts-types.
2
p avec le test du LRT pour H
0
: β
ij
= 0.
Tab. IV.3 – Estimation semi-paramétrique des coefficients de régression associés aux cova-
riables : Z
1
= IMC (0 si IMC < 25, 1 si IMC > 25) et Z
2
(t) = Z
1
× log(t/1000) où t est le
temps en jours.
Le tableau IV.3 présente l’estimation des coefficients de régression dans les modèles A
et B. La fonction optim() du logiciel R qui utilise l’algorithme de quasi-Newton (Nocedal
et Wright [1999]) a permis d’obtenir les estimateurs du maximum de vraisemblance. Dans
les deux modèles, l’hypothèse de nullité des co efficients de régression est rejetée pour les
transitions 1 → 3 et 3 → 1. Ainsi, dans le modèle A, les intensités de la transition 1 → 3 sont
multipliées par 1.9 ( exp(0.655)) pour les patients en surpoids ; les intensités de la transition
3 → 1 sont multipliées par 0.55 (exp(−0.595)) pour les patients en surpoids. Dans le modèle
B, aucun coefficient associé à la variable artificielle Z
2
n’est statistiquement différent de
zéro. Par conséquent, l’hypothèse de proportionnalité des risques, qui n’est jamais rejetée,
ne semble pas trop contraignante. Notons également que le coefficient associé à l’IMC pour
la transition 3 → 1 (modèle B) reste significatif après ajustement (avec l’interaction entre
le temps et la variable).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
5. Application à l’asthme 103
Temps (mois)
Probabilité de transition 1 -> 3
0 1020304050
0.0 0.2 0.4 0.6 0.8 1.0
(a)
IMC<25
IMC>=25
Temps (mois)
Probabilité de transition 3 -> 1
0 1020304050
0.0 0.2 0.4 0.6 0.8 1.0
(b)
IMC<25
IMC>=25
Fig. IV.5 – Estimation semi-paramétrique des probabilités de transition avec l’IMC en
covariable : IMC < 25 et IMC > 25 : (a) transition de l’état optimal vers l’état inacceptable
(1 → 3) ; (b) transition de l’état inacceptable vers l’état optimal (3 → 1).
Les probabilités de transition 1 → 3 et 3 → 1 du modèle A sont représentées, pour chaque
valeur de la covariable, sur les figures IV.5 (a) et (b). Ces courbes permettent d’observer
graphiquement l’effet négatif du surpoids sur les probabilités de transition. Notons que les
estimations des probabilités de transition obtenues avec le mo dèle semi-paramétrique (Figure
IV.5) sont proches de celles obtenues en stratifiant la base (Figure IV.4). Les deux modèles
mettent en évidence les mêmes effets du surpoids sur l’évolution de la maladie. Le modèle
semi-paramétrique est attractif car il permet de quantifier l’effet de la covariable.
5.3 Comparaison des modèles de Markov homogène et non-
homogène
Dans cette partie, les résultats obtenus avec un modèle non-homogène sont comparés à
ceux obtenus avec un modèle homogène.
Premièrement, un modèle homogène sans covariable (cf. chapitre II) et un modèle non-
homogène sans covariable (Equation (IV.9)) sont ajustés. Les figures IV.6 (a) et (b) re-
présentent les estimations des probabilités de transition 1 → 3 et 3 → 1 dans les deux
modèles. Les courbes lisses correspondent aux estimations dans le cas homogène (paramé-
trique) ; les courbes en escalier correspondent aux estimations dans le cas non-homogène
(non-paramétrique). Les deux estimations des probabilités de transition 3 → 1 (IV.6 (b))
sont proches alors que celles associées à la transition 1 → 3 (IV.6 (a)) ne convergent pas
vers la même valeur et n’ont pas la même forme (convergence plus lente dans le cas non-
homogène).
Ensuite, la covariable IMC à la première consultation est étudiée dans un modèle homo-
gène et dans un modèle non-homogène (IV.16). Les coefficients de régression et les probabi-
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
104 Chapitre IV. Modèle de Markov non-homogène
Temps (mois)
Probabilité de transition 1 -> 3
0 1020304050
0.0 0.2 0.4 0.6 0.8 1.0
(a)
Temps (mois)
Probabilité de transition 3 -> 1
0 1020304050
0.0 0.2 0.4 0.6 0.8 1.0
(b)
Fig. IV.6 – Estimation des probabilités de transition dans un modèle homogène (courbe
lisse) et dans un modèle non-homogène (courbe en escalier) ; (a) transition de l’état optimal
vers l’état inacceptable (1 → 3) ; (b) transition de l’état inacceptable vers l’état optimal
(3 → 1).
lités de rejet de l’hypothèse de nullité des coefficients sont présentés dans le tableau IV.4. De
manière générale, les estimations vont dans le même sens, même si les estimations du modèle
non-homogène ont tendance à être plus petites (en valeur absolue). Notons cependant des
différences significatives entre les estimations des coefficients associés à la transition 1 → 3
et 2 → 1. Plusieurs coefficients sont significatifs avec une méthode mais pas avec l’autre.
Finalement, le coefficient associé à la transition 3 → 1 est le seul qui est statistiquement
différent de zéro avec les deux modélisations.
6 Discussion
Ce chapitre présente des métho des d’estimation dans le cadre d’un modèle de Markov
non-homogène. La théorie des processus de comptage permet d’obtenir des estimateurs non-
paramétrique et semi-paramétrique des probabilités de transition. Cette méthodologie pour
modèle de Markov non-homogène est ensuite appliquée à une base de données sur l’asthme
où l’hypothèse d’homogénéité semble trop restrictive (cf. chapitre II). Notons également
qu’une méthode de programmation de ces estimateurs est présentée en annexe page 177.
6.1 Application
L’impact du surpoids a tout d’abord été observé en comparant les intensités de tran-
sition obtenues dans différentes strates. Ensuite, un modèle à risques proportionnels a été
ajusté pour étudier l’effet de la covariable associée au surpoids. Les deux méthodes mettent
en évidence les mêmes résultats : les patients en surpoids ont un risque plus important de
transiter de l’état optimal vers l’état inacceptable, et également un risque plus faible de subir
la transition inverse. Ces résultats sont similaires, en particulier parce que l’hypothèse de
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
6. Discussion 105
Type de Modèle homogène Modèle non-homogène
transition
ˆ
β (e.c)
1
(p)
2
ˆ
β (e.c)
1
(p)
2
optimal vers -0.409 (0.383) (0.02) -0.248 (0.236) (0.28)
sous-optimal (1 → 2)
optimal vers -0.122 (0.269) (0.71) 0.655 (0.303) (0.03)
inacceptable (1 → 3)
sub-optimal vers 0.542 (0.364) (<0.01) -0.030 (0.203) (0.88)
optimal (2 → 1)
sous-optimal vers 0.041 (0.378) (0.87) 0.204 (0.249) (0.42)
inacceptable (2 → 3)
inacceptable vers -1.170 (0.370) (<0.01) -0.595 (0.220) (<0.01)
optimal (3 → 1)
inacceptable vers -0.561 (0.293) (<0.01) -0.234 (0.191) (0.21)
sous-optimal (3 → 2)
1
estimations des écarts-types.
2
p-values avec le test du LRT pour H
0
: β
ij
= 0.
Tab. IV.4 – Estimations des coefficients de régression associés à l’IMC dans un modèle
homogène et dans un modèle non-homogène.
proportionnalité des risques est respectée dans le modèle semi-paramétrique. Ainsi, quand
l’hypothèse de proportionnalité est respectée, le modèle semi-paramétrique est plus intéres-
sant. En effet, ce modèle utilise toute la base de données pour l’estimation et les résultats
sur l’effet de la covariable (coefficients de régression) sont facilement interprétables en terme
de risque relatif.
Les résultats du modèle non-homogène ont ensuite été comparés à ceux du modèle ho-
mogène. Certains résultats sont proches, en particulier l’effet négatif du surp oids sur la
transition de l’état inacceptable vers l’état optimal qui est significatif dans les deux mé-
thodes. D’autres résultats sont différents : les probabilités de transition de l’état optimal
vers l’état inacceptable ne convergent pas vers la même valeur et le coefficient associé à cette
transition n’est pas significatif dans le modèle homogène.
Les différences de résultats s’expliquent en partie par la restriction induite par l’hypo-
thèse d’homogénéité du temps. Ces différences peuvent aussi s’expliquer par la différence
entre les méthodes d’estimation. En effet, le modèle homogène suppose (par la construction
de la vraisemblance) que des événements peuvent avoir lieu entre deux consultations alors
que l’estimation semi-paramétrique suppose que l’individu reste dans le même état entre
deux consultations. Le modèle semi-paramétrique fait une hypothèse plus forte, à savoir
que l’information est disponible en continu (ce qui est faux en pratique). De plus, il ajuste
des données censurées à droite et suppose que l’état du patient ne varie pas entre la der-
nière consultation et la fin de l’étude. Le modèle de Markov homogène, lui, ne prend pas en
compte la durée ou l’état de santé entre la dernière consultation et l’arrêt de l’étude.
Finalement, d’un p oint de vue clinique, les modèles homogènes et non-homogènes mettent
en évidence que le surpoids diminue les chances de revenir à un état optimal. Ce résultat va-
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
106 Chapitre IV. Modèle de Markov non-homogène
lide une fois de plus le fait que le surpoids a un effet négatif sur l’évolution de l’asthme. Dans
notre cas, où l’hypothèse d’homogénéité semble trop contraignante, les résultats obtenus
avec le modèle non-homogène sont jugés plus fiables et sont conservés pour l’interprétation
clinique.
Le modèle homogène et le modèle non-homogène n’étant pas emboîtés, il est difficile de
comparer ces deux modèles. Le modèle homogène est facile à mettre en oeuvre mais l’hypo-
thèse d’homogénéité est souvent trop restrictive. Le modèle non-homogène est plus complexe
et par conséquent plus flexible. Cependant, les estimations peuvent parfois être difficilement
interprétables. Ainsi, pour choisir la méthode la mieux adaptée, certains compromis doivent
être faits en fonction de la base de données.
6.2 Méthodes
L’utilisation des modèles de Markov comporte certaines limites. La définition et le choix
optimal des états de santé ne sont toujours aisés et l’hypothèse de Markov est parfois trop
restrictive dans certaines applications. Des covariables artificielles, comme le temps de séjour
avant de transiter ou le nombre de visites dans l’état présent, peuvent être utilisées pour
tester cette hypothèse Markovienne. L’hypothèse de proportionnalité des risques induite par
l’introduction de covariables dans les modèles doit aussi être vérifiée (en introduisant une
covariable artificielle, par exemple).
Dans l’analyse des modèles multi-états et plus généralement dans les études de suivi, il
est supposé que les changements d’états interviennent exactement au moment de la visite
à l’hôpital. Cette approximation peut être plus ou moins contraignante. Dans notre cas,
certains patients consultent en fonction de leurs besoins de santé et l’hypothèse n’est pas
trop forte. Cependant, cette hypothèse devient moins réaliste pour les visites de routine
fixées tous les trois mois. Une alternative consiste à utiliser des méthodes d’estimation pour
données censurées par intervalles (Commenges [2002], Joly et al. [2002]). Ces méthodes
considèrent que le moment de la transition intervient entre les deux visites à l’hôpital.
Les estimateurs présentés dans ce chapitre reposent sur une hypothèse de censure à droite
indépendante. Cela suppose que la censure n’apporte aucune information sur le processus
d’événement. Dans de nombreuses applications, cette hypothèse est une source de biais.
Dans le cas de l’asthme, il semble qu’un patient qui se porte bien a tendance à ne pas
venir en consultation. Ainsi, on peut penser que la censure apporte une information de bon
diagnostic qui n’est pas prise en compte. Certaines méthodes, en particulier dans le cadre
du modèle de Cox, s’intéressent à l’estimation de la survie sous une hypothèse de censure
dépendante de l’événement.
6.3 Perspectives
Le modèle semi-paramétrique repose sur une structure multiplicative, c’est-à-dire que
les intensités de transition sont le produit d’une fonction de risque et d’une fonction des
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
6. Discussion 107
coefficients de régression. Cependant, on pourrait utiliser des modèles avec une structure
additive, c’est-à-dire
λ
hj
(t) = λ
hj0
(t) + β
T
Z.
Dans ce chapitre, des méthodes d’estimation non-paramétrique ont été discutées dans le
cadre des modèles à intensité multiplicative. Cependant, des méthodes d’estimation para-
métrique p euvent également être utilisées dans ces modèles en considérant
λ
hj
(t; θ) = Y
h
(t)α
hj
(t; θ),
où α
hj
(t; θ) est une fonction spécifiée par le vecteur de paramètres θ. La méthode du maxi-
mum de vraisemblance peut être utilisée pour estimer le vecteur de coefficients.
Les modèles de fragilité (frailty models) permettent de prendre en compte l’effet de
variables omises dans la modélisation quand, par exemple,
– ces variables ne sont pas observées,
– les effets de ces variables sont déjà bien connus,
– il n’est pas certain que ces variables influencent les intensités.
Les modèles à intensité multiplicative peuvent être étendus à des modèles de fragilité
(Huber-Carol et Vonta [2004], Andersen et al. [1993], Nielsen et al. [1992]). Dans ce cas, les
intensité du pro cessus de comptage peuvent dépendre en partie d’une variable aléatoire non
observée qui agit de manière multiplicative sur les intensités, c’est-à-dire
λ
hj
(t) = ZY
h
(t)α
hj
(t).
Ce problème statistique p eut être vu comme un problème de données manquantes. Les don-
nées complètes mais non observables sont les processus Z, N, et Y. Les données disponibles
correspondent aux processus N et Y. La variable de fragilité Z peut, par exemple, suivre
une loi gamma et l’algorithme EM peut être utilisé pour résoudre ce problème de données
incomplètes.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
108 Chapitre IV. Modèle de Markov non-homogène
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
Chapitre V
Prise en compte de la censure
informative - Méthode IPCW
L’objectif de ce chapitre est de présenter une méthode qui permette de prendre en compte
l’information contenue dans le phénomène de censure. En effet, les méthodes classiques
d’analyse des modèles de survie et de modèles multi-états supposent une indépendance entre
le processus d’événement et le processus de censure. Cependant, cette hypothèse est souvent
trop stricte et les estimations sont biaisées. Dans le cas des modèles de survie, la méthode
IPCW (Inverse Probability Censoring Weight) introduit par Robins [1993], prend en compte
la dépendance entre la censure et l’évènement. Le principe de la méthode est d’étudier le
risque de censure en fonction de covariables afin de déduire des poids spécifiques à chaque
individu. Les poids sont ensuite intégrés dans les estimateurs classiques pour modifier le
nombre de personnes à risque pour prendre en compte les personnes censurées et ainsi tenir
compte du phénomène de censure informative.
Ce chapitre se décomposera en trois parties. Une première partie présente la méthode
IPCW pour modèles de survie. Cette partie reprend essentiellement les résultats d’un article
(Saint-Pierre et al. [2005b]) soumis dans la revue Biometrical Journal. Elle est inspirée des
travaux de Castelli [2004] et de Robins et Finkelstein [2000]. Dans une deuxième partie,
nous proposons une généralisation de la méthode IPCW à certains modèles multi-états
Markovien. En effet, il existe peu de méthodes pour traiter la censure informative dans de
tels modèles bien que le phénomène de censure pose les mêmes difficultés que dans les études
de survie. Dans une troisième partie nous présentons l’application des méthodes IPCW pour
données de survie et pour modèles multi-états à la base de données sur l’asthme.
1 Méthode IPCW pour les modèles de survie
1.1 Introduction
Les données de survie ou plus généralement des données liées au temps sont souvent
présentes dans les études épidémiologiques. Les analyses de ces données sont alors réalisées
afin de mieux connaître la pathologie et les effets des différentes covariables. Dans ces études,
109
110 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
on cherche à expliquer l’apparition d’un événement : le décès, une rechute, une cicatrisation,
un rejet de greffe, ou un autre état spécifique à la maladie étudiée. La particularité des
données de survie repose sur le fait que ces données sont très souvent incomplètes à cause
du phénomène de censure. En effet, un événement n’est jamais observé sur un temps infini et
de plus, dans les bases de données observationnelles, il est impossible de contrôler la présence
aux visites ce qui génère des individus perdus de vue. Les méthodes statistiques pour ces
données de survie doivent alors tenir compte des données censurées. Cette problématique
est essentielle car on se trouve en situation naturelle d’utilisation des ressources du système
de santé.
Dans les analyses de survie traditionnelles (Kaplan-Meier, modèle de Cox, modèles para-
métriques) (Hill et al. [1996]), et dans la quasi-totalité des études, la censure est considérée
comme indépendante du processus étudié. Cette censure est dite non informative, car quand
elle se produit, elle n’apporte aucune information sur l’événement étudié. Dans ces analyses,
l’information potentielle apportée par les patients perdus de vue est ignorée. Cette hypo-
thèse d’indépendance entre la censure et l’événement est évidemment une hypothèse forte
qui induit un biais dans l’estimation de la survie. De plus, cette hypothèse n’est que rare-
ment vérifiée dans la réalité. En effet, prenons l’exemple d’une pathologie lourde comme le
VIH : les patients perdus de vue sont généralement les patients les plus malades. Dans le
cas de l’asthme, il semble au contraire que les patients perdus de vue soient des patients
bien contrôlés qui ne ressentent pas le besoin de venir consulter. Dans ces deux exemples,
le processus de censure est clairement lié à l’événement étudié.
Les méthodes permettant de prendre en compte cette information apportée par la cen-
sure sont fondées sur l’hypothèse de dépendance entre la censure et l’événement et visent
à réduire le biais dans l’estimation de la survie. La méthode Inverse Probability Censoring
Weighted (IPCW) est souvent citée dans la littérature (Rotnitzky et Robins [2003], Scharf-
stein et al. [2001], Scharfstein et al. [1999], Robins [1993], Robins et Finkelstein [2000]).
Elle adapte les méthodes traditionnelles d’analyse de données de survie par pondération des
estimateurs. D’autres méthodes pour prendre en compte cette dépendance dans l’analyse
de données répétées sont présentes dans la littérature. Par exemple, Huang et Wolfe [2002],
Liu et al. [2004] proposent des modèles de fragilité pour prendre en compte la corrélation
entre la censure et l’événement dans le cas de données en grappe, c’est-à-dire pour des
données regroupées en cluster. Minini et Chavance [2004] proposent une approche visant à
multiplier le risque de décès par un paramètre après la survenue de la censure. Robins et
Finkelstein [2000] présentent le G-algorithme qui utilise l’intégration de Monte-Carlo pour
estimer la courbe de survie, cependant cette méthode d’estimation est en général moins per-
formante que la méthode IPCW. La méthode IPCW a été généralisée au cadre des modèles
GEE (équations d’estimation généralisées) par Matsuyama [2003]. Ce modèle GEE pondéré
permet de modéliser une variable à mesures répétées dans le temps sous l’hypothèse de
dépendance de la censure.
Dans le cas de l’asthme, il y a un nombre important de perdus de vue et la censure
semble informative. Dans ce contexte de censure dépendante, l’utilisation des méthodes
traditionnelles conduirait à introduire un biais dans l’estimation de la fonction de survie. Une
alternative est l’utilisation de la méthode IPCW qui ajuste le modèle de Cox pour censure
dépendante en utilisant les données collectées sur les facteurs de risques d’événement et de
censure. La particularité de la méthode est d’intégrer dans les estimations traditionnelles
des poids dépendants de la probabilité d’être non censuré au temps t. Cette partie sur la
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
1. Méthode IPCW pour les mo dèles de survie 111
méthode IPCW pour données de survie est inspirée des travaux de et .
1.2 Mécanisme de censure
Dans les bases de données observationnelles, différents types de censures sont rencontrés :
la censure à gauche, la censure à droite ou encore la censure par intervalle.
La censure par intervalle se produit quand on n’observe pas les temps de changement
d’état : la seule information disponible est que le changement d’état se produit entre deux
consultations. Dans le cas d’observations intermittentes, les données sont censurées par in-
tervalle car l’état du patient est observé uniquement au moment de la consultation. Les
méthodes présentées dans cette thèse ne prennent pas en compte cette censure. Elles sup-
posent que les changements d’état se produisent exactement aux moments des consultations.
Dans le cas de l’asthme, les données observées sont censurées par intervalle. Pour appliquer
les méthodes présentées, nous supposons que les changements d’état se produisent aux mo-
ments des visites à l’hôpital. Cette hypothèse est restrictive mais semble acceptable dans
notre cas car les patients doivent venir consulter quand ils ressentent un changement dans
leurs états de santé. Cependant, afin d’être plus réaliste dans la modélisation d’observations
discrètes, on devrait considérer des méthodes d’estimation permettant d’ajuster une censure
par intervalle (Commenges [2002], Joly et al. [2002]).
Dans cette section, nous considérons le phénomène de censure à droite qui est le plus
courant dans les études de survie. Il existe différents mécanismes de censure à droite : un
individu est considéré comme censuré s’il est perdu de vue (déménagement, arrêt du suivi
pour diverses raisons), exclu vivant (si l’événement se produit après la date de point) ou
décédé pour cause de risques compétitifs (décès non imputable à la maladie comme par
exemple un accident de la route). Dans la pluspart des études, la censure engendrée par
les exclus vivants et décédés pour causes de risques compétitifs peut le plus souvent être
considérée comme non informative. Par contre, la censure par perdus de vue est, dans la
majorité des cas, informative de l’événement étudié et se manifeste de différentes façons.
En effet, les perdus de vue sont les patients dont on ne connait pas l’état à la date de
point. Ils représentent une perte d’information et sont source de biais. Le mécanisme de
censure devient dépendant quand un patient n’est plus suivi volontairement par le médecin
car il sait pertinemment que le décès est proche ou encore si le patient est non compliant c’est
à dire qu’il a arrêté son traitement et ne vient plus aux consultations. Ce phénomène de non
compliance est courant pour les patients atteints de VIH par exemple. En effet, le traitement
est souvent lourd avec des effets secondaires multiples et provoque ainsi des arrêts du suivi.
De plus il a été observé que ce sont les patients les plus malades qui arrêtent leurs traitements
soit parce qu’ils ne supportent plus la thérapie soit parce qu’ils n’ont plus d’espoir. Dans le
cas de l’asthme au contraire, les patients non compliants semblent être des patients qui se
portent bien et ne ressentent pas le besoin d’être suivi. Dans ces exemples, la censure devient
dépendante de l’événement puisqu’elle apporte une information sur l’événement étudié. Dans
les essais cliniques, afin d’étudier la différence entre deux traitements en terme de survie, on
est amené à considérer l’arrêt ou le changement de traitement après une certaine date comme
une censure. Un résultat thérapeutique insuffisant, des effets secondaires trop gênants, un
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
112 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
traitement mal toléré mais aussi un état satisfaisant du patient peuvent être la cause de ces
censures. Ce mécanisme de censure devient souvent dépendant car l’arrêt ou le changement
de traitement informe généralement sur l’état du patient.
Ainsi, un grand nombre d’individus des bases observationnelles est censuré et une part
importante de ces censures sont a priori informatives. Pour cette raison les méthodes tra-
ditionnelles occultant cette information sont souvent biaisées. Il est donc important d’avoir
des méthodes plus proches de la réalité pour améliorer les estimations de la survie.
1.3 Hypothèses
Robins et Rotnitzky [1992] et Robins [1993] ont montré que si l’on disp ose de tous
les facteurs de risques dépendants du temps pour l’événement, alors on peut corriger la
dépendance entre la censure et l’événement étudié en remplaçant les estimateurs de Kaplan-
Meier et de la vraisemblance partielle de Cox par les versions corrigées de la méthode IPCW.
Soit V(t) les covariables qui prédisent l’événement au temps t et soit
¯
V(t) = { V(x); 0 6
x 6 t} l’histoire de ces covariables. L’hypothèse fondamentale de la méthode est que le
risque de censure au temps t ne dépend plus du possible temps d’événement non observé T ,
i.e,
λ
C
(t |
¯
V(t), T, T > t) = λ
C
(t |
¯
V(t), T > t). (V.1)
Cette hypothèse signifie que la connaissance temporelle des covariables apportent suffisam-
ment d’informations pour que l’on puisse se passer de celle de T. En effet, la variable aléatoire
T n’apporte qu’une information d’événement déjà prédite par les covariables (qui prédisent
cet événement). Cette hypothèse peut être considérée comme l’hypothèse en « miroir » né-
cessaire pour étudier le risque de l’événement. En pratique, on ne s’attend pas à ce que cette
hypothèse soit vraie, en effet, si un important facteur de risque de l’événement (et de la cen-
sure) n’est pas inclu dans V(t) alors l’hypothèse (V.1) se rapproche de l’indépendance entre
l’événement et la censure ce qui amoindrit l’intérêt de la méthode. Il est donc important
pour l’utilisation d’une telle méthode de disposer d’un nombre suffisant de variables dans
V(t) pour que (V.1) soit possible.
Soit λ
T
(t | .) = lim
h→0
1
h
Pr(t 6 T 6 t + h | T > t, .), alors, l’hypothèse de censure
indépendante nécessaire à l’application de Kaplan-Meier et de la vraisemblance partielle est
définie par
λ
T
(t | C > t) = λ
T
(t). (V.2)
où C est le temps de censure. Cette hypothèse de censure indépendante sera fausse si
¯
V(t)
prédit le risque de censure au temps t, i.e si
λ
C
(t |
¯
V(t), T > t) 6= λ
C
(t | T > t). (V.3)
En effet, par hypothèse,
¯
V(t) prédit l’événement, donc s’il détermine aussi la censure, censure
et événement seront dépendants par l’intermédiaire des covariables. Pour que la censure soit
considérée comme non informative, il faut que
λ
C
(t |
¯
V(t), T > t) = λ
C
(t | T > t). (V.4)
Il n’existe pas de méthode (test empirique) pour tester la validité de l’hypothèse (V.1),
par contre on peut aisément vérifier la validité de (V.4) en étudiant le risque de censure
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
1. Méthode IPCW pour les mo dèles de survie 113
λ
C
(t |
¯
V(t), T > t) par un modèle de Cox. Si certains coefficients de régression associés
aux covariables sont statistiquement différents de zéro alors, (V.4) et donc l’hypothèse de
censure indépendante seront fausses. Dans ce cas, les estimations de Kaplan-Meier et de la
vraisemblance partielle de Cox sont biaisées. On pourra alors utiliser les versions IPCW de
ces estimations pour corriger le biais dû à la dépendance de la censure.
1.4 Réduction du nombre de covariables
Dans un premier temps, on veut réduire la dimension de
¯
V(t) qui comprend un nombre
important de variables. Un modèle de Cox est ajusté pour l’événement étudié afin de sélec-
tionner uniquement les facteurs qui sont significatifs :
λ
T
(t |
¯
V(t)) = γ
0
(t) exp(ψ
T
V(t)),
où V(t) sont les valeurs les plus récentes des covariables, ψ sont les coefficients de régression
associés et γ
0
(t) est le risque de base. On peut noter que ce modèle suppose que condition-
nellement aux valeurs récentes, les valeurs passées de V(.) ne prédisent pas l’événement
en t (i.e
¯
V(t) est résumé par V(t)). En gardant uniquement les facteurs pour lesquels les
coefficients de régression sont statistiquement différents de zéro, on obtient la version ré-
duite
¯
V
∗
(t) de
¯
V(t). Afin d’utiliser la version réduite de
¯
V(t) pour la modélisation, il faut
supposer que les risques de censure sachant
¯
V(t) et
¯
V
∗
(t) sont égaux, i.e,
λ
T
(t |
¯
V(t)) = λ
T
(t |
¯
V
∗
(t)). (V.5)
Une fois la version réduite
¯
V
∗
(t) obtenue, on peut utiliser la méthode IPCW avec
¯
V
∗
(t),
cependant, il est nécessaire que l’hypothèse (V.1) soit vérifiée pour
¯
V
∗
(t), i.e
λ
C
(t |
¯
V
∗
(t), T, T > t) = λ
C
(t |
¯
V
∗
(t), T > t). (V.6)
Robins (1986) a montré que (V.1) et ( V.5) n’impliquaient pas (V.6). Par contre si (V.1) et
(V.5) sont vérifiées et que les variables éliminées V
+
(u) ne prédisent pas les futures valeurs
des facteurs V
∗
(u) i.e
f(V
∗
(u) |
¯
V
+
(u
−
),
¯
V
∗
(u
−
), T > u, C > u) = f(V
∗
(u) |
¯
V
∗
(u
−
), T > u, C > u), (V.7)
alors (V.6) sera vérifiée. L’hypothèse (V.7) implique que
¯
V
∗
(u
−
) (i.e V
+
(x); 0 6 x 6 u
−
)
ne prédit pas le processus V
∗
(u) sachant l’historique de V
∗
(u
−
).
Une autre possibilité pour que l’hypothèse (V.6) soit vérifiée est d’utiliser le concept de
variables Coarsened At Random (CAR) introduit par Heitjan et Rubin [1991]. En effet si
(
¯
V
∗
(T ), T ) sont CAR i.e
λ
C
(t |
¯
V
∗
(T ), T, T > t) = λ
C
(t |
¯
V
∗
(t), T > t), (V.8)
alors (V.6) sera vérifiée. On peut noter que (V.8) diffère de (V.6) car
¯
V
∗
(T ) remplace
¯
V
∗
(t).
L’hypothèse (V.8) implique (V.6) mais la réciproque est fausse. En fait, l’hypothèse implique
que les valeurs des covariables ne varient plus entre le temps t où on veut calculer le risque de
censure et le temps T où se serait produit l’évènement si le sujet n’avait pas été censuré (i.e
¯
V
∗
(t) apporte le même information que
¯
V
∗
(T )). La notion de Coarsening At Random a été
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
114 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
introduite pour les cas où on n’observe pas la valeur exacte des données mais seulement un
ensemble qui contient la vraie valeur. Cette définition a l’avantage de couvrir de nombreux
problèmes aux données incomplètes qui ont émergé en biomédecine, incluant les arrondis,
les censures et les données manquantes.
1.5 Etude du risque de censure
1.5.1 Notations et estimation
L’estimation IPCW repose sur une pondération des estimateurs de Kaplan-Meier et de
la vraisemblance partielle. Les poids permettent de modifier le nombre de personnes à risque
et le nombre de personnes qui subissent l’événement de manière à prendre en compte les
patients censurés. Ces poids sont spécifiques à chaque individu et sont construits à partir de
la probabilité que l’individu soit censuré. L’estimation du risque de censure permet d’obtenir
ces pondérations et d’étudier la dépendance entre l’événement et la censure. Si (V.6) est
vérifiée, on peut étudier le risque de censure en fonction des facteurs de risque V
∗
(t) qui
prédisent l’événement. Le modèle pour le risque de censure peut s’écrire de la façon suivante :
λ
C
(t |
¯
V
∗
(t), T > t) = λ
0
(t) exp(α
T
V
∗
(t)). (V.9)
On pose pour chaque individu (k = 1, ..., n) :
– X
k
= min(T
k
, C
k
) : temps d’événement T
k
ou temps de censure C
k
pour l’individu k :
celui qui se produit en premier.
– Y
k
(u) = 11
{X
k
>u}
: vaut 1 si l’individu k est à risque (n’a pas subi l’événement et n’est
pas censuré), 0 sinon.
– τ
k
= 11
{T
k
=X
k
}
: vaut 1 si on observe l’événement et 0 si l’individu k est censuré.
– V
∗
k
(u) les covariables au temps u asso ciés à l’individu k.
– (
¯
V
∗
k
(T
k
), T
k
) sont CAR, ainsi (V.6) est vérifiée.
Un estimateur de α s’obtient par maximisation de la vraisemblance partielle suivante :
V =
n
Y
j=1
µ
exp(α
T
V
∗
k
(X
j
))
P
n
k=1
Y
k
(X
j
) exp(α
T
V
∗
k
(X
j
))
¶
1−τ
j
Soit ˆα l’estimateur de α par maximisation de la vraisemblance précédente. On peut ensuite
estimer le risque de base par un estimateur du type Kaplan-Meier, pour chaque temps :
ˆ
λ
0
(X
j
) =
1 − τ
j
P
n
k=1
Y
k
(X
j
) exp(ˆα
T
V
∗
k
(X
j
))
, j = 1, ..., n.
1.5.2 Extension possible
Dans le modèle décrit précédemment, tous les patients ne subissant pas l’événement (i.e
tous les patients censurés) sont utilisés pour estimer le risque de censure. Autrement dit,
aucune différence n’est faite entre les patients perdus de vue et les patients exclus vivants
(censurés à la date de point). Pourtant, il semble évident qu’il y ait une différence entre ces
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
1. Méthode IPCW pour les mo dèles de survie 115
deux phénomènes de censure. En effet, la censure engendrée par les patients perdus de vue
est potentiellement informative alors que la censure engendrée par le gel de la base n’apporte
a priori aucune information sur la survenue de l’événement étudié.
La méthodologie présentée précédemment peut aisément être adaptée pour étudier uni-
quement le risque de la censure générée par les patients perdus de vue. Pour cela, il est néces-
saire de distinguer les deux types de censure. Considérons pour chaque individu, k = 1, ..., n,
γ
k
=
½
1 si l’individu est perdu de vue
0 sinon.
La vraisemblance partielle s’écrit alors,
V =
n
Y
j=1
µ
exp(α
T
V
∗
k
(X
j
))
P
n
k=1
Y
k
(X
j
) exp(α
T
V
∗
k
(X
j
))
¶
γ
j
et le risque de censure de base est estimé par :
ˆ
λ
0
(X
j
) =
γ
j
P
n
k=1
Y
k
(X
j
) exp(ˆα
T
V
∗
k
(X
j
))
, j = 1, ..., n.
De cette manière, le risque de censure est estimé en supposant a priori que la censure
générée par les exclus vivants est non informative. On estime un risque de transiter vers un
état de censure par perdu de vue ou encore un « risque de censure informative ». De cette
façon, les pondérations calculées par la suite modifieront les contributions des individus dans
les estimations, en prenant compte uniquement les personnes perdues de vue.
1.5.3 Estimation de la survie de la censure et calcul des poids
Soit K
i
(t) = Pr(C
i
> t), la survie de la censure pour l’individu i. Un estimateur de K
i
(t)
est donné par le produit limite :
ˆ
K
i
(t) =
Y
{j;X
j
<t,τ
j
=0}
[1 −
ˆ
λ
C
(X
j
|
¯
V
∗
i
(X
j
))]
=
Y
{j;X
j
<t,τ
j
=0}
h
1 −
ˆ
λ
0
(X
j
) × exp(ˆα
T
V
∗
i
(X
j
))
i
=
Y
{j;X
j
<t}
"
1 −
(1 − τ
j
) × exp(ˆα
T
V
∗
i
(X
j
))
P
n
k=1
Y
k
(X
j
) exp(ˆα
T
V
∗
i
(X
j
))
#
.
Soit
ˆ
K
0
(t) l’estimateur de la survie de la censure dans un modèle sans covariable, c’est-à-dire
l’estimateur classique de Kaplan-Meier,
ˆ
K
0
(t) =
Y
{j;X
j
<t}
·
1 −
(1 − τ
j
)
P
n
k=1
Y
k
(X
j
)
¸
Les poids spécifiques à chaque individu vont être déterminés à partir du calcul de ces pro-
babilités :
ˆ
W
i
(t) =
ˆ
K
0
(t)
ˆ
K
i
(t)
. (V.10)
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
116 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
Notons que
ˆ
K
0
(t) est identique pour tous les individus. Par contre, les individus se diffé-
renciant par l’historique de leurs covariables,
ˆ
K
i
(t) sera différent d’un individu à l’autre.
De plus, si ˆα est le vecteur nul, c’est-à-dire si l’historique de
¯
V
∗
(t) ne prédit pas le risque
de censure en t (censure indépendante) alors
ˆ
K
i
(t) =
ˆ
K
0
(t) et ainsi pour tout t, les p oids
convergent vers 1. En revanche, si la censure est dépendante, les poids ne convergeront pas
vers 1. Si
ˆ
W
i
(t) > 1 alors la probabilité de rester non censuré jusqu’au temps t sera plus
importante dans un modèle sans covariable ce qui signifie que les covariables associées à l’in-
dividu i augmentent la probabilité d’être censuré pour l’individu i. Si au contraire
ˆ
W
i
(t) < 1,
alors les covariables de l’individu i diminuent la probabilité d’être censuré avant t. Ces poids
vont ainsi permettre de modifier l’estimation du risque d’événement en prenant en compte
l’effet de la censure sur chaque individu.
1.6 Estimation IPCW
1.6.1 Estimation IPCW de la survie
L’estimateur IPCW de la survie est construit en modifiant l’estimateur de Kaplan-Meier
par les poids calculés précédemment. L’estimation de la probabilité de rester vivant jusqu’au
temps t est donnée par
ˆ
S
T
(t) =
Y
{j;X
j
<t}
"
1 −
τ
j
×
ˆ
W
j
(X
j
))
P
n
k=1
Y
k
(X
j
)
ˆ
W
k
(X
j
)
#
(V.11)
=
Y
{j;X
j
<t}
"
1 −
τ
j
/
ˆ
K
j
(X
j
))
P
n
k=1
Y
k
(X
j
)/
ˆ
K
k
(X
j
)
#
.
Sous les hypothèses (V.6) et (V.9), Robins [1993] montre que
ˆ
S
T
(t) est un estimateur consis-
tant de S
T
(t) = P r(T > t). La consistance vient principalement du fait que τ
j
/
ˆ
K
j
(X
j
) es-
time le nombre de sujets qui devraient subir l’événement au temps X
j
en absence de censure
et que
P
n
k=1
Y
k
(X
j
)/
ˆ
K
k
(X
j
) estime le nombre de sujets qui devraient être à risque au temps
X
j
en absence de censure. Ainsi le ratio de ces deux quantités estime le risque de décès en
absence de censure. Il s’ensuit que
ˆ
S
T
(t) estime la probabilité rester vivant jusqu’au temps
t en absence de censure.
Le principe de la méthode est d’augmenter le poids d’un individu qui a subi l’événement à
une date t pour considérer les censures qui ont lieu avant cette date t et qui sont expliquées
par les covariables avant t. Pour chaque individu k qui est à risque au temps X
j
(i.e.
Y
k
(X
j
) = 1) et dont la probabilité d’être non censuré après X
j
est
ˆ
K
k
(X
j
) = 0.25, il devrait
y avoir, afin de corriger la censure, en moyenne trois autres sujets similaires en pronostics
qui ont été censurés avant X
j
et qui devraient, comme l’individu k, avoir survécu au moins
jusqu’en X
j
. Un poids de 4 = 1/0.25 est alors attribué à l’individu k dans l’estimation du
nombre de sujets à risque au temps X
j
. En augmentant le poids du sujet k, on prend en
compte les sujets censurés avant X
j
du fait de l’interdépendance entre l’événement étudié
et la censure. De manière similaire un individu qui subit l’événement en X
j
avec un poids
ˆ
K
j
(X
j
) = 0.25 doit avoir trois images similaires en pronostics qui devraient avoir le même
temps d’événement.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
1. Méthode IPCW pour les mo dèles de survie 117
1.6.2 Version IPCW du score de la vraisemblance partielle
La méthode IPCW permet aussi d’ajuster un modèle de Cox avec covariables dépen-
dantes du temps. Elle fournit ainsi des estimations des coefficients de régression sous l’hy-
pothèse de censure dépendante. Considérons le modèle suivant
λ
T
(t | Z(.), C > t) = λ
0
(t) × e
β
T
Z(t)
, (V.12)
où λ
0
(.) est le risque de base et β les coefficients de régression associés à Z(.). Par exemple,
dans Robins et Finkelstein [2000], le modèle précédent est utilisé pour comparer la survie
IPCW dans deux bras de traitements, avec Z = 0 représente l’appartenance au bras A et
Z = 1 l’appartenance au bras B. On peut ainsi interpréter le coefficient β en terme de
risques relatifs : si β est significativement positif, le traitement A aura un effet bénéfique
sur la survie comparé au traitement B (risque de décès accéléré pour le traitement B).
Afin d’estimer β dans un contexte de censure dépendante, Robins (1993) a montré que
le score IPCW de la vraisemblance partielle U(β) se différenciait du score ordinaire de la
vraisemblance partielle de Cox seulement par le fait que la contribution du sujet k au temps
X
j
est p ondérée par le poids
ˆ
W
k
(X
j
), i.e,
U(β) =
n
X
j=1
τ
j
ˆ
W
j
(X
j
)) ×
"
Z
j
(X
j
) −
P
n
k=1
Y
k
(X
j
)
ˆ
W
k
(X
j
)Z
k
(X
j
)e
β
T
k
Z(X
j
)
P
n
k=1
Y
k
(X
j
)
ˆ
W
k
(X
j
)e
β
T
k
Z(X
j
)
#
. (V.13)
En effet, la vraisemblance partielle est :
V =
n
Y
j=1
Ã
Y
j
(X
j
)e
β
T
j
Z(X
j
)
P
n
k=1
Y
k
(X
j
)e
β
T
k
Z(X
j
)
!
τ
j
,
log V =
n
X
i=1
τ
j
"
log(Y
j
(X
j
)) + β
T
j
Z(X
j
) − log
Ã
n
X
k=1
Y
k
(X
j
)e
β
T
k
Z(X
j
)
!#
,
et la dérivée de la log-vraisemblance est donnée par :
∂ log V
∂β
=
n
X
j=1
τ
j
×
"
Z
j
(X
j
) −
P
n
k=1
Y
k
(X
j
)Z
k
(X
j
)e
β
T
k
Z(X
j
)
P
n
k=1
Y
k
(X
j
)e
β
T
k
Z(X
j
)
#
.
Soit
U
0
(β) =
∂ log V
∂β
=
n
X
j=1
"
τ
j
ˆ
K
0
(X
j
)
ˆ
K
0
(X
j
)
#
¡
Z
j
(X
j
) − E
0
j
(β)
¢
,
avec,
E
0
j
(β) =
P
n
k=1
Y
k
(X
j
)Z
k
(X
j
)e
β
T
k
Z(X
j
)
ˆ
K
0
(X
j
)
ˆ
K
0
(X
j
)
P
n
k=1
Y
k
(X
j
)e
β
T
Z
k
(X
j
)
ˆ
K
0
(X
j
)
ˆ
K
0
(X
j
)
.
De la même façon que pour E
0
j
(β), E
j
(β) est défini en remplaçant
ˆ
K
0
(X
j
) au dénominateur
par
ˆ
K
k
(X
j
) :
E
j
(β) =
P
n
k=1
Y
k
(X
j
)Z
k
(X
j
)e
β
T
k
Z(X
j
)
ˆ
K
0
(X
j
)
ˆ
K
k
(X
j
)
P
n
k=1
Y
k
(X
j
)e
β
T
k
Z(X
j
)
ˆ
K
0
(X
j
)
ˆ
K
k
(X
j
)
,
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
118 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
et
U(β) =
n
X
j=1
"
τ
j
ˆ
K
0
(X
j
)
ˆ
K
j
(X
j
)
#
(Z
j
(X
j
) − E
j
(β))
=
n
X
j=1
h
τ
j
ˆ
W
j
(X
j
)
i
Ã
Z
j
(X
j
) −
P
n
k=1
Y
k
(X
j
)Z
k
(X
j
)e
β
T
k
Z(X
j
)
ˆ
W
k
(X
j
)
P
n
k=1
Y
k
(X
j
)e
β
T
k
Z(X
j
)
ˆ
W
k
(X
j
)
!
.
U(β) est appelée fonction score modifiée.
Sous l’hypothèse (V.6) et (V.9), Robins [1993] montre que la solution
ˆ
β de l’équation
score IPCW U (β) = 0 est un estimateur consistant du paramètre β du modèle de Cox.
On peut noter que si les poids
ˆ
W
k
(X
j
) sont remplacés par
1
ˆ
K
j
(X
j
)
, la solution de U(β) = 0
est encore consistante et asymptotiquement normale, cependant cet estimateur est moins
efficace.
1.6.3 Ecarts-types
D’après les théorèmes de convergence asymptotique de Robins [1993], sous les conditions
(V.6), (V.9) et (V.12), la variance asymptotique de
ˆ
β est estimée de manière consistante
par
ˆ
I
−1
ˆ
Σ(
ˆ
β)
³
ˆ
I
−1
´
T
, avec
ˆ
Σ(
ˆ
β) = Ω
1
(
ˆ
β) − Ω
2
(
ˆ
β) − Ω
3
(
ˆ
β) et
ˆ
I =
∂U (β)
∂β
¯
¯
¯
β=
ˆ
β
.
– Ω
1
(β) =
1
n
P
n
i=1
n
ˆ
A
i
(β, 0)
o
2
, où
ˆ
A
i
(β, x) =
Z
∞
x
d
ˆ
M
T
i
(u, β)
ˆ
W
i
(u) ×
"
Z −
P
n
j=1
Y
j
(u)
ˆ
W
j
(u)Z
j
e
β
T
j
Z(u)
P
n
j=1
Y
j
(u)
ˆ
W
j
(u)e
β
T
j
Z(u)
#
,
ˆ
M
T
i
(u, β) = N
T
i
(u) −
Z
u
0
d
ˆ
Λ
0
(t, β)Y
i
(t)e
β
T
i
Z(t)
,
N
T
i
= 11
{X
i
6u,τ
i
=1}
,
d
ˆ
Λ
0
(t, β) =
P
n
j=1
ˆ
W
j
(t)dN
T
j
P
n
j=1
Y
j
(t)
ˆ
W
j
(t)e
β
T
j
Z(t)
.
– Ω
2
(β) =
1
n
P
n
i=1
·
R
∞
0
dN
C
i
(u)
n
G(
ˆ
A(β, u)
o
2
¸
. Sachant le model V.12, pour tous
H(u) = (H
j
(u))
j=1,...,n
, où les H
j
(u) peuvent être des vecteurs de fonctions, G est
définie par,
G{H(u)} =
P
n
j=1
H
j
(u)Y
j
(u)e
ˆα
T
V
∗
i
(u)
P
n
j=1
Y
j
(u)e
ˆα
T
V
∗
i
(u)
,
N
C
i
= 11
{X
i
6u,τ
i
=0}
.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
1. Méthode IPCW pour les mo dèles de survie 119
– Ω
3
(β) = Φ{
ˆ
A(β, u), V
∗
(u)}[Φ{V
∗
(u), V
∗
(u)}]
−1
Φ{V
∗
(u),
ˆ
A(β, u)}, où pour tous
H
1
(u) et H
2
(u) des vecteurs de fonctions,
Φ{H
1
(u), H
2
(u)} =
1
n
n
X
i=1
·
Z
∞
0
dN
C
i
(u)
¡
G{H
1
(u) [H
2
(u)]
t
} − G{H
1
(u)}[G{H
2
(u)}]
t
¢
¸
.
De même, à partir des théorèmes de convergence de Robins [1993], sous les condi-
tions (V.6) et (V.9), la variance asymptotique de la fonction de risques cumulés
ˆ
Λ
T
(t) =
−ln(
ˆ
S
T
(t)), est estimé de manière consistante par
ˆ
Σ
∗
(t) = Ω
∗
1
(t) − Ω
∗
2
(t) − Ω
∗
3
(t).
– Ω
∗
1
(t) =
1
n
P
n
i=1
n
ˆ
A
∗
i
(t, 0)
o
2
, où
ˆ
A
∗
i
(t, x) =
Z
t
x
d
ˆ
M
∗
T
i
(u)
ˆ
W
i
(u)
P
n
j=1
Y
j
(u)
ˆ
W
j
(u)
,
ˆ
M
∗
T
i
(u) = N
T
i
(u) −
Z
u
0
d
ˆ
Λ(t)Y
i
(t),
N
T
i
= 11
{X
i
6u,τ
i
=1}
,
d
ˆ
Λ(t) =
P
n
j=1
ˆ
W
j
(t)dN
T
j
P
n
j=1
Y
j
(t)
ˆ
W
j
(t)
.
– Ω
∗
2
(t) =
1
n
P
n
i=1
·
R
∞
0
dN
C
i
(u)
n
G(
ˆ
A
∗
(t, u)
o
2
¸
. Avec la fonction G définit comme pré-
cedemment, N
C
i
= 11
{X
i
6u,τ
i
=0}
et
ˆ
A
∗
= (
ˆ
A
∗
i
)
i=1,...,n
.
– Ω
∗
3
(t) = Φ{
ˆ
A
∗
(t, u), V
∗
(u)}[Φ{V
∗
(u), V
∗
(u)}]
−1
Φ{V
∗
(u),
ˆ
A
∗
(t, u)}, où Φ est défini
précédemment.
D’après les théorèmes précedents, la variance des co efficients de régression est
V(
ˆ
β) =
ˆ
I
−1
ˆ
Σ(
ˆ
β)
³
ˆ
I
−1
´
T
(V.14)
et les intervalles de confiance asymptotiques de Wald à 95% pour
ˆ
β et
ˆ
Λ
T
(t) sont donnés
par
IC
β
=
ˆ
β ± 1.96
½
ˆ
I
−1
ˆ
Σ(
ˆ
β)
³
ˆ
I
−1
´
T
¾
1/2
IC
Λ
(t) =
ˆ
Λ
T
(t) ± 1.96
n
ˆ
Σ
∗
(t)
o
1/2
avec
ˆ
I =
∂U (β)
∂β
¯
¯
¯
β=
ˆ
β
et
ˆ
Σ(
ˆ
β) et
ˆ
Σ
∗
(t) sont les estimateurs des variances asymptotiques
décrits précédemment.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
120 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
2 Méthode IPCW adaptée au modèle Markovien
2.1 Introduction
Dans la plupart des études de survie, la censure est supposée indépendante de l’événe-
ment étudié même si cela ne correspond pas toujours à la réalité clinique. Cette hypothèse
d’indépendance permet d’utiliser les méthodes d’analyse classiques. Cependant, ces esti-
mations sont souvent biaisées du fait de la dépendance entre la censure et l’événement. La
méthode IPCW (Inverse Probability Censoring Weight) présentée dans la section précédente,
permet de prendre en compte cette dépendance. Cependant, la méthode IPCW est dévelop-
pée pour des données de survie (Rotnitzky et Robins [2003], Scharfstein et al. [2001]) ce qui
correspond à un modèle à deux états où il n’y a pas de retour possible (vivant-décès). Pour-
tant, la censure par perdus de vue dans les modèles multi-états pose les mêmes difficultés et
entraine souvent un biais dans les estimations des intensités de transition. L’adaptation de
la méthode IPCW aux modèles multi-états permettrait de prendre en compte l’information
issue de la censure dans l’étude de ces modèles. La méthode d’estimation semi-paramétrique
pour modèles markoviens présentée au chapitre précédent suppose que la censure est indé-
pendante du processus d’événement. Cependant, elle peut être modifiée de manière à prendre
en compte un phénomène de censure informative.
L’objet de cette partie est de généraliser la méthode IPCW pour modèles de survie aux
modèles Markoviens à deux états avec retour (Figure V.1 (a)) et aux modèles Markoviens
progressifs (Figure (V.1 (b)). La généralisation se restreint pour le moment à ces mo dèles :
en effet, l’adaptation aux modèles non progressifs à plus de deux états entraîne des difficultés
supplémentaires. Prenons l’exemple d’un modèle à trois états : « sain », « malade » et « décès
» (Figure V.1 (c)). La difficulté vient du fait que la pondération associée au phénomène de
censure à partir de l’état ’malade’ sera identique pour l’estimation de la transition « malade
» vers « décès » et pour l’estimation de la transition « malade » vers « sain » : cela suppose
que le phénomène de censure informative influence de la même manière l’estimation des
deux transitions. Dans les modèles progressifs (Figure V.1 (b)) où une seule transition est
possible cette difficulté n’apparait pas. Suite à la présentation de la méthodologie IPCW
au modèle à deux états avec retour, nous discuterons les perspectives d’adaptation de la
méthodologie aux modèles à plus de 2 états.
Dans le cas de données de survie, la méthode IPCW adapte l’estimation de Kaplan-Meier
et de la vraisemblance partielle à l’hypothèse de censure dépendante. La généralisation de
la méthode IPCW aux modèles multi-états s’obtient en adaptant la méthode d’estimation
semi-paramétrique pour les modèles multi-états Markoviens présentée au chapitre IV. L’es-
timation semi-paramétrique (Andersen et al. [1991]) qui est une extension de la méthode
non-paramétrique de Aalen et Johansen [1978] à un modèle de régression de Cox, repose sur
la théorie des processus de comptage et de la vraisemblance partielle. Ainsi, le principe de
pondération des estimations pour prendre en compte le phénomène de censure informative
peut être utilisé. L’adaptation de la méthode IPCW se sépare en deux parties : dans un
premier temps, la méthode d’estimation semi-paramétrique pour modèle Markovien est uti-
lisée pour estimer les risques de censure à partir de chaque état, dans un deuxième temps,
la métho de d’estimation semi-paramétrique est pondérée afin d’estimer les probabilités de
transition sous l’hypothèse de censure dépendante.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Méthode IPCW adaptée au modèle Markovien 121
Etat 2Etat 1
Etat 1 Etat 2 Etat n
MaladeSain
Décès
(a)
(b)
(c)
Fig. V.1 – (a) Modèle à deux états avec retour. (b) Modèle progressif. (c) Modèle à trois
états « sain », « malade », « décès ».
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
122 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
2.2 Modèle avec un état de censure
2.2.1 Introduction
Les méthodes d’estimation pour modèles Markoviens qui prennent en compte le phéno-
mène de censure telle que l’estimation non-paramétrique de Aalen-Johansen ou l’estimation
semi-paramétrique ne traitent pas du cas de la censure dépendante (Andersen et al. [1993]).
Afin de définir la notion de censure indépendante, considérons un modèle de Markov à deux
états avec retour, les intensités de transition de l’état h vers l’état j sont
λ
hj
(t | .) = lim
∆t→0
1
∆t
Pr(X(t + ∆t) = j | X(t) = h, .), h, j = 1, 2, h 6= j.
Dans ces modèles l’hypothèse de censure indépendante peut se définir par
λ
hj
(t | C
h
> t) = λ
hj
(t), h, j = 1, 2, h 6= j,
où C
h
correspond au temps de censure pour un individu dans l’état h. Cette hypothèse sera
vérifiée si et seulement si les facteurs qui prédisent le processus d’événement ne prédisent pas
le processus de censure. En effet, si on suppose que les covariables déterminent le processus
d’événement alors si elles déterminent aussi la censure : le processus d’événement et la cen-
sure seront dépendants par l’intermédiaire des covariables. L’objectif est alors d’étudier les
risques de censure afin de montrer un lien entre la censure et événement. On considère p our
cela un modèle à 2 états de santé (états transients) avec un état absorbant correspondant à
ce que nous appellerons l’état « censure ». Le modèle considéré peut être schématisé par la
figure V.2 où Etat 1 et Etat 2 représentent les états de santé et Etat C correspond à l’état
de censure.
Etat 2Etat 1
Etat C
Fig. V.2 – Modèle à deux états de santé et un état absorbant représentant la censure (Etat
C).
2.2.2 Hypothèses
L’utilisation de la méthode IPCW pour données de survie nécessitait certaines hypo-
thèses comme le fait de disposer de tous les facteurs de risques de l’événement. Afin d’adapter
la méthode à un modèle à deux états, des hypothèses du même ordre doivent être satisfaites.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Méthode IPCW adaptée au modèle Markovien 123
Soit V(t) les covariables qui prédisent le processus d’événement au temps t et soit
¯
V(t) =
{V(x); 0 6 x 6 t} l’histoire de ces covariables. L’hypothèse fondamentale de la méthode est
que le risque de censure à partir de l’état h au temps t ne dépend plus du possible temps
d’événement non observé T
h
, où l’événement est une transition à partir de l’état h, ce qui
peut aussi s’écrire :
λ
hC
(t |
¯
V(t), T
h
, T
h
> t) = λ
hC
(t |
¯
V(t), T
h
> t), h = {1, 2}. (V.15)
Dans la suite, le concept de variable Coarsened At Random (CAR) introduit précedemment
(Heitjan et Rubin [1991]), sera utilisé pour s’assurer de l’hypothèse (V.15). En effet, si on
suppose que (V(T
h
), T
h
) sont CAR, c’est-à-dire
λ
hC
(t |
¯
V(T
h
), T
h
, T
h
> t) = λ
hC
(t |
¯
V(t), T
h
> t), h = {1, 2}, (V.16)
alors l’hypothèse (V.15) sera vérifiée. Cette hypothèse entraîne que les covariables prédisent
« parfaitement » le processus d’événement. Par conséquent, si le risque de censure dépend
de ces mêmes covariables, c’est-à-dire,
λ
hC
(t |
¯
V(t), T
h
> t) 6= λ
hC
(t | T
h
> t) h = {1, 2},
alors la censure (à partir de l’état h) sera dépendante du processus d’événement (par l’inter-
médiaire des covariables). Cette dépendance peut être testée en vérifiant si, dans ce modèle,
certains coefficients de régression associés aux covariables sont statistiquement différents de
zéro : si tel est le cas, l’hypothèse de censure indépendante sera fausse. Ainsi, le recours à
la métho de d’estimation IPCW pour corriger les biais dus à cette dépendance sera justifié.
2.2.3 Estimations des risques de censure
Le but est d’estimer les risques de censure à partir des deux états de santé. On rappelle
que les risques de censure dépendent des mêmes covariables qui prédisent les transitions
entre les deux états de santé. Sous les hypothèses présentées précédemment, on peut utiliser
l’estimation semi-paramétrique pour estimer les risques de censure dans le modèle (V.2).
Pour chaque individu, i = 1, ..., n, on observe un processus de Markov {X
i
(t), t ∈ T } à
espace d’états {1, 2, C}, T = [0, τ], 0 < τ 6 +∞. Les intensités de transition de l’état h
vers l’état j sont définies de la façon suivante :
λ
hj
(t |
¯
V(t)) = λ
0
hj
(t) exp
¡
α
T
hj
V(t)
¢
, (h, j) ∈ S,
avec S = {(1, 2), (2, 1), (1, C), (2, C)}, λ
0
hj
(t) l’intensité de transition de base associée à la
transition de l’état h vers l’état j, α
hj
le vecteur des coefficients de régression associé à la
transition de h vers j, V
i
(t) le vecteur des covariables dépendantes du temps associées à
l’individu i et
¯
V
i
(t) = {V
i
(u); 0 6 u 6 t} l’histoire de ces covariables. On suppose que
(V(T
hi
), T
hi
) sont CAR (V.16), où T
hi
sont des temps de transition à partir de l’état h pour
l’individu i. Pour chaque individu i, on peut associer un processus de comptage N
hji
(t) =
#{transitions observées de h → j dans [0, t] pour l’individu i}, pour tous (h, j) ∈ S. De
plus, on définit Y
hi
(t) = 11
{X
i
(t−)=h}
qui vaut 1 si l’individu i est à risque dans l’état h
(h = 1, 2) au temps t
−
et 0 sinon.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
124 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
Les estimateurs des coefficients de régression s’obtiennent en maximisant la vraisem-
blance partielle de Cox suivante
V =
Y
t∈T
n
Y
i=1
Y
(h,j)∈S
exp
³
α
T
hj
V
i
(t)
´
n
P
k=1
Y
hk
(t) exp
³
α
T
hj
V
k
(t)
´
∆N
hji
(t)
De plus, le risque cumulé de base A
0
hj
(t) =
Z
t
0
λ
0
hj
(u)du peut être estimé par un estimateur
du type Nelson-Aalen
ˆ
A
0
hj
(t | ˆα) =
Z
t
0
J
h
(u)
n
P
i=1
Y
hi
(u) exp(ˆα
T
hj
V
i
(u))
dN
hj.
(u), (h, j) ∈ S.
où ˆα
hj
est l’estimateur du vecteur des coefficients de régression, N
hj.
(t) =
P
n
i=1
N
hji
(t)
compte le nombre de transitions observées de l’état h vers l’état j dans l’intervalle [0, t] dans
toute la population, Y
h
(t) =
P
n
i=1
Y
hi
(t) compte le nombre de personnes à risque de subir
une transition à partir de l’état h juste avant le temps t et J
h
(t) = 11
{Y
h
(t)>0}
, (h = 1, 2).
2.2.4 Estimation des probabilités de censure
Un estimateur de la matrice P = {p
hj
} des probabilités de transition est donné par le
produit intégral :
ˆ
P(t, t
′
) =
Y
]t,t
′
]
(I + d
ˆ
A(u)),
où
ˆ
A = {
ˆ
A
hj
} est l’estimateur de la matrice des intensités de transition et I la matrice
identité (s × s). En pratique, on observe un nombre fini d’événements : soient 0 < T
1
<
··· < T
l
< τ les temps d’événements. Ainsi
ˆ
A est une fonction en escalier et on peut écrire
ˆ
P(t, t
′
|
¯
V
i
(t
′
)) =
Y
{k;T
k
∈]t,t
′
]}
(I + ∆
ˆ
A(T
k
| ˆα,
¯
V
i
(T
k
))),
avec
∆
ˆ
A
hj
(T
k
| ˆα,
¯
V
i
(T
k
))) =
J
h
(T
k
) × exp(ˆα
T
hj
V
i
(T
k
))
n
P
i=1
Y
hi
(T
k
) exp(ˆα
T
hj
V
i
(T
k
))
× (N
hj.
(T
k
) − N
hj.
(T
k−1
)) ,
pour tous (h, j) ∈ S. De plus, on a ∆
ˆ
A
C1
= ∆
ˆ
A
C2
= 0 et ∆
ˆ
A
hh
= −
P
j6=h
∆
ˆ
A
hj
. On
obtient ainsi une estimation de la matrice des probabilités de transition en fonction des
covariables qui va permettre de définir les poids associés à chaque individu.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Méthode IPCW adaptée au modèle Markovien 125
2.2.5 Calcul des poids
Dans la méthode IPCW pour modèles de survie, le poids pour l’individu i au temps
t est défini à partir de la probabilité K
i
(t), qui est la probabilité que le sujet i soit non
censuré jusqu’au temps t sachant
¯
V
i
(.) (« survie de la censure » = P (C
i
> t |
¯
V
i
(.))). Par
contre, dans l’estimation d’un modèle à deux états, il y a plusieurs probabilités d’être non
censuré au temps t : une p our chaque temps de départ dans [0, t[. Soit 1 − ˆp
hC
(s, t |
¯
V
i
(.)),
la probabilité que le sujet i soit non censuré au temps t sachant qu’il était dans l’état h au
temps s (h = 1, 2). Pour pouvoir utiliser la métho de IPCW, il faut sélectionner une seule
probabilité pour chaque temps t. Un choix naturel est la probabilité d’être non censuré au
temps t sachant qu’il était dans l’état h au temps 0 : 1 − ˆp
hC
(0, t |
¯
V
i
(.)). Ce choix est
arbitraire mais il semble cependant le mieux adapté.
Soit
ˆ
K
hi
(t) = 1 − ˆp
hC
(0, t |
¯
V
i
(.)) = la probabilité pour l’individu i de ne pas être
censuré au temps t sachant qu’il est dans l’état h au temps 0. Soit
ˆ
K
0
h
(t) = 1 − ˆp
hC
(0, t)
la même probabilité dans un modèle sans covariable. Cette probabilité ne dépend pas de
l’indice des individu car elle est identique pour tous les individus. Les poids p our chaque
individu sont définis comme le rapport de ces deux probabilités :
ˆ
W
hi
(t) =
ˆ
K
0
h
(t)
ˆ
K
hi
(t)
. (V.17)
Les poids sont égaux à un si les covariables ne prédisent pas le risque de censure, ce qui
correspond à une censure qui n’est pas dépendante du processus d’événement (censure non
informative). Et inversement, si les poids diffèrent de un, la censure sera dépendante.
2.3 Extension possible
Il est possible de considérer un modèle mieux adapté aux observations cliniques en
prenant en compte l’information a priori sur les différents phénomènes de censure. En effet,
le modèle précédent ne fait aucune différence entre les patients perdus de vue et les patients
exclus vivants (censurés à la date de point). Pourtant, il semble évident qu’il y ait une
différence entre ces deux phénomènes de censure. En effet, la censure engendrée par les
patients perdus de vue est potentiellement informative alors que la censure engendrée par le
gel de la base n’apporte a priori aucune information sur la survenue de l’événement étudié.
La méthodologie présentée précédemment peut aisément être adaptée pour étudier uni-
quement le risque de la censure générée par les patients perdus de vue. Pour cela, on peut
considérer le modèle de la figure V.3 qui comprend deux états de censure : un pour la censure
par perdu de vue (état C
1
) et un pour la censure engendrée par l’arrêt de l’étude (état C
2
).
L’ensemble des transitions possibles est alors S = {(1, 2), (2, 1), (1, C
1
), (2, C
1
), (1, C
2
), (2, C
2
)}.
En considérant les processus de comptage N
hji
(.) correspondant pour tout (h, j) ∈ S, les es-
timations des risques de transition s’obtiennent comme précédemment. Ainsi, en reprenant
la méthodologie précédente, en remplaçant N
hC
(.) par N
hC
1
(.), le risque de censure étudié
est un risque de censure par perdu de vue ou encore un « risque de censure informative
». Ce risque est estimé en supposant a priori que la censure générée par les exclus vivants
est non informative. De cette façon, les pondérations calculées modifieront les contributions
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
126 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
Etat 2Etat 1
Etat C
1
Etat C
2
Fig. V.3 – Modèle à deux états de santé et à deux états absorbants représentant la censure.
L’état C
1
représente la censure par perdu de vue et l’état C
2
représente la censure engendrée
par les exclus vivants.
des individus dans les estimations, en prenant compte uniquement les personnes perdues de
vue. Ce modèle semble mieux adapté dans le sens où il utilise l’information a priori sur le
type de censure.
2.4 Modèle non-paramétrique IPCW
La nature dépendante de la censure entraîne que l’estimation semi-paramétrique dans
les modèles Markoviens est biaisée et n’est plus justifiée. Cependant, afin de corriger le
biais engendré par la dépendance, on peut modifier l’estimateur « classique » en utilisant
les pondérations calculées précédemment. La méthode IPCW consiste en quelque sorte à
modifier le nombre de personnes à risque et le nombre d’événements dans les estimateurs
de façon à prendre en compte les personnes qui ne sont plus dans l’étude pour cause de
censure. Afin de décrire la méthode d’estimation IPCW pour des modèles Markoviens, on
considèrera dans ce qui suit le modèle à deux états de santé de la figure V.4.
Etat 2Etat 1
Fig. V.4 – Modèle à deux états de santé avec retour.
Afin d’adapter la méthode IPCW au modèle à deux états avec retour, il faut supposer
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Méthode IPCW adaptée au modèle Markovien 127
que les temps d’événement sont tous différents. Cette hypothèse nécessaire pour utiliser
les méthodes d’estimation non-paramétriques (cf. chapitre IV page 74), permet d’avoir un
seul poids à prendre en compte à chaque temps d’événement. Notons qu’il est également
nécessaire de faire cette modification des temps pour l’estimation des risques de censure et
le calcul des poids dans la section précédente.
Soient 0 < T
1
< ··· < T
l
< τ les temps d’événement (tous différents), on peut créer un
vecteur
ˆ
W
h
(h = 1, 2) tel que pour k = 1, ..., l :
ˆ
W
h
(T
k
) =
ˆ
W
hi
(T
k
) si l’individu i subit un événement au temps T
k
= 0 si aucun individu ne subit d’événement,
où l’événement est une transition à partir de l’état h. On considère un modèle sans covariable
où les intensités de transition sont
λ
hj
(t) = λ
0
hj
(t), (h, j) ∈ {(1, 2), (2, 1)}.
L’estimateur IPCW de A
hj
(t) =
Z
t
0
λ
0
hj
(u)du s’obtient par p ondération de l’estimateur de
Nelson-Aalen suivant
ˆ
A
hj
(t) =
Z
t
0
J
h
(u)
n
P
i=1
Y
hi
(u)
dN
hj.
(u).
En suivant la démarche de la construction de l’estimateur IPCW pour études de survie, on
obtient l’estimateur IPCW des intensités cumulées A
hj
(t) :
ˆ
A
hj
(t |
ˆ
W
h
) =
Z
t
0
J
h
(u)
ˆ
W
h
(u)
n
P
i=1
Y
hi
(u)
ˆ
W
hi
(u)
dN
hj.
(u).
On peut ainsi déduire un estimateur IPCW de la matrice des probabilités de transition
P = {p
hj
} :
ˆ
P(t, t
′
) =
Y
u∈]t,t
′
]
(I + d
ˆ
A(u |
ˆ
W
h
(u))).
Remarque 24 On peut noter que la méthode d’estimation IPCW reste stable dans le cas où
la censure n’est pas dépendante du processus d’événement. En effet, les poids sont égaux à un
et on retrouve les estimations sans pondération (estimation semi-paramétrique « classique
»).
Remarque 25 Dans le calcul des poids, il a été nécessaire de choisir une des probabilités
de censure au temps t. Le choix arbitraire mais naturel a été ˆp
hC
(0, t) qui correspond à la
probabilité d’être censuré au temps
t
sachant un état
h
au temps
0
.
Par conséquent, pour que
les résultats soient les plus corrects possibles, il faut interpréter les probabilités de transition
ˆp
hj
(0, t). Cela ne pose pas vraiment de problème en pratique, en effet, ce sont souvent ces
probabilités qui sont interprétées.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
128 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
2.5 Modèle semi-paramétrique IPCW
Nous avons vu dans la section précédente, comment obtenir l’estimation de la survie
IPCW dans un modèle sans covariable. La méthode IPCW permet aussi d’ajuster un modèle
semi-paramétrique de Cox et d’estimer les coefficients de régression dans un contexte de
censure dépendante. On peut considèrer le modèle suivant
λ
hj
(t) = λ
0
hj
(t) × exp(β
hj
Z(t)), (h, j) ∈ {(1, 2), (2, 1)}.
2.5.1 Estimation des coefficients de régression
Afin d’estimer les coefficients de régression β
hj
tout en prenant compte de la censure
dépendante, il faut modifier la fonction score de la vraisemblance partielle. En s’inspirant
de la méthode IPCW pour la survie, on peut obtenir une fonction score modifiée qui se
différencie par le fait que la contribution de l’individu i pour la transition à partir de l’état
h au temps T
k
est pondéré par
ˆ
W
hi
(T
k
). Un estimateur de β
hj
, (h, j) ∈ {(1, 2), (2, 1)} est
ainsi obtenu en annulant la fonction score IPCW suivante :
U
hj
(β) =
n
X
i=1
Z
τ
0
"
Z
i
(t) −
P
n
i=1
Y
hi
(t)Z
i
(t)e
β
T
hj
Z
i
(t)
ˆ
W
hi
(t)
P
n
i=1
Y
hi
(t)e
β
T
hj
Z
i
(t)
ˆ
W
hi
(t)
#
×
ˆ
W
hi
(t)dN
hji
(t). (V.18)
On note que si les poids sont égaux à un, on retrouve la fonction score de la vraisemblance
partielle de la méthode d’estimation traditionnelle.
Preuve La construction de la fonction score IPCW pour le modèle à deux états suit la même
démarche de construction que le score IPCW pour la survie. La vraisemblance partielle est
donnée par l’expression suivante :
V =
Y
t
n
Y
i=1
Y
h,j
Ã
exp(β
T
hj
Z
i
(t))
P
n
i=1
Y
hi
(t) exp(β
T
hj
Z
i
(t))
!
∆N
hji
(t)
,
La log-vraisemblance est :
LogV =
X
h,j
n
X
i=1
Z
τ
0
Ã
β
T
hj
Z
i
(t) − log
Ã
n
X
i=1
Y
hi
(t) exp(β
T
hj
Z
i
(t))
!!
dN
hji
(t).
La dérivée de la log-vraisemblance par rapport à β
hj
est donnée par :
∂LogV
∂β
hj
=
n
X
i=1
Z
τ
0
"
Z
i
(t) −
P
n
i=1
Y
hi
(t)Z
i
(t) exp(β
T
hj
Z
i
(t))
P
n
i=1
Y
hi
(t) exp(β
T
hj
Z
i
(t))
#
dN
hji
(t),
On peut ensuite définir U
0
hj
(β) :
U
0
hj
(β) =
∂LogV
∂β
hj
=
n
X
i=1
Z
τ
0
£
Z
i
(t) − E
0
hj
(β, t)
¤
×
ˆ
K
0
h
(t)
ˆ
K
0
h
(t)
dN
hji
(t),
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Méthode IPCW adaptée au modèle Markovien 129
avec
E
0
hj
(β) =
P
n
i=1
Y
hi
(t)Z
i
(t)e
β
T
hj
Z
i
(t)
ˆ
K
0
h
(t)
ˆ
K
0
h
(t)
P
n
i=1
Y
hi
(t)e
β
T
hj
Z
i
(t)
ˆ
K
0
h
(t)
ˆ
K
0
h
(t)
.
De manière similaire, on peut définir E
i
hj
(β) et U
hj
(β) en remplaçant au dénominateur
ˆ
K
0
h
(t) par
ˆ
K
hi
(t) :
E
i
hj
(β) =
P
n
i=1
Y
hi
(t)Z
i
(t)e
β
T
hj
Z
i
(t)
ˆ
K
0
h
(t)
ˆ
K
hi
(t)
P
n
i=1
Y
hi
(t)e
β
T
hj
Z
i
(t)
ˆ
K
0
h
(t)
ˆ
K
hi
(t)
,
U
hj
(β) =
n
X
i=1
Z
τ
0
£
Z
i
(t) − E
i
hj
(β, t)
¤
×
ˆ
K
0
h
(t)
ˆ
K
hi
(t)
dN
hji
(t).
La fonction U
hj
(β, t) est appelée fonction score modifié. Avec
ˆ
W
hi
(t) =
ˆ
K
0
h
(t)
ˆ
K
hi
(t)
on a
U
hj
(β) =
n
X
i=1
Z
τ
0
"
Z
i
(t) −
P
n
i=1
Y
hi
(t)Z
i
(t)e
β
T
hj
Z
i
(t)
ˆ
W
hi
(t)
P
n
i=1
Y
hi
(t)e
β
T
hj
Z
i
(t)
ˆ
W
hi
(t)
#
×
ˆ
W
hi
(t)dN
hji
(t).
Un estimateur de β
hj
est la solution de l’équation U
hj
(β) = 0.
¥
En pratique, le nombre d’événements est fini et la fonction N
hji
(t) est une fonction en
escalier. Soit 0 < T
1
< ··· < T
l
< τ les temps d’événements, U
hj
(β) peut ainsi s’écrire :
U
hj
(β) =
n
X
i=1
X
{k;T
k
∈[0,τ[}
"
Z
i
(T
k
) −
P
n
i=1
Y
hi
(T
k
)Z
i
(T
k
)e
β
T
hj
Z
i
(T
k
)
ˆ
W
hi
(T
k
)
P
n
i=1
Y
hi
(T
k
)e
β
T
hj
Z
i
(T
k
)
ˆ
W
hi
(T
k
)
#
×
ˆ
W
hi
(T
k
) × (N
hji
(T
k
) − N
hji
(T
k−1
)) .
2.5.2 Estimation des probabilités de transition
Une estimation des probabilités de transition en fonction des covariables s’obtient à
partir de l’estimateur des intensités cumulées. En suivant une démarche identique au cas
non-paramétrique, A
hj
(t) =
Z
t
0
λ
hj
(u)du est estimé par :
ˆ
A
hj
(t |
ˆ
W
h
(.), Z
i
(.)) =
Z
t
0
J
h
(u)
ˆ
W
h
(u)
n
P
i=1
Y
hi
(u)
ˆ
W
hi
(u) exp(
ˆ
β
T
hj
Z
i
(u))
exp(
ˆ
β
T
hj
Z
i
(u))dN
hj.
(u),
où
ˆ
β
hj
est l’estimateur défini dans la section précédente. Soit 0 < T
1
< ··· < T
l
< τ les
temps d’événement, on peut calculer les valeurs de l’estimateur ∆
ˆ
A
hj
pour chaque temps
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
130 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
T
k
qui sont données par l’écriture suivante :
∆
ˆ
A
hj
(T
k
|
ˆ
W
h
(T
k
), Z
i
(T
k
)) =
J
h
(T
k
)
ˆ
W
h
(T
k
)
n
P
i=1
Y
hi
(T
k
)
ˆ
W
hi
(T
k
) exp(
ˆ
β
T
hj
Z
i
(T
k
))
× exp(
ˆ
β
T
hj
Z
i
(T
k
)) × (N
hj.
(T
k
) − N
hj.
(T
k−1
))
A l’aide du produit intégral, on déduit un estimateur de la matrice des probabilités de
transition P ={p
hj
} pour les valeurs de la covariable Z(.) :
ˆ
P(t, t
′
|
ˆ
W
h
(.), Z(.)) =
Y
T
k
∈]t,t
′
]
(I + ∆
ˆ
A(T
k
|
ˆ
W
h
(T
k
), Z(T
k
))).
3 Application à l’asthme
Dans cette section, on s’intéresse à l’application de la méthode IPCW à la base de don-
nées de patients asthmatiques. Dans cette base les patients perdus de vue sont très nombreux
et après discussion avec les pneumologues, il semble que le phénomène de censure soit in-
formatif. En effet, pour cette maladie, il semble que les perdus de vue soient essentiellement
des patients qui ont un asthme bien contrôlé et qui ne ressentent pas le besoin d’être sui-
vis régulièrement. L’obj ectif est de comparer les méthodes traditionnelles avec les versions
IPCW afin d’observer l’impact de l’hypothèse de censure dépendante sur la modélisation.
Ces résultats seront ensuite discutés et interprétés d’un point de vue clinique.
Dans une première partie, la méthode IPCW sera appliquée à des données de survie sur
l’asthme et dans une deuxième partie l’extension de la méthode IPCW sera utilisée dans le
cas d’un modèle de Markov à deux états.
3.1 Application à des données de survie
L’objet de cette partie est de présenter l’application de la méthode IPCW à des données
de survie sur l’asthme.
3.1.1 Définition du modèle
La base de données sur l’asthme présentée au chapitre I (cf. page 9) est utilisée afin
d’étudier des données de survie. Dans le cas de l’asthme, l’événement d’intérêt pour les
cliniciens est « le passage dans un état de contrôle inacceptable ». Le modèle est représenté
par la figure V.5.
Afin d’obtenir des données de survie à partir de la base, nous avons sélectionné pour
chaque patient, la « séquence » la plus longue d’au moins deux consultations consécutives
commençant par un état de contrôle acceptable (contrôle optimal et sous-optimal) et se
terminant soit par la fin du suivi soit par un état de contrôle inacceptable. Après cette
sélection, la base comprend 334 patients et un total de 777 consultations. Les quelques temps
d’événements ex-æquos ont été légèrement modifiés. Trois types de suivi sont rencontrés :
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Application à l’asthme 131
Etat 1
Contrôle
acceptable
Etat 2
Contrôle
inacceptable
Fig. V.5 – Modèle de survie pour l’asthme.
–
Les patients qui subissent l’événement, c’est-à-dire des patients qui passent dans l’état
de contrôle inacceptable (24, 8%; n = 83).
– Les patients considérés comme perdus de vues (68, 3%; n = 228). Ces patients ne
subissent pas l’événement et n’ont pas eu de consultation 3 mois avant la date de fin
d’étude.
– Les patients considérés comme vivants à la date de point (6.9%; n = 23). Ces patients
ne subissent pas l’événement et sont allés consulter 3 mois avant la date de fin d’étude.
Pour modéliser le risque de passer dans un état inacceptable, nous utiliserons les cova-
riables suivantes.
– L’indice de masse corporelle à chaque consultation : codée 0 si IMC < 25, 1 sinon.
– La sévérité à chaque consultation : codée 0 si le patient est non sévère, 1 sinon.
– La dose de corticoïdes inhalés à chaque consultation : codée 0 si la dose est inférieure
à 500 µg, 1 sinon.
– La dose de corticoïdes oraux à chaque consultation : codée 0 si la dose est égale à 0
mg, 1 sinon.
– Le nombre d’exacerbations à chaque consultation : codée 0 si le patient n’a aucune
exacerbations entre deux consultations, 1 sinon.
– La dose cumulée de corticoïdes oraux pendant l’année avant l’inclusion : codée 0 si le
patient a une dose cumulée inférieure ou égale à 2 grammes, 1 sinon.
Cette étude se déroulera en plusieurs étapes. Tout d’abord, les facteurs prédictifs de
l’événement d’intérêt (passage dans l’état l’inacceptable) seront sélectionnés à l’aide d’un
modèle de Cox. Cette étape permettra de choisir les variables à utiliser dans la modélisation
du risque de censure.
La seconde étape consistera à estimer le risque ainsi que la survie de la censure asso-
ciée. Ceci permettra de calculer les pondérations, d’observer l’impact des covariables sur le
phénomène de censure et de mettre en évidence la dépendance entre censure et événement.
Puis, la survie de l’événement « passage dans l’état inacceptable » sera estimée par
la méthode IPCW et sera comparée aux résultats obtenus par Kaplan-Meier. Pour finir,
l’impact des différentes covariables sur la survie pourra être étudié en estimant les coefficients
de regression à l’aide de la fonction score modifiée. Nous comparerons ces résultats avec ceux
obtenus par un modèle de Cox classique.
3.1.2 Modèle de Cox pour l’événement
Dans un premier temps, l’événement « passage dans l’état inacceptable » est étudié
à l’aide d’un modèle de Cox afin de déterminer les facteurs de risque de l’événement. On
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
132 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
considére dans un premier temps un modèle univarié pour chacune des covariables,
λ
T
(t) = λ
0
(t) exp(β
T
V (t)).
Le tableau V.1 présente les résultats des estimations des coefficients de régression, les écarts-
types et les p-value du test de Wald pour le test de H
0
: β = 0.
Covariable
ˆ
β (ec)
1
(p)
2
IMC 0.389 (0.220) (0.08)
Sévérité 0.589 (0.223) (<0.01)
Exacerbations -0.312 (0.267) (0.24)
Corticoïdes Inhalés 0.431 (0.162) (<0.01)
Corticoïdes Oraux 0.437 (0.129) (<0.01)
Antécédents Corticoïdes 0.759 (0.248) (<0.01)
1
estimations des écarts-types.
2
p avec le test de Wald pour H
0
: β = 0.
Tab. V.1 – Mo dèle de Cox univarié p our l’événement.
Afin de définir un modèle qui ajuste au mieux le risque d’événement, toutes les cova-
riables significativement différentes de 0 (sévérité de l’asthme, corticoïdes inhalés, oraux,
antécédents de traitements par corticoïdes oraux) sont incluses dans une analyse multiva-
riée. Les estimations pour les modèles à trois et quatre covariables sont données dans le
tableau V.2. Dans le modéle avec les quatre covariables, l’effet de la sévérité n’est plus signi-
ficatif ce qui n’est pas vraiment surprenant de part la définition de la sévérité de l’asthme.
Finalement le modèle avec trois covariables sera retenu pour modéliser le risque de passer
dans un état de contrôle inacceptable.
Covariable
ˆ
β (ec)
1
(p)
2
ˆ
β (ec)
1
(p)
2
Sévérité 0.024 (0.289) (0.93) ——
Corticoïdes Inhalés 0.317 (0.169) (0.06) 0.320 (0.167) (0.05)
Corticoïdes Oraux 0.347 (0.137) (0.01) 0.350 (0.132) (<0.01)
Antécédents Corticoïdes 0.563 (0.304) (0.06) 0.577 (0.252) (0.02)
1
estimations des écarts-types.
2
p avec le test de Wald pour H
0
: β = 0.
Tab. V.2 – Mo dèle de Cox multivarié pour l’événement.
3.1.3 Risque et survie de la censure
La méthode nécessite d’étudier le phénomène de censure en fonction des covariables qui
prédisent le processus d’événement. En effet, si les covariables qui prédisent l’événement
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Application à l’asthme 133
prédisent aussi la censure, alors la censure et l’événement seront dépendants par l’intermé-
diaire de ces covariables. Un modèle de Cox est alors utilisé pour étudier le risque censure
avec les covariables qui prédisent l’événement dans l’analyse multivariée. A partir de ce mo-
dèle et des estimations de la survie de la censure, les poids nécessaires à l’utilisation de la
méthode IPCW seront estimés et interprétés. Dans ce qui suit, aucune distinction n’a été
faite entre les différents types de censure, tous les individus qui ne subissent pas l’événement
sont considérés comme censurés (méthode IPCW de Robins [1993]).
Le tableau V.3 présente les résultats des estimations des coefficients de régression, les
écarts-types et les p-value avec le test de Wald. Parmi les trois covariables qui influencent le
risque d’événement, les corticoïdes oraux et les antécédents de corticoïdes oraux influencent
aussi de manière significative le risque de censure. Ces deux covariables ont un effet signifi-
catif sur le risque de censure et sur le risque d’événement. Ainsi il y a une dépendance entre
le processus de censure et le processus d’événement par l’intermédiaire de ces variables. Ce
résultat montre bien l’utilité de la méthode IPCW pour essayer de réduire les biais (dus à
cette dépendance) présents dans les méthodes d’estimations traditionnelles. Si aucune des
variables n’était significative à la fois dans la modélisation du risque de censure et de l’événe-
ment, l’utilisation de la méthode IPCW n’aurait pas été justifiée (car les résultats auraient
été ceux de la méthode de Kaplan-Meier).
Covariable
ˆ
β (ec)
1
(p)
2
Corticoïdes Inhalés -0.094 (0.070) (0.18)
Corticoïdes Oraux -0.670 (0.192) (<0.01)
Antécédents Corticoïdes -0.524 (0.256) (0.04)
1
estimations des écarts-types.
2
p avec le test de Wald pour H
0
: β = 0.
Tab. V.3 – Mo dèle de Cox multivarié pour la censure.
En ce qui concerne l’effet de ces covariables, les patients avec un traitement par corti-
coïdes oraux et les patients avec des antécédents de corticoïdes oraux ont un risque plus
faible d’être censuré. Autrement dit, les facteurs qui augmentent le risque de passage dans
l’état inacceptable diminuent le risque de censure. De plus, il est particulièrement intéressant
d’étudier l’impact des covariables sur le risque de censure. En effet, dans l’analyse univariée,
il ressort que mis à part les deux covariables précédentes, un asthme sévère et la présence
d’exacerbations diminue de manière significative le risque de censure. Tous ces résultats sur
le risque de censure tendent à corroborer l’intuition clinique selon laquelle les patients qui
se p ortent bien ont plus de chance d’être censurés.
Afin d’observer de manière graphique l’impact des covariables qui prédisent l’événement
sur le processus de censure, on peut tracer les risques de censure (Figure V.6) dans les trois
cas suivants :
– Le risque de censure sans covariable. L’estimation de ce risque correspond au rapport
du nombre de personnes qui subissent la censure et du nombre de personnes à risque.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
134 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
– Le risque de censure pour un individu théorique qui aurait ses covariables égales à 0
en tout temps t est le suivant : λ
C
(t |
¯
V
∗
(t), T > t) où
¯
V
∗
(t) est le vecteur nul de
dimension (3 × 1). Les valeurs des covariables restent constantes au cours du suivi.
– Le risque de censure pour un individu théorique qui aurait ses covariables égales à 1
en tout temps t est le suivant : λ
C
(t |
¯
V
∗
(t), T > t) où
¯
V
∗
(t) est le vecteur unité de
dimension (3 × 1).
0 5 10 15 20 25 30
0.00 0.02 0.04 0.06 0.08
Temps (mois)
Risque de censure
Modele sans covariable
Modele avec covariables codées 0
Modele avec covariables codées 1
Fig. V.6 – Estimations du risque de censure dans un modèle sans covariable, un modèle
avec covariables codées 0 et un modèle avec covariables codées 1.
Graphiquement, il apparaît également que ce sont les patients qui vont le mieux (i.e n’ont
pas d’antécédents de corticoïdes et n’ont pas de traitement corticoïdes oraux ou inhalés) qui
sont le plus à risque de censure. A l’inverse, les patients avec les covariables codées par 1 ont
un risque de censure plus faible. En gardant le même raisonnement, nous avons tracé sur la
figure V.7 la probabilité de rester non censuré jusqu’au temps t (ou survie de la censure), pour
les deux mêmes individus théoriques et le modèle sans covariable. Notons que le modèle sans
covariable correspond à l’estimation de la survie de la censure par l’estimateur de Kaplan-
Meier. Une fois encore, la probabilité de rester non censuré jusqu’au temps t est la plus
élevée chez les individus qui prennent un traitement et qui avaient des antécédents (mo dèle
avec covariables codées 1).
Les figures V.6 et V.7 montrent des écarts importants dans les estimations suivant les
valeurs des covariables. Ainsi ce sont les patients les moins à risque de subir l’événement «
passage dans l’état inacceptable » qui ont le plus de chance d’être censuré.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Application à l’asthme 135
0 5 10 15 20 25 30
0.0 0.2 0.4 0.6 0.8 1.0
Temps (mois)
Survie de la censure
Modele sans covariable
Modele avec covariables codées 0
Modele avec covariables codées 1
Fig. V.7 – Estimations de la survie de censure dans un modèle sans covariable, un modèle
avec covariables codées 0 et un modèle avec covariables codées 1.
3.1.4 Estimation de la survie
A partir des estimations de la survie de la censure par l’estimateur de Kaplan-Meier (où
la survie est identique pour tous les individus,
ˆ
K
0
(t)) et par un modèle semi-paramétrique de
Cox (la survie est spécifique à chaque individu puisqu’elle prend en compte les covariables,
ˆ
K
i
(t)), il est possible de définir les poids spécifiques à chaque individu :
ˆ
W
i
(t) =
ˆ
K
0
(t)
ˆ
K
i
(t)
Si la censure est indépendante
ˆ
K
i
(.) va converger vers
ˆ
K
0
(.) et les poids des individus
convergeront vers 1. Dans notre cas, si par exemple, le patient a toutes ses covariables
codées par 0 alors la survie (de la censure) sera inférieure à celle estimée par Kaplan-Meier
(Figure V.7). Le poids associé sera supérieur à 1 et par conséquent la contribution de cet
individu sera augmenter. Sur la figure V.8, l’estimation IPCW de la survie de l’événement
« passage dans l’état inacceptable » est comparée à l’estimation de Kaplan-Meier.
La survie IPCW est supérieure à l’estimation de Kaplan-Meier. Ce résultat signifie que
l’information issue de la censure améliore la survie. Ce résultat est cohérent puisque les
cliniciens estiment que les patients les plus censurés sont ceux qui se portent le mieux.
Les pondérations modifient les estimations en prenant en compte l’information des patients
censurés qui souvent se portent bien. Ainsi, la survie est améliorée avec la méthode IPCW.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
136 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
0 5 10 15 20 25 30
0.0 0.2 0.4 0.6 0.8 1.0
Temps (mois)
Survie de l’evenement
Kaplan−Meier
Methode IPCW
Fig. V.8 – Estimations de la survie de l’événement (transition dans l’état inacceptable) par
Kaplan-Meier et par la méthode IPCW.
3.1.5 Méthode IPCW avec covariables
La méthode IPCW permet aussi d’estimer les effets des covariables sur le risque d’évé-
nement en prenant en compte la censure dépendante. Pour cela, il faut résoudre la version
pondérée de la fonction score de la vraisemblance partielle (équation (V.13)). Les résultats
des estimations du paramètres β dans λ
T
(t) = λ
0
(t) exp(β
T
Z(t)), par un modèle de Cox
et par la fonction score modifiée sont présentés dans le tableau V.4. Les écarts-types des
estimations IPCW donnés dans le tableau sont obtenus par la formule (V.14).
Risque d’événement
Covariable Modèle de Cox univarié Méthode IPCW
ˆ
β (ec)
1
(p)
2
ˆ
β (ec)
1
(p)
2
IMC 0.389 (0.220) (0.08) 0.355 (0.221) (0.11)
Sévérité 0.589 (0.223) (<0.01) 0.697 (0.225) (<0.01)
Exacerbations -0.312 (0.267) (0.24) -0.158 (0.263) (0.55)
Corticoïdes Inhalés 0.431 (0.162) (<0.01) 0.893 (0.316) (<0.01)
Corticoïdes Oraux 0.437 (0.129) (<0.01) 0.880 (0.249) (<0.01)
Antécédents Corticoïdes 0.759 (0.248) (<0.01) 0.839 (0.256) (<0.01)
1
estimations des écarts-types.
2
p avec le test de Wald pour H
0
: β = 0.
Tab. V.4 – Estimation des coefficients de régression pour la survie de l’événement par le
modèle de Cox et par la méthode IPCW.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Application à l’asthme 137
L’estimation de ces coefficients de régression par la méthode IPCW sont assez proches
de ceux obtenus avec un modéle de Cox. Les facteurs de risque de passage dans l’état de
contrôle inacceptable sont les mêmes dans les deux méthodes d’estimation. La méthode
IPCW augmente de manière significative l’effet des corticoïdes oraux et inhalés sur le risque
d’événement. Ceci s’explique certainement par le fait que ces covariables prédisent la censure
et qu’elles sont utilisées dans le calcul des pondérations. Les résultats peuvent être aussi
discutés en terme de risque relatif. Par exemple, le risque de passer dans l’état 2 est supérieur
pour les individus dont l’asthme est sévère par rapp ort aux non sévères. Autrement dit avec
la méthode IPCW, les patients sévères ont deux fois plus de chance de passer dans l’état de
contrôle inacceptable. L’effet de l’IMC est légèrement atténué et n’est plus significatif avec
un seuil de 10 %.
3.1.6 Extension
Dans ce qui précède, tous les patients n’ayant pas subi l’événement sont considérés
comme censurés et sont pris en compte dans l’estimation du risque de censure. Ainsi aucune
différence n’est faite entre les phénomènes de censure. Cependant, il semble raisonnable de
penser que la censure générée par l’arrêt de l’étude n’apporte aucune information sur la
survenue de l’événement d’intérêt.
Pour cela, il est intéressant de distinguer deux types de censure à savoir la censure
potentiellement informative (perdus de vue) et non informative (exclus vivants). Ainsi il
semble naturel de considérer uniquement les perdus de vue dans l’estimation du risque de
censure. Les pondérations calculées de la sorte modifieront les contributions des individus
(dans les estimations) en prenant en compte uniquement les personnes perdues de vue.
Cette conception de la censure a été mise en oeuvre dans le cas de l’asthme afin de
comparer les nouveaux résultats avec les précédents. Ils ne sont pas présentés car ils ne sont
pas significativement différents. En effet, les coefficients de régression associés au risque de
censure ainsi que les estimations de la survie de la censure sont très proches. De même, les
estimations de la survie IPCW dans les deux cas sont quasiment superposables. Les faibles
différences observées entre ces résultats s’expliquent en partie par la faible proportion de
patients exclus vivants (6.9%, n = 23).
3.2 Application à un modèle de Markov à deux états
3.2.1 Modèle avec deux états de contrôle
Dans un premier temps, on considère un modèle à deux états de contrôle représenté par
la figure V.9.
Deux types de suivi sont rencontrés.
– Les patients considérés comme perdus de vues (90, 8%; n = 369). Ce sont les pa-
tients qui n’ont pas eu de consultation 3 mois avant la date de point. A la dernière
consultation,
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
138 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
Etat 1
Contrôle
acceptable
Etat 2
Contrôle
inacceptable
Fig. V.9 – Modèle à deux états de contrôle pour l’asthme.
–
256 patients étaient dans l’état acceptable,
– 113 patients étaient dans l’état inacceptable.
– Les patients considérés comme vivants à la date de point (9.2%; n = 37). Ces pa-
tients sont allés consulter au moins 3 mois avant la date de fin d’étude. A la dernière
consultation,
– 27 patients étaient dans l’état acceptable,
– 10 patients étaient dans l’état inacceptable.
L’objectif de cette étape est de sélectionner les covariables qui influencent l’évolution du
contrôle de l’asthme dans ce modèle. Un modèle univarié est ajusté pour chaque covariable.
Le tableau V.5 donne les estimations des coefficients de régression, les écarts-types et les
p-value avec le test de Wald pour tester si les coefficients sont statistiquement différents de
zéro.
Covariable Transition 1 → 2 Transition 2 → 1
ˆ
β (ec)
1
(p)
2
ˆ
β (ec)
1
(p)
2
IMC 0.238 (0.189) (0.21) -0.356 (0.132) (<0.01)
Sévérité 1.013 (0.196) (<0.01) -0.180 (0.170) (0.29)
Exacerbations -0.149 (0.223) (0.50) 0.198 (0.183) (0.28)
Corticoïdes Inhalés 0.899 (0.288) (<0.01) -0.244 (0.136) (0.07)
Corticoïdes Oraux 0.903 (0.219) (<0.01) -0.249 (0.360) (0.49)
Antécédents Corticoïdes 1.117 (0.205) (<0.01) -0.320 (0.225) (0.16)
1
estimations des écarts-types.
2
p avec le test de Wald pour H
0
: β = 0.
Tab. V.5 – Modèle semi-paramétrique univarié pour les risques de transition entre états de
santé.
La sévérité de l’asthme, le traitement par corticoïdes oraux et inhalés et les antécédents
de corticoïdes oraux augmentent le risque de passer d’un état acceptable vers un état in-
acceptable. La seule covariable qui influence de manière significative le risque de passer de
l’état inacceptable vers un état acceptable, est l’IMC : un patient en surpoids à moins de
chance de passer dans un état acceptable (comparé à un patient avec un IMC < 25). A
partir de cette analyse univariée, on peut définir un modèle multivarié qui inclut les cinq
covariables qui ont un impact significatif sur l’évolution de l’asthme. Le tableau V.6 donne
les résultats des estimations et des tests dans ce modèle multivarié.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Application à l’asthme 139
Covariable Transition 1 → 2 Transition 2 → 1
ˆ
β (ec)
1
(p)
2
ˆ
β (ec)
1
(p)
2
IMC 0.068 (0.193) (0.72) -0.291 (0.143) (0.04)
Sévérité 0.451 (0.245) (0.07) -0.032 (0.159) (0.84)
Corticoïdes Inhalés 0.515 (0.302) (0.09) -0.103 (0.152) (0.49)
Corticoïdes Oraux 0.617 (0.230) (<0.01) -0.065 (0.198) (0.74)
Antécédents Corticoïdes 0.696 (0.244) (<0.01) -0.190 (0.190) (0.32)
1
estimations des écarts-types.
2
p avec le test de Wald pour H
0
: β = 0.
Tab. V.6 – Modèle semi-paramétrique multivarié pour les risques de transition entre états
de santé.
Les effets qui sont significatifs dans l’analyse univariée le sont encore dans l’analyse
multivariée même s’ils sont atténués par l’ajustement. Ce modèle sera retenu pour modéliser
l’évolution de la maladie.
3.2.2 Modèle avec état de censure
Après avoir sélectionné les covariables qui ajustent le mieux l’évolution de l’asthme dans
un modèle à deux états de santé, on va vérifier que ces covariables influencent aussi les
processus de censure à partir de l’état acceptable et inacceptable. Afin d’étudier les risques
de censure, on considère le modèle à trois états de la figure V.2. Ce modèle comprend deux
états de contrôle (acceptable et inacceptable) et un état de « censure » dans lequel l’individu
peut transiter à partir de l’état acceptable et de l’état inacceptable. L’intérêt de ce modèle
est de permettre une estimation des risques de censure et d’observer si les covariables ont un
impact sur ces risques. Le tableau V.7 donne les estimations, dans un modèle multivarié, des
coefficients de régression associés aux transitions des états de contrôle vers l’état de censure.
Covariable Transition 1 → C Transition 2 → C
ˆ
β (ec)
1
(p)
2
ˆ
β (ec)
1
(p)
2
IMC 0.038 (0.134) (0.78) -0.135 (0.202) (0.50)
Sévérité -0.116 (0.193) (0.55) 0.154 (0.224) (0.49)
Corticoïdes Inhalés -0.035 (0.139) (0.80) 0.829 (0.264) (<0.01)
Corticoïdes Oraux -1.292 (0.365) (<0.01) -0.228 (0.265) (0.39)
Antécédents Corticoïdes -0.111 (0.249) (0.66) -0.586 (0.269) (0.03)
1
estimations des écarts-types.
2
p avec le test de Wald pour H
0
: β = 0.
Tab. V.7 – Modèle semi-paramétrique multivarié pour les risques de censure.
Ces résultats montrent l’effet des covariables sur les risques de censure. A partir de l’état
acceptable, les patients avec un traitement par corticoïdes oraux ont un risque de censure
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
140 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
diminué. De même, lors de l’analyse univariée avec différentes covariables, il ressort que
la présence d’exacerbations diminue le risque de censure à partir de l’état acceptable. Ces
résultats corroborent les intuitions cliniques et les résultats obtenus avec la méthode IPCW
pour données de survie. A propos du risque de censure, à partir de l’état inacceptable, il
semble que les antécédents de corticoïdes oraux diminue ce risque alors que le traitement
par corticoïdes inhalés augmente ce risque. Ce résultat semble surprenant et contradictoire
avec le fait que les patients les plus atteints soit les moins censurés. Cependant, il peut
s’expliquer par le fait que le phénomène de censure à partir d’un état acceptable et à partir
d’un état inacceptable sont de nature différente. Un patient qui est soigné et qui se trouve
dans un état de contrôle inacceptable peut commencer à douter du médecin et ainsi quitter
l’étude pour se faire soigner ailleurs. Ce phénomène est courant dans le cas du VIH, par
exemple, où les patients les plus malades abandonnent le suivi.
Ensuite, les résultats de ce tableau montrent que parmi les coefficients qui ont un effet
significatif sur la transition 1 → 2, seul l’effet des corticoïdes oraux reste significatif pour la
transition de l’état acceptable vers l’état « censure ». L’IMC était la seule variable à avoir un
effet sur la transition 2 → 1, cependant elle ne modifie pas de manière significative le risque
de censure à partir de l’état 2. Ainsi la seule covariable qui influence de manière significative
le processus d’évolution de la maladie et le processus de censure est le traitement par corti-
coïdes oraux. Le processus d’événement étant dépendant de la censure par l’intermédiaire de
cette variable, on peut appliquer la méthode IPCW pour réduire les biais engendrés par cette
dépendance. Même si la dépendance n’est pas flagrante (une seule variable prédit les deux
processus), la méthode IPCW peut être utilisée. En effet, si les covariables qui prédisent
l’évolution de la maladie ne prédisent pas la censure alors les pondérations vont tendre vers
1 et on retombera sur les estimations traditionnelles.
Afin d’étudier les phénomènes de censure à partir de l’état acceptable et de l’état inac-
ceptable, il est possible de tracer les probabilités d’être censurés au temps t sachant l’état de
départ. La figure V.10, montre les probabilités de censure dans un modèle sans covariable.
Un patient dans l’état acceptable au temps 0 a plus de chance d’être censuré au temps t
qu’un patient dans un état inacceptable. Ce résultat est en accord avec les résultats précé-
dents : en effet, un patient qui se porte bien a tendance à arrêter le suivi, alors qu’un patient
dans un état inacceptable revient plus facilement en consultation.
3.2.3 Estimations des probabilités de transition
Le calcul des probabilités de censure dans le modèle multivarié (avec état de censure),
permet de définir des pondérations spécifiques à chaque individu. On définit ainsi des poids
associés à l’état acceptable et à l’état inacceptable. Ces poids sont ensuite intégrés dans
la méthode d’estimation semi-paramétrique pour modèle Markovien afin de modifier les
contributions des individus. Sur les figures V.11 (a) et V.11 (b), les estimations des pro-
babilités de transition ((a) probabilité de transition 1 → 2, (b) probabilité de transition
2 → 1) par la méthode IPCW sont comparées à celles obtenues par la méthode d’estimation
semi-paramétrique pour modèle Markovien.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Application à l’asthme 141
0 5 10 15 20 25 30
0.0 0.2 0.4 0.6 0.8 1.0
Temps (mois)
Probabilité de censure
0 5 10 15 20 25 30
0.0 0.2 0.4 0.6 0.8 1.0
Probabilité de censure à partir de l’état 1
Probabilité de censure à partir de l’état 2
Fig. V.10 – Probabilités de censure à partir des états de contrôle acceptable et inacceptable.
0 5 10 15 20 25 30
0.0 0.2 0.4 0.6 0.8 1.0
Temps (mois)
Probabilité de transition 1−>2
Semi−parametrique
Methode IPCW
(a)
0 5 10 15 20 25 30
0.0 0.2 0.4 0.6 0.8 1.0
Temps (mois)
Probabilité de transition 2−>1
Semi−parametrique
Methode IPCW
(b)
Fig. V.11 – Estimations des probabilités de transition par la méthode semi-paramétrique
et par la méthode IPCW. (a) Probabilité de transition de l’état de contrôle acceptable vers
l’état inacceptable (1 → 2). (b) Probabilité de transition de l’état de contrôle inacceptable
vers l’état acceptable (2 → 1).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
142 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
Comme pour l’étude de l’événement passage dans l’état inacceptable (modèle de survie),
l’estimation de la probabilité de passer d’un état acceptable vers un état inacceptable par la
méthode IPCW est plus faible que l’estimation par la méthode semi-paramétrique (Figure
V.11 (a)). D’autre part, la probabilité de passer de l’état inacceptable vers l’état acceptable
(Figure V.11 (b)) est plus grande avec la méthode IPCW. Ainsi, dans ce modèle à deux états
avec retour possible, le fait de prendre en compte les patients censurés conduit à de meilleurs
résultats d’un point de vue clinique : les estimations IPCW améliorent la probabilité de
retour dans un état stable et diminuent la probabilité de passer dans un état instable.
3.2.4 Méthode IPCW avec covariables
Dans un deuxième temps, la méthode IPCW permet d’estimer les effets des covariables
sur les risques de transitions entre les états de contrôle en intégrant les pondérations cal-
culées précédemment. On peut ainsi obtenir des estimations des coefficients de régression
en prenant en compte l’information issue des patients censurés. Ces estimations sont obte-
nues par résolution des équations modifiées du score de la vraisemblance partielle (équation
(V.18)). Les résultats sont présentés dans les tableaux V.8 et V.9. Les estimations avec la
vraisemblance partielle de Cox et avec la version modifiée de la fonction score sont proches
et peu de différences significatives sont à noter. Les écarts-types et les probabilités de rejet
ne sont pas présentés car il n’y a pas encore de résultats de convergence asymptotique.
Transition 1 → 2
Covariable
Modèle (univarié)
semi-paramétrique
Méthode IPCW
(univarié)
ˆ
β (ec)
1
(p)
2
ˆ
β (ec)
1
(p)
2
IMC 0.238 (0.189) (0.21) 0.203
Sévérité 1.013 (0.196) (<0.01) 1.060
Exacerbations -0.149 (0.223) (0.50) -0.032
Corticoïdes Inhalés 0.899 (0.288) (<0.01) 0.787
Corticoïdes Oraux 0.903 (0.219) (<0.01) 1.072
VEMS 0.693 (0.288) (0.02) 0.607
Antécédents Corticoïdes 1.117 (0.205) (<0.01) 1.081
1
estimations des écarts-types.
2
p avec le test de Wald pour H
0
: β = 0.
Tab. V.8 – Estimation des coefficients de régression pour la transition 1 → 2 par le modèle
semi-paramétrique et par la méthode IPCW.
3.2.5 Extension
De manière similaire à l’analyse de données de survie, il est intéressant de différencier
la censure générée par l’arrêt de l’étude (pouvant être supposée non informative) et celle
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
4. Discussion 143
Transition 2 → 1
Covariable
Modèle (univarié)
semi-paramétrique
Méthode IPCW
(univarié)
ˆ
β (ec)
1
(p)
2
ˆ
β (ec)
1
(p)
2
IMC -0.356 (0.132) (<0.01) -0.337
Sévérité -0.180 (0.170) (0.29) -0.228
Exacerbations 0.198 (0.183) (0.28) 0.197
Corticoïdes Inhalés -0.244 (0.136) (0.07) -0.250
Corticoïdes Oraux -0.249 (0.360) (0.49) -0.261
VEMS 0.084 (0.136) (0.54) 0.117
Antécédents Corticoïdes -0.320 (0.225) (0.16) -0.254
1
estimations des écarts-types.
2
p avec le test de Wald pour H
0
: β = 0.
Tab. V.9 – Estimation des coefficients de régression pour la transition 2 → 1 par le modèle
semi-paramétrique et par la méthode IPCW.
engendrée par les perdus de vue (potentiellement informative). Ainsi, seul les patients perdus
de vue peuvent être considérés dans l’estimation du risque de censure.
Avec cette conception de la censure, les résultats obtenus dans le cas de l’asthme sont
très proches des résultats précedents. Les faibles différences observées s’expliquent en partie
par la faible prop ortion de patients exclus vivants (27 à partir de l’état 1 et 10 à partir de
l’état 2).
4 Discussion
L’objectif de ce travail était de modéliser l’évolution d’une maladie dans le cas où la
censure est dépendante de cette évolution. Dans un premier temps, la méthode est décrite
dans le cadre d’analyse de survie. La méthode permet d’étudier les risques de censure et
fournit ainsi des informations sur les facteurs expliquant ce phénomène. L’extension pro-
posée de la méthode permet de différencier a priori la censure par perdus de vue et par
exclus vivants afin d’utiliser uniquement l’information issue de la censure potentiellement
informative. Dans un deuxième temps, la méthode est généralisée à certains modèles multi-
états afin de prendre en compte la dépendance entre l’évolution de la maladie et la censure
dans ces modèles. Enfin, les méthodes présentées sont appliquées à la base de données sur
l’asthme. Notons que la programmation de ces méthodes suit une démarche identique à celle
de l’estimation semi-paramétrique (cf. chapitre IV) présentée en annexe page 177.
4.1 Application
L’implémentation des méthodes a donné de résultats forts intéressants. Dans le cadre de
données de survie, nous sommes en mesure d’expliquer la censure par différentes covariables :
la prise ou non de traitement de corticoïdes inhalés ou oraux, les antécédents de traitement
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
144 Chapitre V. Prise en compte de la censure informative - Méthode IPCW
mais aussi la présence d’exacerbations et la sévérité de l’asthme. Il s’avère que ce sont souvent
les patients qui vont le mieux qui sont perdus de vue ce qui est cohérent avec l’intuition
des cliniciens. Le deuxième point important à noter est que certaines covariables prédisent
à la fois la censure et l’événement modélisé ce qui met en évidence la dépendance entre la
censure et l’événement dans le cas de l’asthme. Le fait de prendre en compte l’information
issue des patients censurés, nous a permis d’améliorer la survie des patients asthmatiques.
Certes, cette différence entre les deux estimations n’est pas majeure mais elle va dans le sens
des cliniciens. En effet, si ce sont les patients les plus censurés qui vont le mieux il est logique
que la survie soit améliorée en prenant en compte cette information. Cependant, dans la
population, il y a aussi des individus qui sont censurés parce qu’ils vont mal ou parce qu’ils
ne sont pas satisfaits du résultat thérapeutique, et changent de médecin (même si ce n’est
pas la majorité des cas). Dans ce cas là, les poids asso ciés à ces individus sont inférieurs à
un. De ce fait, pour chaque temps, il y a un mélange de poids inférieurs et supérieurs à un,
ce qui entraîne un effet barycentrique dans l’estimation de la survie. Ceci pourrait expliquer
en partie que la différence entre les deux méthodes ne soit pas plus importante.
Dans le cadre d’un modèle à deux états de contrôle avec retour possible, les résultats
confirment ceux obtenus avec un modèle de survie. En effet, la censure est expliquée par
plusieurs covariables et elle est dépendante du processus d’événement par l’intermédiaire
de certaines de ces covariables. Notons également que la probabilité de censure à partir
de l’état acceptable est plus importante que celle à partir de l’état inacceptable ce qui est
logique d’un point de vue clinique. Les résultats sur les probabilités de transition confirment
l’intuition clinique selon laquelle un patient qui se portent bien a plus tendance à être
censuré : l’estimation IPCW améliore la probabilité de retour vers un état stable et diminue
la probabilité de passage vers un état instable.
Dans le cadre des modèles de survie ou dans le cadre des modèles multi-états, nous avons
réalisé deux modélisations des risques de censure. Tout d’abord, il est considéré que toute la
population qui n’a pas subi d’événement est censurée, que ce soit par perdu de vue ou par
exclus vivants (Robins et Finkelstein [2000]). Cependant, nous disposons d’une information
que nous occultons dans ce cas précis. En effet, il est raisonnable de penser que la censure
due au gel de la base est engendrée de manière aléatoire et n’apporte aucune information sur
l’événement étudié. Ceci motive notre choix de mo déliser un « risque de censure informative
» pour utiliser au maximum l’information a priori dont nous disposons. En réalisant les
estimations selon les deux hypothèses présentées, nous avons constaté qu’une faible différence
existait entre les résultats des probabilités de transition. Ceci s’explique notamment par le
fait que la part des exclus vivants représente moins de 10% de l’échantillon, ainsi, prendre
en compte ou non cette information ne change guère les résultats.
4.2 Méthodes
L’originalité de cette méthode repose sur la mo délisation des risques de censure, ce qui
habituellement n’est pas traité dans la littérature. Cette étape permet de déterminer les
facteurs prédictifs de la censure et ainsi de mieux comprendre le mécanisme de censure
dans la pathologie étudiée. De plus, cette étape permet juger de la dépendance entre la
censure et l’événement en déterminant les covariables qui influencent à la fois le risque
d’événement et de censure. La méthode IPCW est fondée sur l’étude de la survie de la
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
4. Discussion 145
censure afin d’obtenir les pondérations spécifiques à chaque individu. Ceci permet de prendre
en compte l’information issue des perdus de vue et d’améliorer l’estimation de la survie de
l’événement. Cette méthode a également un grand avantage puisque les estimateurs IPCW
convergent vers les estimateurs traditionnels (Kaplan-Meier et estimateur non-paramétrique
dans les modèles multi-états). En effet, les variables prédisant l’événement n’ont pas un
impact significatif sur le risque de censure, par conséquent, les poids convergent vers un
(
ˆ
K
0
(t) ≃
ˆ
K
i
(t)) et ainsi, l’estimateur IPCW converge vers l’estimateur traditionnel. Ceci
est un atout pour la méthode puisqu’il n’est pas nécessaire de faire d’hypothèses a priori sur
la relation entre la censure et l’événement. La méthode est particulièrement adaptée pour
réduire les biais quand la censure semble informative et qu’une part importante des patients
sont des perdus de vue.
Cependant, comme dans toutes études des limites existent. En particulier, l’hypothèse
(V.1) est contraignante puisqu’elle suppose que la connaissance temporelle des covariables
apporte suffisamment d’informations pour que l’on puisse se passer de celle apportée par le
temps d’événement. Cette hypothèse est d’autant plus vraie qu’on dispose d’un maximum
de facteurs de risque de l’événement. Il est donc important de prendre en compte les facteurs
essentiels afin de minimiser la contrainte imposer par l’hypothèse.
4.3 Perspectives
Afin de poursuivre le développement de la méthode IPCW pour modèle de Markov à
deux états, il faudra étudier les propriétés de convergence asymptotique en s’inspirant des
travaux de Robins [1993] et Andersen et al. [1993]. Ces résultats permettront d’obtenir une
estimation de la variance des coefficients de régression. Cette variance est utile pour tester
si certains coefficients sont statistiquement différents de zéro et pour obtenir des intervalles
de confiance.
Il serait également intéressant de généraliser la méthode à toutes les formes de mo dèles
multi-états. En effet, dans la méthode présentée, les poids sont identiques pour toutes les
transitions à partir d’un même état. Cela ne pose pas de problèmes dans le cas des modèles à
deux états et des modèles progressifs car une seule transition est possible à partir d’un même
état. Si plusieurs transitions sont possibles, les poids modifieront les estimations de manière
identique. Ainsi, dans l’exemple d’un modèle à trois états : « sain », « malade » et « décès
» (Figure V.1 (c)), la censure aura un impact identique sur la transition « malade » vers
« décès » et sur la transition « malade » vers « sain ». Dans le cas où plusieurs transitions
sont possibles, on pourrait, par exemple essayer de construire des poids spécifiques à chaque
transition (par l’intermédiaire des covariables par exemple). Ceci permettrait de prendre en
compte l’effet de la censure informative en fonction du type d’événement.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
146 Conclusion Générale
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
Conclusion Générale
Décrire l’évolution des phénomènes dans le temps est d’un intérêt capital en épidémio-
logie. Par exemple, les maladies chroniques, l’impact d’un traitement ou encore la qualité
et le coût du suivi doivent être étudiés de manière dynamique. L’étude statistique de ces
données de cohorte est devenue essentielle pour une meilleure compréhension des maladies
et une amélioration du suivi. Les modèles multi-états de type Markovien répondent à cette
problématique et constituent un outil important pour l’analyse de ces données.
5 Récapitulatif de la thèse
Dans un premier temps, nous avons rappelé la méthodologie relative au modèle de Mar-
kov homogène (Saint-Pierre et al. [2003]). Ce modèle est le moins « complexe » des modèles
de type Markovien car il suppose que les intensités de transition sont constantes dans le
temps. Cette hypothèse d’homogénéité simplifie la méthodologie statistique et la program-
mation des méthodes d’estimation. Cependant, elle impose une contrainte qui est souvent
trop forte dans de nombreuses applications.
Dans un second temps, nous avons étudié deux méthodes d’estimation (paramétrique et
non-paramétrique) des intensités de transition dans un modèle semi-Markovien homogène.
En effet, le modèle semi-Markovien propose une alternative quand le temps écoulé dans
un état de santé semble être un facteur important de l’évolution de la maladie. Le modèle
semi-Markovien homogène suppose lui que les intensités de transition dépendent de la durée
écoulée dans un état.
La théorie des processus de comptage est ensuite présentée afin d’introduire des méthodes
d’estimation (non-paramétrique et semi-paramétrique) dans le cadre d’un modèle de Markov
non-homogène (Saint-Pierre et al. [2005c]). Dans ce modèle, les intensités de transition
dépendent de la durée du suivi (temps depuis l’inclusion dans l’étude). La méthodologie des
processus de comptage fournit un cadre rigoureux qui permet notamment de généraliser,
aux mo dèles Markoviens, les estimateurs traditionnels des modèles de survie.
Les méthodes d’estimation présentées dans le cadre du modèle Markov non-homogène
(et du modèle semi-Markovien) supposent que le mécanisme de censure n’apporte aucune
information sur l’évolution de la maladie. Cette hypothèse étant rarement vérifiée en pra-
tique, nous présentons une méthode d’estimation permettant de prendre en compte une
censure informative dans l’étude de la survie (Saint-Pierre et al. [2005b]). En s’inspirant
des méthodes d’estimation dans un modèle de Markov non-homogène, nous avons étendu
147
148 Conclusion Générale
cette méthodologie au cas des modèles progressifs et des modèles Markoviens à deux états
réversibles où la censure pose les mêmes difficultés.
Nous présentons en annexe un complément concernant la théorie statistique relative
aux processus de comptage. Ce complément permet d’approfondir certains résultats certes
complexes, mais indispensables à la bonne compréhension de cette théorie. Les annexes
fournissent également un « guide » visant à faciliter la programmation des estimateurs
basés sur les processus de comptage (Saint-Pierre et al. [2004]). Ainsi, les méthodes non-
paramétriques et semi-paramétriques dans le cadre d’un modèle de Markov non-homogène
(cf. chapitre IV) et les méthodes IPCW (cf. chapitre V) peuvent être implémentées en
suivant la démarche décrite dans cette aide (cf. annexe page 177).
6 Résultats cliniques sur l’asthme
Dans les différents modèles étudiés, chaque méthode d’estimation est appliquée à une
cohorte de patients asthmatiques. Nous avons particulièrement observé l’impact de l’in-
dice de masse corporelle sur l’évolution de l’asthme. Dans tous les modèles utilisés (Markov
homogène, semi-Markov homogène et Markov non-homogène), le surpoids diminue significa-
tivement l’intensité de transition d’un état de contrôle inacceptable vers un état de contrôle
optimal. De plus, l’utilisation d’un modèle de Markov homogène à deux états de contrôle a
permis d’obtenir des estimations ajustées sur la sévérité et la corticothérapie orale. Ainsi,
il semble que l’effet négatif du surpoids sur la transition de l’état inacceptable vers l’état
acceptable soit indépendant du traitement et de la sévérité. Ce résultat qui fait l’objet
d’une publication dans une revue médicale (Saint-Pierre et al. [2005a]) corrobore et renforce
les conclusions de plusieurs travaux visant à montrer un lien entre l’asthme et le surpoids
(même si une preuve définitive est toujours manquante). Ainsi, l’effet négatif du surpoids
devrait être pris en compte dans l’élaboration de rapports et consignes sur le suivi des asth-
matiques. En particulier, il semble important que l’asthmatique se maintienne à un poids
normal (IMC < 25) afin de ne pas diminuer ses chances de retourner dans un état stable.
De plus, il faudrait faire le maximum pour éviter qu’un patient en surpoids transite vers un
état de contrôle inacceptable.
La prise en compte de la censure informative dans le cas de l’asthme fournit également des
résultats intéressants. En effet, les méthodes prenant en compte l’information contenue dans
la censure permettent de diminuer l’estimation de la probabilité de transition vers un état de
contrôle inacceptable et d’augmenter la probabilité de revenir à un contrôle acceptable. Ces
résultats mettent en évidence l’intuition des médecins selon laquelle les patients censurés
sont souvent des patients bien contrôlés.
7 Choix du modèle
Le choix du modèle dépend essentiellement des échelles de temps qui influencent l’évo-
lution du phénomène. Le modèle de Markov homogène est adapté quand aucune échelle de
temps ne semble influencer l’évolution de la maladie. Le modèle de Markov non-homogène et
le modèle semi-Markovien homogène sont comparables en terme de flexibilité mais accordent
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
8. Discussion des biais 149
de l’importance à des échelles de temps différentes. Le modèle semi-Markovien homogène
sera adapté pour prendre en compte la durée écoulée dans un état alors que le modèle de
Markov non-homogène sera préférable pour la durée du suivi, l’âge ou le temps calendaire.
Un modèle semi-Markovien non-homogène permettra de prendre en compte deux échelles
de temps dans la modélisation.
Cependant, le rôle des échelles de temps est parfois mal connu. Dans ce cas, le modèle
de Markov homogène est très utile. Ce modèle permet de tester l’hypothèse d’homogénéité
et l’hypothèse Markovienne par l’intermédiaire de certaines covariables artificielles (respec-
tivement, homogénéité par périodes, temps de séjour). Cette étape permet ainsi de choisir
entre les différents modèles. Cependant, plusieurs modèles peuvent être appropriés. Dans
ce cas, il devient difficile de mesurer l’apport de chaque modèle. En effet, les modèles ne
sont pas emboîtés et les vraisemblances des modèles sont de formes différentes. Il est alors
intéressant de comparer et de croiser les résultats afin d’approfondir les interprétations.
8 Discussion des biais
Les modèles multi-états constituent un outil performant pour l’analyse de données répé-
tées en particulier lorsque les temps d’observation sont quelconques. Les résultats obtenus
sont facilement interprétables d’un point de vue clinique. Les probabilités de transition per-
mettent de bien comprendre l’évolution de la maladie. De plus, l’introduction de covariables
dans ces modèles permet de mesurer l’impact des différents facteurs de risque.
Cependant, il faut rester très prudent quant à l’interprétation des résultats obtenus avec
de telles analyses. En effet, les hypothèses nécessaires à la modélisation peuvent être sources
de biais.
– L’hypothèse de Markov résume l’historique de l’individu au dernier état visité (pro-
cessus sans mémoire).
– Dans toutes les méthodes présentées, il est supposé que la transition entre les états
se produit au moment de la consultation. Les méthodes pour ajuster une censure par
intervalles sont une alternative quand cette hypothèse semble trop forte.
– Les méthodes d’estimation dans le modèle de Markov non-homogène et dans le mo-
dèle semi-Markovien homogène supp osent qu’il n’y a pas de changement d’état non
observé entre deux consultations consécutives. Cependant, quand aucune information
sur le patient n’est disponible entre deux consultations consécutives (patients suivis
par intermittence) et que le modèle comprend des états réversibles, il est possible
que certains changements d’état ne soient pas observés. Pour éviter ce problème, on
suppose que les observations sont suffisamment rapprochées pour que l’on puisse consi-
dérer en pratique que tous les changements d’état sont observés (ainsi les durées de
séjours sont disponibles). Dans le cas où cette hypothèse n’est pas vérifiée, l’analyse
peut être biaisée.
– Aucune information n’est disponible sur l’état du patient après sa dernière consultation
à cause du phénomène de censure à droite. Le modèle de Markov non-homogène et
le modèle semi-Markovien font intervenir la durée entre la dernière consultation et la
date de fin d’étude. Cette durée varie en fonction du choix de la date de fin d’étude
et peut influencer les estimations. Ces modèles considèrent que l’état du patient ne
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
150 Conclusion Générale
change pas entre la dernière consultation et l’arrêt de l’étude. Cette hypothèse semble
d’autant plus vraie que la durée entre la dernière consultation et la fin de l’étude est
courte. Le modèle de Markov homogène ne prend pas en compte ce qui se passe après
la dernière consultation.
– L’introduction de covariables par l’intermédiaire d’un modèle à risques proportionnels
implique une hypothèse de proportionnalité.
– L’utilisation de covariables dépendantes du temps nécessite de supposer que la valeur
de la covariable ne change pas entre deux consultations (indépendamment du temps
entre deux consultations).
– Les méthodes d’estimation dans ce type de modèles font souvent une hypothèse de
censure non-informative. Cependant, dans de nombreuses applications, il est difficile
de supposer que la censure n’apporte aucune information sur le phénomène étudié.
Dans ce cas, les méthodes prenant en compte une censure informative permettent de
mieux comprendre le mécanisme de censure et d’avoir des estimations corrigées.
Notons également que de nombreux biais sont inhérents aux bases observationnelles et
sont très difficiles à éliminer. Parmi les biais les plus courants dans ce type d’étude, on
rencontre :
– Le biais de confusion dû aux corrélations entre les covariables et qui n’est que partiel-
lement réglé par l’ajustement.
– Le biais de sélection dû au fait que ce n’est pas n’importe quelle population qui prend
un médicament et de ce fait la population traitée est particulière.
– Le biais de compliance, lui est d’une autre forme : en général, les patients qui prennent
bien les traitements adhèrent au système de soins, ont une meilleure hygiène de vie et
une meilleure santé (comparativement aux individus non compliants).
9 Perspectives
L’introduction d’un effet aléatoire dans l’écriture des intensités de transition peut être
utile pour réduire certains biais. Ces modèles de fragilité (frailty) permettent de prendre en
compte le lien entre éléments de la population. Ils ajustent les estimations sur l’effet des
variables qui ne sont pas incluses dans le modèle ou qui ne sont pas mesurées. L’utilisation
des techniques bayesiennes fournit un outil attractif pour ajuster ce type de modèles.
Il semble également important de développer les méthodes permettant de prendre en
compte une censure informative. En effet, le phénomène de censure est toujours présent dans
les données de cohorte, et, dans bien des cas, il apporte une information sur l’événement
étudié. La prise en compte de cette information est importante pour tenter de réduire une
partie des biais.
La théorie des processus de comptage et des martingales fournit un cadre formel à de
nombreuses problématiques complexes. L’utilisation de cette théorie semble essentielle pour
le développement théorique des méthodes liées aux modèles multi-états.
Il nous semble également important de continuer à développer des programmes et des
algorithmes afin de faciliter l’utilisation des modèles multi-états. Il serait ainsi intéressant
de mettre en place des logiciels permettant d’ajuster certaines méthodes d’estimation pour
ce type de modèle.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
9. Perspectives 151
D’un point de vue clinique, il semble important d’approfondir l’analyse de cette base de
données et l’étude de l’évolution de l’asthme. En particulier, l’impact de l’indice de masse
corporelle mérite d’être mieux connu. Nous nous sommes limités à l’étude du surpoids (IMC
> 25) car la base ne comporte pas suffisamment de patients obèses (IMC > 30). La mise en
place d’une nouvelle cohorte pourrait permettre, entre autre, d’étudier plus en détail l’effet
de l’indice de masse corporelle en considérant une variable à plusieurs modalités : poids trop
faible, p oids normal, surpoids, obésité.
L’application des méthodes statistiques pour données de cohorte a permis de mettre en
évidence certaines limites liées à la base de données. D’une part, le nombre de covariables
pouvant être inclus simultanément dans la modélisation est limité par le nombre d’observa-
tions de la base de données. Ainsi, un nombre important de covariables présentes dans la
base ne sont pas utilisées. Il serait préférable de mesurer les variables les plus pertinentes
afin de simplifier la construction de la base et ainsi permettre d’inclure plus de patients dans
l’étude. D’autre part, la base ne contient aucune information sur les patients qui arrêtent
le suivi. Il serait intéressant de faire quelques efforts pour disposer de renseignements sur
ces patients afin de mieux comprendre le phénomène de censure. Cette information pourrait
aider à réduire certains biais présents dans les études de cohorte.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
152 Bibliographie
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
Bibliographie
Aalen O. O. (1978). Nonparametric inference for a family of counting processes. The
Annals of Statistics, vol. 6. pages 701–726.
Aalen O. O. et Johansen S. (1978). An empirical transition matrix for non-homogeneous
Markov chains based on censored observations. Scandinavian Journal of Statistics,
vol. 5. pages 141–150.
Aguirre-Hernandez R. et Farewell V. T. (2002). A Pearson-type goodness-of-fit test
for stationary and time-continuous Markov regression models. Stat Med, vol. 21,
n
◦
13. pages 1899–1911.
Akerman M. J., Calacanis C. M. et Madsen M. K. (2004). Relationship between
asthma severity and obesity. J Asthma, vol. 41. pages 521–526.
Alioum A. et Commenges D. (2001). MKVPCI : a computer program for Markov mo-
dels with piecewise constant intensities and covariates. Comput Methods Programs
Biomed, vol. 64, n
◦
2. pages 109–119.
ANAES (Septembre 2004), Recommandations pour le suivi médical des patients asthma-
tiques adultes et adolescents. Recommandations pour la pratique clinique de l’Agence
National d’Accréditation et d’Evaluation en Santé. URL http://www.anaes.fr.
Andersen P. K., Borgan Ø., Gill R. D. et Keiding N. (1993). Statistical models
based on counting processes. Springer-Verlag.
Andersen P. K., Hansen L. S. et Keiding N. (1991). Non- and semi-parametric
estimation of transition probabilities from censored observation of a non-homogeneous
Markov process. Scandinavian Journal of Statistics, vol. 18. pages 153–167.
Andersen P. K. et Keiding N. (2002). Multi-state models for event history analysis.
Statistical Metho ds in Medical Research, vol. 11, n
◦
2. pages 91–115.
Boudemaghe T. et Daures J.-P. (2000). Modeling asthma evolution by a multi-state
model. Rev Epidemiol Sante Publique, vol. 48, n
◦
3. pages 249–255.
Boulet L. P., Becker A. et Berube D. (1999), Canadian asthma consensus report.
Rapport technique Canadian Asthma Consensus Group CMAJ n
◦
161.
Cardot H., Ferraty F. et Sarda P. (1999). Linear Functional Model. Statistics and
Probability Letters, vol. 45. pages 11–22.
153
154 Bibliographie
Castelli C. (2004). Prise en compte de la censure informative dans le cadre d’analyse de
survie et application à l’asthme. Mémoire de DEA sous la direction du professeur
JP. Daurès, Université Montpellier II.
Chang I. C., Hsiung C. A. et Wu S. (2000). Estimation in a proportionnal hazard model
for semi-Markov counting processes. Statistica Sinica, vol. 10. pages 1257–1266.
Chen E. B. et Cook R. J. (2003). Regression modeling with recurrent events and
time-dependent interval-censored marker data. Lifetime Data Analysis, vol. 9. pages
275–291.
Chouaid C., Vergnenegre A., Vandewalle V., Liebaert F. et Khelifa A. (2004).
The costs of asthma in France : an economic analysis by a Markov model. Rev Mal
Respir, vol. 21. pages 493–499.
Cockcroft D. W. et Swystum V. A. (1996). Asthma control versus asthma severity. J
Allergy Clin Immunol, vol. 98. pages 1016–1018.
Colvert R. E. et Boardman T. J. (1999). Estimation in the piece-wise constant hazard
rate model. Comm. Statist.-Theor. Meth., vol. A5. pages 1013–1029.
Combescure C., Chanez P., Saint-Pierre P., Daurès J.-P., Proudhon H. et Go-
dard P. (2003). Assessment of variations in control of asthma over time. Eur Respir
J, vol. 22, n
◦
2. pages 298–304.
Commenges D. (1999). Multi-State Models in Epidemiology. Lifetime Data Analysis,
vol. 5. pages 315–327.
Commenges D. (2002). Inference for multi-state models from interval-censored data.
Statistical Methods in Medical Research, vol. 11, n
◦
2. pages 167–182.
Cook R. J. (1999). A mixed model for two-state Markov processes under panel observation.
Biometrics, vol. 55, n
◦
3. pages 915–920.
Cook R. J., Kalbfleisch J. D. et Yi G. Y. (2002). A generalized mover-stayer model
for panel data. Biostatistics, vol. 3, n
◦
3. pages 407–420.
Cox D. R. (1972). Regression models and life tables (with discussion). J Royal Statistical
Soc B, vol. 34. pages 187–220.
Dabrowska D. M., Sun G. et Horowitz M. M. (1994). Cox regression in a markov
renewal model : an application to the analysis of bone transplan data. Journal of the
American Statistical Association, vol. 89. pages 867–877.
de Stavola B. L. (1988). Testing departures from time homogeneity in multistate Markov
processes. Applied Statistics, vol. 37. pages 242–250.
Diggle P., Liang K. Y. et Zeger S. L. (1994). Analysis of longitudinal. Oxford
University Press.
Duchateau L., Janssen P., Kezic I. et Fortpied C. (2003). Evolution of recurrent
asthma event rate over time in frailty models. Journal of the Royal Statistical Society
Series C, vol. 52. pages 355–363.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
Bibliographie 155
Flegal K. M., Caroll M. D., Ogden C. L. et Johnson C. L. (2002). Prevalence and
trends in obesity among US adults, 1999-2000. JAMA, vol. 288. pages 1723–1727.
Foucher Y. (2004). Modèles semi-Markoviens - Place dans la gestion des maladies chro-
niques. Mémoire de DEA sous la direction du professeur JP. Daurès, Université
Montpellier II.
Foucher Y., Mathieu E., Saint-Pierre P., Durand J. et Daurès J.-P. (Octobre
2004). A semi-markov model based on generalized weibull distribution with an
illustration for hiv disease, soumis dans dans Biometrical Journal. Octobre 2004.
Gentleman R. C., Lawless J. F., Lindsey J. C. et Yan P. (1994). Multi-state
Markov models for analysing incomplete disease history data with illustrations for
HIV disease. Stat Med, vol. 13, n
◦
8. pages 805–821.
Gill R. D. (1980). Nonparametric estimation based on censored observations of a Markov
renewal process. Z. Wahrscheinlichkeitstheorie verw. Gebiete, vol. 53. pages 97–116.
Godard P., Clark T. J. et Busse W. W. (1998). Clinical assessment of patients. Eur
Respir J, vol. 26. pages 2S–5S.
Heitjan D. F. et Rubin D. B. (1991). Ignorability and coarse data. The annals of
statistics, vol. 19. pages 2244–2253.
Heutte N., Huber C. et Pons O. (2001). Semi-Markovian models appied to aids with
censoring. Statistics in Medicine, vol. 21. pages 3369–3382.
Hill C., Com-Nougué C., Kramar A., Moreau T., O’Quiegley J. et Senoussi R.
(1996). Analyse statistique des données de survie. Médecine-Science Flammarion,
seconde éd.
Hougaard P. (1995). Frailty models for survival data. Lifetime Data Analysis, vol. 1.
pages 255–273.
Hougaard P. (1999). Multi-State Models : a Review. Lifetime Data Analysis, vol. 5. pages
239–264.
Hougaard P. (2000). Analysis of multivariate survival data. Springer – Statistics for
biology and health.
Hsieh H.-J., Chen T. H.-H. et Chang S.-H. (2002). Assessing chronic disease progres-
sion using non-homogeneous exponential regression Markov models : an illustration
using a selective breast cancer screening in Taiwan. Stat Med, vol. 21. pages 3369–
3382.
Huang X. et Wolfe A. R. (2002). A fraitly model for non informative censoring. Bio-
metrics, vol. 58. pages 510–520.
Huber-Carol C. et Pons O. (Mai 2004), Independent competing risks versus a ge-
neral semi-Markov model : application to heart transplant data. Prépublication. URL
http://www.math-info.univ-paris5.fr/map5/publis/PUBLIS04/huber-2004-13.pdf.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
156 Bibliographie
Huber-Carol C. et Vonta I. (2004). Fraitly models for arbitrarily censored and truncated
data. Lifetime Data Analysis, vol. 10. pages 369–388.
Jackson C. H. (Janvier 2005), Multi-state Markov models in continuous time. Package
MSM, R Foundation for Statistical Computing. URL http://www.R-project.org.
Jain S. (1986). Markov chain model and its application. Comput Biomed Res, vol. 19.
pages 374–378.
Janssen J. (1986). In semi-markov models. Plenum Press.
Janssen J. et Limnios N. (1999). Semi-markov models and applications. Kluwer Aca-
demic Publishers.
Janssen J., Manca R. et Volpe E. (1997). Markov and semi-Markov options pricing
models with arbitrage possibility. Applied Stochastic Mo dels and Data Analysis, vol.
13, n
◦
2. pages 103–113.
Joly P., Commenges D., Helmer C. et Letenneur L. (2002). A Penalized Likelihood
Approach for an Illness-Death Model With Interval-Censored Data : Application to
Age-Specific Incidence of Dementia. Biostatistics, vol. 3. pages 433–443.
Juniper E. F., O’Byrne P. M., Guyatt G. H., Ferrie P. J. et King D. R. (1999).
Development and validation of a questionnaire to measure asthma control. Eur Respir
J, vol. 14. pages 902–907.
Kalbfleisch J. D. et Lawless J. F. (1985). The analysis of panel data under a Markov
assumption. Journal of the American Statistical Association, vol. 80. pages 863–871.
Kaplan E. L. et Meier P. (1958). Non-parametric estimation from incomplete observa-
tions. J. Amer. Statist. Assoc., vol. 53. pages 457–481.
Kay R. (1986). A Markov model for analysing cancer markers and disease states in survival
studies. Biometrics, vol. 42, n
◦
4. pages 855–865.
Korn E. L. et Whittemore A. S. (1979). Methods for analyzing panel studies of acute
health effects of air pollution. Biometrics, vol. 35, n
◦
4. pages 795–802.
Kousignian I., Autran B., Chouquet C., Calvez V. et Gomard E. e. a. (2003).
Markov modelling of changes in HIV-specific cytotoxic T-lymphocyte responses with
time in untreated HIV-1 infected patients. Stat Med, vol. 22. pages 1675–1690.
Liang K. Y. et Zeger S. L. (1986). Longitudinal analysis using generalized linear models.
Biometrika, vol. 73. pages 13–22.
Limnios N. (1997). Dependability analysis of semi-Markov systems. Reliability Enginee-
ring and System Safety, vol. 55. pages 203–207.
Lindsay J. C. et Ryan L. M. (1993). A three-state multiplicative model for rodent
tumorigenicity experiments. Applied Statistics, vol. 42. pages 283–300.
Little R. J. A. (1995). Modelling the drop-out mechanism in repeated-measures studies.
Journal of the American Statistical Association, vol. 90. pages 1112–1121.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
Bibliographie 157
Liu L., Wolfe A. R. et Huang X. (2004). Shared fraitly models for recurrent events
and a terminal event. Biometrics, vol. 60. pages 747–756.
Longini I. M. J., Clark W. S., Byers R. H., Ward J. W., Darrow W. W., Lemp
G. F. et Hethcote H. W. (1989). Statistical analysis of the stages of HIV infection
using a Markov model. Stat Med, vol. 8, n
◦
7. pages 831–843.
Marshall G. et Jones R. H. (Sep 1995). Multi-state models and diabetic retinopathy.
Stat Med, vol. 14, n
◦
18. pages 1975–1983.
Masoli M., Fabian D., Holt S. et Beasley R. (2004). The global burden of asthma :
executive summary of the GINA Dissemination Committee report. Allergy, vol. 59.
pages 469–478.
Matsuyama Y. (2003). Sensitivity analysis for the estimation of rates of change with
non-ignorable drop-out : an application to a randomized clinical trial of the vitamin
D3. Statistics in Medicine, vol. 22. pages 811–827.
Minini P. et Chavance M. (2004). Sensitive analysis of longitudinal normal data with
drop-outs. Statistics in Medicine, vol. 23. pages 1039–1054.
National Institutes of Health (1997), Expert Panel Report 2 : Guidelines for the
diagnosis and management of asthma. Rapport technique NIH 97-4051.
Nielsen G. G., Gill R. D., Andersen P. K. et Sørensen T. I. A. (1992). A counting
process approach to maximum likelihood estimation in frailty models. Scandinavian
Journal of Statistics, vol. 8. pages 25–43.
Nocedal J. et Wright S. J. (1999). Numerical optimization. Springer.
Ouhbi B. et Limnios N. (1999). Nonparametric Estimation for Semi-Markov Processes
Based on its Hazard Rate Functions. Statistical Inference for Stochastic Processes,
vol. 2, n
◦
2. pages 151–173.
Paes A. T. et de Lima A. (2004). A SAS macro for estimating transition probabilities
in semiparametric models for recurrent events. Computer Methods and Programs in
Biomedicine, vol. 75. pages 59–65.
Paltiel A. D., Fuhlbrigge A. L., Kitch B. T., Liljas B. et Weiss S. T. (2001).
Cost-effectiveness of inhaled corticosteroids in adults with mild-to-moderate asthma :
results from the asthma policy model. J Allergy Clin Immunol, vol. 108. pages 39–46.
Papadopoulou A. A. et Vassiliou P. C. (1994). Asymptotic behaviour of non homo-
geneous semi-Markov systems. Linear Algebra and Its Applications, vol. 210. pages
153–198.
Perez-Ocon R. et Ruiz-Castro J. E. (1999). Semi-markov models and applications,
chapter 14, pages 229–238. Kluwer Academic Publishers.
Perez-Ocon R. et Torres-Castro I. (2002). A reliability semi-Markov model involving
geometric processes. Applied Stochastic Models in Business and industry, vol. 16,
n
◦
2. pages 157–170.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
158 Bibliographie
Pinheiro J. C. et Bates D. M. (2000). Mixed-Effects Models in S and S-PLUS. Springer.
Price M. J. et Briggs A. H. (2002). Development of an economic model to assess the
cost effectiveness of asthma management strategies. Pharmacoeconomics, vol. 20.
pages 183–194.
Redline S., Tager I. B., Segal M. et Gold D. (1989). The relationship between
longitudinal change in pulmonary function and nonspecific airway responsiveness in
children and young adults. Am Rev Respir Dis, vol. 140. pages 179–184.
Robins J. M. (1993). Information recovery and bias adjustement in proportionnal hazards
regression analysis of randomized trials using surrogate markers. In Proceedings of
the Biopharmaceutical Section, American Statistical Association, Berlin. Springer.
pages 24–33.
Robins J. M. et Finkelstein D. M. (2000). Correcting for noncompliance and dependent
censoring in an AIDS Clinical Trial with inverse probability of censoring weighted
(IPCW) log-rank tests. Biometrics, vol. 56, n
◦
3. pages 779–788.
Robins J. M. et Rotnitzky A. (1992). Recovery of information and adjustement for
dependent censoring using surrogate markers. AIDS Epidemiology-Methodological
Issues. pages 297–331.
Rotnitzky A. et Robins J. M. (2003). Inverse probability weighted estimation in survival
analysis. The Encyclopedia of Biostatistics.
Saint-Pierre P. (2001). Modèle linéaire généralisé pour variables fonctionnelles. Mémoire
de DEA sous la direction du professeur P. Sarda, Université Toulouse III.
Saint-Pierre P., Bourdin A., Chanez P., Daurès J.-P. et Godard P. (Février
2005a). Overweighted asthmatics are more difficult to control, soumis dans Chest.
Février 2005a.
Saint-Pierre P., Castelli C. et Daurès J.-P. (Février 2005b). Informative censoring
in survival analysis and application to asthma, soumis dans Biometrical Journal.
Février 2005b.
Saint-Pierre P., Combescure C., Daurès J.-P. et Godard P. (2003). The analysis
of asthma control under a Markov assumption with use of covariates. Statistics in
Medicine, vol. 22. pages 3755–3770.
Saint-Pierre P., Daurès J.-P. et Godard P. (Septembre 2004). Implementation of
semi-parametric estimation in multi-state models, soumis dans Computer Methods
and Programs in Biomedicine. Septembre 2004.
Saint-Pierre P., Daurès J.-P. et Godard P. (2005c). The analysis of asthma using
homogeneous and non-homogeneous markov models. A paraitre dans Far East Journal
of Theorical Statistics.
Satten G. A. (1999). Estimating the extent of tracking in interval-censored chain-of-events
data. Biometrics, vol. 55, n
◦
4. pages 1228–1231.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
Bibliographie 159
Scharfstein D. O., Robins J. M., Eddings W. et Rotnitzky A. (2001). Inference in
randomized studies with informative censoring and discrete time-to-event endpoints.
Biometrics, vol. 57. pages 404–413.
Scharfstein D. O., Rotnitzky A. et Robins J. M. (1999). Adjusting for non igno-
rable drop-out using semiparametric nonresponse models. Journal of the American
Statistical Asso ciation, vol. 94, n
◦
448. pages 1096–1146.
Self S. et Liang K.-Y. (1987). Asymptotic properties of maximum likelihood estimators
and likelihood ratio tests under nonstandard conditions. Journal of the American
Statistical Asso ciation, vol. 82. pages 605–610.
Singpurwalla N. D. et Wong M. Y. (1983). Estimation of the failure rate : A sur-
vey of nonparametric methods. Part I : Non-bayesian methods. Commun. Statist.-
Theor.Meth., vol. 12, n
◦
5. pages 559–588.
Sternberg M. R. et Satten G. A. (1999). Fitting Semi-Markov Models to Interval-
Censored Data with Unknown Initiation Times. Biometrics, vol. 55. pages 507–513.
Therneau T. M. et Grambsch P. M. (2000). Modeling Survival Data : Extending the
Cox Model. Springer – Statistics for Biology and Health.
Vassiliou P. C. et Papadopoulou A. A. (1992). Non homogeneous semi-Markov sys-
tems and maintainability of the state sizes. Journal of Applied Probability, vol. 29.
pages 519–534.
Ware J. H., Lipsitz S. et Speizer F. E. (1988). Issues in the analysis of repeated
categorical outcomes. Stat Med, vol. 7, n
◦
1-2. pages 95–107.
Weisberg S., McCann D., Desai M., Rosenbaum M., Leibel R. et Ferrante A.
(2003). Obesity is associated with macrophage accumulation in adipose tissue. J Clin
Invest, vol. 112. pages 1796–1808.
Weiss S. T. et Shore S. (2004). Obesity and asthma : directions for research. Am J
Respir Crit Care Med, vol. 169. pages 963–968.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
160 Bibliographie
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
Annexe A
Théorie statistique
1 Processus aléatoires et intégrales stochastiques
Définition 10 Soit un espace probabilisé (Ω, A, P) où P est la mesure de probabilité sur
(Ω, A). Un processus aléatoire, ou encore une fonction aléatoire réelle (f.a.r.) est une
fonction à deux variables
X : T × Ω −→ R
(t, ω) 7−→ X(t, ω)
où t représente le temps et ω le hasard. Pour tout t > 0, la fonction X
t
: ω 7−→ X(t, ω)
est une variable aléatoire réelle appelée coordonnée à l’instant t. Pour tout ω ∈ Ω, la
trajectoire est la fonction t 7−→ (X(t, ω), t > 0). Si, pour presque tout ω, la trajectoire est
continue alors X(t, ω) est une f.a.r. à trajectoire continue.
Définition 11 Soit un espace probabilisé (Ω, A, P), t ∈ T . Une filtration est une famille
de tribus {F
t
: t ∈ T }, telle que
F
s
⊂ F
t
⊂ A, ∀s 6 t.
Définition 12 Soient un espace probabilisé (Ω, A, P) et F
t
une filtration. Un processus
X = X(t, ω) est dit F
t
-adapté si ∀t, X
t
est F
t
-mesurable.
Définition 13 Soit un espace probabilisé (Ω, A, P). Soit (M
t
)
t
, t ∈ T un processus réel
défini sur Ω. Soit (F
t
)
t
une filtration sur Ω.
(M
t
)
t
est une F
t
-martingale si
(i) ∀t, M
t
est F
t
-adaptée et M
t
∈ L
1
(i.e. est intégrable),
(ii) ∀s, t, 0 6 s 6 t, E(M
t
| F
s
) = M
s
p.s.
161
162 Annexe A. Théorie statistique
Définition 14 Soit un espace probabilisé (Ω, A, P) et une filtration F = (F
t
)
t∈R
+
. Un
F-processus croissant A est un processus adapté à F à valeurs réelles satisfaisant la
propriété suivante : pour tout ω ∈ Ω, les t 7−→ A
t
(ω) sont croissantes, continues à droites
et nulles en 0.
Définition 15 La tribu P de T ×Ω engendrée par les ensembles ]s, t] ×Γ, où 0 < s < t et
Γ ∈ F
s
, est la tribu des ensembles prévisibles. Une v.a. C(t, ω) définie sur (T × Ω, P)
est un processus prévisible.
Proposition 17 Soient A un processus croissant et C un processus prévisible. Alors, pour
tout t,
Z
t
0
C(s)dA(s) =
Z
t
0
C(s)A(ds), (A.1)
est une variable aléatoire.
2 Produit intégral (ou infini)
Définition 16 Soit X(t), t ∈ T , une matrice p × p de processus cadlag, nul en 0, et à
variation bornée. On obtient une mesure additive en posant
X (]s, t]) = X(t) − X(s).
Soit une partition t
0
= s < t
1
< ... < t
n
= t. Son pas est
|δ| = sup
i
|t
i
− t
i−1
|,
On appelle produit intégral (ou produit infini)
P
]s,t]
(Id + dX) = lim
|δ|→0
n
Y
i=1
[Id + X (]t
i−1
, t
i
])]
où I représente la matrice identité p × p.
Théorème 2 Soit A une matrice de fonctions de dimension k × k correspondant à une
mesure d’intensité (matrice des intensités cumulées).
Alors la matrice,
P (s, t) = P
u∈]s,t]
(Id + A (du)) , s 6 t, t, s ∈ T ,
est la matrice de probabilité de transition d’un processus de Markov à espace d’états fini
{1, . . . , k}.
Le pro cessus peut être construit de la façon suivante
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Processus de comptage 163
– Sachant que le processus est dans h au temps t
0
, il reste dans l’état h pour une durée
avec une intensité cumulée
−(A
hh
(t)) − A
hh
(t
0
)), t
0
6 t 6 inf {u > t
0
: ∆A
hh
(u) = −1}.
– Sachant qu’il quitte h au temps t, il transite vers l’état j (j 6= h) avec une probabilité
−
dA
hj
(t)
dA
hh
(t)
.
Dans le cas scalaire, où p = 1, si X est continu, le produit intégral devient l’exponentielle
P
]0,t]
(1 + dX) = exp(X(t)).
Notons que le produit intégral est introduit par Volterra (1887) comme l’unique solution
de certaines équations intégrales.
Théorème 3 Soient Z, W, des matrices k ×p de fonctions cadlag. Pour W fixée, l’unique
solution Z de l’équation
Z(t) = W(t) +
Z
t
0
Z(s−)X(ds)
est [0, t]
Z(t) = W(t) +
Z
t
0
W(s−)X(ds) P
]s,t]
(I + dX)
= W(0) P
[0,t]
(I + dX) +
Z
t
0
W(ds) P
]s,t]
(I + dX).
3 Processus de comptage
Soient (T , T) un espace mesurable, (Ω, A, P) un espace probabilisé et F
t
une filtration,
Définition 17 Soit la fonction µ (.) définie par
µ : T −→ N
t 7−→ µ (t)
est une mesure de comptage sur T si, pour chaque B ⊂ T
µ (B) ∈ N, et µ (B) < ∞ p.s.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
164 Annexe A. Théorie statistique
Définition 18 Un processus aléatoire de comptage N (.) sur T est une fonction aléa-
toire
N : T × Ω −→ N
(t, ω) 7−→ N (t, ω) ,
cadlag (continue à droite avec une limite à gauche), F
t
-adaptée, nulle en zéro, croissante et
ayant des sauts d’amplitude 1.
Proposition 18 Soit N(.) un processus de comptage. Il existe un processus Λ(.) F
t
-prévisible,
croissant, continu à droite et nul en zéro tel que
M(t) = N(t) −Λ(t), t ∈ T (A.2)
soit une martingale.
Λ(.) s’appelle le compensateur de N(.), ou encore son processus d’intensité cumulée, ou
encore sa mesure d’intensité.
Ce résultat est l’application de la décomposition de Doob à la sous-martingale lo cale
N(.).
Proposition 19 Soient N un processus comptage de dimension 1 et Λ son compensateur.
Si N est absolument continu, alors N possède une intensité λ, i.e. il existe un processus
prévisible λ tel que ∀ A ∈ T
Λ (A) =
Z
A
λ (u) du .
L’intensité λ est définie par ∀ u ∈ T
λ (u) = lim
ε→0
P (N (u + ε) − N (u) > 1 | F
u
) ,
où F
u
est la filtration naturelle engendrée par les N (s) pour s 6 u, c’est-à-dire l’ensemble
des événements observables à l’instant u,
F
u
= σ {N(s) : s 6 u}.
Définition 19 Un processus de comptage k-dimensionnel N = (N
1
, N
2
, ..., N
k
) est appelé
processus de comptage multivarié si chacune de ses composantes est un processus de
comptage univarié et s’il ne peut y avoir simultanéité des sauts de deux (ou plus) de ses
composantes.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
4. Processus ponctuel marqué 165
4 Processus ponctuel marqué
A chaque processus de comptage multivarié N, on peut associer une séquence des temps
du saut et une séquence des marques du saut renseignant sur le temps et la nature de chaque
événement. Comme il ne peut y avoir simultanéité des sauts de deux composantes de N, la
somme des composantes est un processus de comptage. En définissant,
N
.
=
k
X
h=1
N
h
,
Considérons la séquence des temps du saut
0
< T
1
6
T
2
6
T
3
6
···
et les variables aléatoires représentant les marques du saut
J
1
, J
2
, . . . ,
à valeurs dans {1, 2, . . . , k} ∪ {0} tels que pour n 6 N
.
(τ), T
n
∈ T , J
n
6= 0, T
n
> T
n−1
,
N
.
(T
n
) = n et ∆N
J
n
(T
n
) = 1.
Pour n > N
.
(τ), on fixe J
n
= 0 et T
n
= τ pour que tous soient bien définis. Les variables
T
n
sont des temps d’arrêts et de plus, J
n
est F
T
n
-mesurable.
Ces notations sont essentiellement celles d’un processus ponctuel marqué où N est consi-
déré comme une mesure de comptage sur l’espace produit : espace de temps × espace de
marques. Ainsi, chaque événement d’un processus ponctuel marqué est caractérisé par le mo-
ment de son apparition et par une marque fournissant une description de cet événement. De
manière générale, nous observons, sur un espace probabilisé (Ω, A, P), des instants aléatoires
successifs {T
n
}
n∈N
,
T
n
: Ω −→ T
ω 7−→ T
n
(ω)
A chaque instant T
n
, nous faisons une observation J
n
qui est une fonction mesurable de
(Ω, A, P) dans un espace mesurable (K, K) appelé espace de marques ou espace d’états
J
n
: Ω −→ K
ω 7−→ J
n
(ω) .
Définition 20 Un processus ponctuel marqué est une suite, finie ou dénombrable, de
variables aléatoires {Y
n
}
n∈N
de (Ω, A, P) à valeurs dans l’espace produit (T × K, T ⊗ K)
Y
n
= (T
n
, J
n
) ∈ T × K . (A.3)
La mesure de comptage associée est ∀ A × L ⊂ T ⊗ K
µ (ω, A × L) = µ
ω
L
(A) =
X
n∈N
11
[T
n
(ω)∈A, J
n
(ω)∈L]
,
avec
µ
ω
L
(A) ∈ N et µ
ω
L
(A) < ∞ p.s.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
166 Annexe A. Théorie statistique
Cette approche permet de prendre en compte différents types d’événements qui varient
de manière continue, par exemple, la mesure d’un markeur à chaque consultation. Dans le
cas particulier d’un processus de comptage multivarié, l’espace de marques est fini, K =
{1, ..., k}.
5 Vraisemblance d’un processus de comptage
Théorème 4 (Jacod) Soit un processus de comptage multivarié N = (N
1
, . . . , N
k
) sur
[0, τ]. Soient P et
˜
P deux mesures de probabilité sur deux espaces tels que N ait pour
compensateur dans chacun d’eux respectivement Λ et
˜
Λ. On suppose que
˜
P est absolument
continue par rapport à P i.e.
˜
P << P. Alors
˜
Λ
h
<< Λ
h
pour tout h, P − p.s.
et
d
˜
P
dP
=
d
˜
P
dP
¯
¯
¯
¯
¯
F
0
P
t∈[0,τ]
n
Q
h
d
˜
Λ
h
(t)
∆N
h
(t)
(1 − d
˜
Λ
.
(t))
1−∆N
.
(t)
o
P
t∈[0,τ]
©
Q
h
dΛ
h
(t)
∆N
h
(t)
(1 − dΛ
.
(t))
1−∆N
.
(t)
ª
=
d
˜
P
dP
¯
¯
¯
¯
¯
F
0
P
t∈[0,τ]
Y
h
Ã
d
˜
Λ
h
dΛ
h
(t)
!
∆N
h
(t)
P
t∈[0,τ]:∆N
.
(t)6=1
(1 − d
˜
Λ
.
(t))
P
t∈[0,τ]:∆N
.
(t)6=1
(1 − dΛ
.
(t))
.
Théorème 5 Si Λ et
˜
Λ sont sont presque sûrement continues, alors
d
˜
P
dP
=
d
˜
P
dP
¯
¯
¯
¯
¯
F
0
P
t∈[0,τ]
Q
h
d
˜
Λ
h
(t)
∆N
h
(t)
exp
h
−
˜
Λ
.
(τ)
i
P
t∈[0,τ]
Q
h
dΛ
h
(t)
∆N
h
(t)
exp [−Λ
.
(τ)]
et si Λ et
˜
Λ sont presque sûrement absolument continues, alors
d
˜
P
dP
=
d
˜
P
dP
¯
¯
¯
¯
¯
F
0
P
t∈[0,τ]
Q
h
˜
λ
h
(t)
∆N
h
(t)
exp
h
−
˜
Λ
.
(τ)
i
P
t∈[0,τ]
Q
h
λ
h
(t)
∆N
h
(t)
exp [−Λ
.
(τ)]
.
Théorème 6 La vraisemblance associée au processus N est
dP = dP|
F
0
P
t∈[0,τ]
Ã
Y
h
dΛ
h
(t)
∆N
h
(t)
(1 − dΛ
.
(t))
1−∆N
.
(t)
!
.
Si Λ est sont presque sûrement continue, alors
dP = dP|
F
0
P
t∈[0,τ]
Ã
Y
h
dΛ
h
(t)
∆N
h
(t)
exp [−Λ
.
(τ)]
!
.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
6. Vraisemblance partielle 167
Si Λ est sont presque sûrement absolument continue, alors
dP = dP|
F
0
P
t∈[0,τ]
Ã
Y
h
λ
h
(t)
∆N
h
(t)
exp [−Λ
.
(τ)]
!
.
6 Vraisemblance partielle
D’après la section précédente, la vraisemblance pour un processus de comptage N (t)
par rapp ort à la filtration naturelle F
t
= σ {N(s) : s 6 t} vaut
dP = P
t∈[0,τ]
Q
h
dΛ
h
(t)
dN
h
(t)
[1 − dΛ
.
(t)]
1−dN
.
(t)
. (A.4)
Pour introduire la notion de vraisemblance partielle, il est utile de présenter la vrai-
semblance à l’aide des processus ponctuels marqués (A.3). La vraisemblance d’un processus
N (t) par rapport à la filtration naturelle F
t
, s’écrit
P
t∈[0,τ]
Q
x∈K
Λ (dt, dx)
N(dt,dx)
| {z }
=(A)
[1 − Λ (dt, K)]
1−N(dt,K)
| {z }
=(B)
(A.5)
où
– N est le processus ponctuel marqué dans (K, K),
– Λ est le compensateur de N,
– N et Λ sont des mesures aléatoires sur (T × K , T ⊗ K).
Cette formule peut s’interpréter de la manière suivante :
– (A) représente le fait, conditionnellement à ce qui s’est passé avant t, l’événement de
marque dx se produit dans l’intervalle de temps [t, t + dt] (i.e. N (dt, dx) = 1) avec la
probabilité Λ (dt, dx).
– (B) représente le fait que, conditionnellement à ce qui s’est passé avant t, aucun
événement ne s’est produit dans l’intervalle de temps [t, t + dt] (i.e. N (dt, dK) = 0)
avec la probabilité 1 − Λ (dt, dK) .
La vraisemblance peut être reformulée sous forme de plusieurs facteurs conditionnels
afin de ne conserver que les termes qui dépendent des paramètres d’intérêt. Ce qui revient
à supprimer les termes qui dépendent d’une manière complexe ou inconnue des paramètres
de nuisance. La vraisemblance partielle ainsi obtenue sera en fait la vraisemblance complète
pour le paramètre d’intérêt.
Considérons ∅ la « marque vide » qui représente l’absence d’événement, ∅ /∈ K. Notons
de plus
K = K∪{∅}. Soit G un autre espace de marques tel que ∅ /∈ G et G = G ∪{∅}. Soit
g :
K → G une application mesurable telle que g (∅) = ∅. Considérons enfin, N
g
le processus
ponctuel marqué, appelé processus réduit, d’espace de marques G, défini par
N
g
(]0, t] × A) = N
¡
]0, t] × g
−1
(A)
¢
.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
168 Annexe A. Théorie statistique
Ainsi, lorsque N est défini par les points (T
n
, J
n
) tels que g (J
n
) 6= ∅, ceux du processus
ponctuel marqué N
g
sont définis par (T
n
, g (J
n
)). Le compensateur Λ
g
du processus marqué
N
g
est défini par
Λ
g
(]0, t] × A) = Λ
¡
]0, t] × g
−1
(A)
¢
.
La distribution conditionnelle des événements dans l’intervalle de temps [t, t + dt[ sachant
F
t−
peut être reformulée à l’aide du processus ponctuel N
g
de la manière suivante :
(1) avec la probabilité Λ
g
(dt, dy) , le processus réduit N
g
a un événement dans [t, t + dt[×dy
(i.e. N
g
(dt, dy) = 1) ou avec la probabilité 1 − Λ
g
(dt, G) , le processus réduit N
g
n’a
aucun événement dans [t, t + dt[ (i.e. N
g
(dt, G) = 0)
(2) étant donné que le processus réduit N
g
a un événement dans [t, t + dt[×dy i.e. N
g
(dt, dy) =
1, le processus N a un événement dans [t, t + dt[ × dx, pour x tel que g (x) = y, avec
la probabilité conditionnelle Λ (dt, dx) /Λ
g
(dt, dy) .
(3) sachant que le processus réduit N
g
n’a pas d’événement dans [t, t + dt[ i.e. N
g
(dt, G) =
0, le processus N a soit
a. un événement dans [t, t + dt[ ×dx pour x tel que g (x) = ∅, i.e. N (dt, dx) = 1 avec
la probabilité conditionnelle Λ (dt, dx) / [1 − Λ
g
(dt, dy)],
b. aucun événement dans [t, t + dt[ i.e. N (dt, K) = 0 avec une probabilité condition-
nelle complémentaire égale à 1 − Λ
¡
dt, g
−1
(∅)
¢
/ [1 − Λ
g
(dt, dy)].
La vraisemblance (A.5) s’exprime comme le produit intégral des distributions condi-
tionnelles des événements dans [t, t + dt[ sachant F
t−
pour tout t ∈ [0, τ ]. Combinant les
possibilités dans le même ordre que celui de leur description, la vraisemblance (A.5) peut
se réécrire sous la forme :
dP
=
P
t∈[0,τ]
·½
Q
y∈G
Λ
g
(dt, dy)
N
g
(dt,dy)
[1 − Λ
g
(dt, G)]
1−N
g
(dt,G)
¾
(A.6)
×
Q
y∈G
(
Q
x:g(x)=y
µ
Λ (dt, dx)
Λ
g
(dt, dy)
¶
N(dt,dx)
)
N
g
(dt,dy)
×
(
Q
x:g(x)=∅
µ
Λ (dt, dx)
1 − Λ
g
(dt, G)
¶
N(dt,dx)
×
Ã
1 −
Λ
¡
dt, g
−1
(∅)
¢
1 − Λ
g
(dt, G)
!
1−N(dt,K)
1−N
g
(dt,G)
L’interprétation intuitive et probabilitiste de (A.6) est la suivante :
(1) la première ligne de (A.6) a la même forme que la vraisemblance basée sur N
g
dans le
cas d’un processus adapté à sa filtration naturelle et peut donc être interprétée comme
la vraisemblance partielle basée sur N
g
en ignorant le reste de l’information basée sur
N.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
6. Vraisemblance partielle 169
(2) la deuxième ligne donne la contribution Λ (dt, dx) /Λ
g
(dt, dy) pour t, x et y = g(x),
qui correspond aux événements (en nombre fini) communs à N et N
g
. Puisque Λ
g
est
une « marginalisation » de Λ, on peut « désintégrer » Λ [restreint à F ×K\g
−1
(∅)] en
un produit de l’image Λ
g
de Λ et d’une mesure de probabilité de transition Λ (dx|t, y)
sur {x : g(x) = y}. Ainsi, on peut écrire
Λ(dt, dx) = Λ
g
(dt, dy) Λ (dx|t, y) ,
dans ce sens que l’intégrale suivant t et x du membre de gauche est égale à la triple
intégrale suivant t, y et x = g(y) du membre de droite. Intuitivement, pour y = g(x),
nous écrivons la probabilité d’avoir une marque dans dx dans la période dt, étant
donné le passé, comme la probabilité d’avoir une marque dans dy dans la période dt
connaissant le passé multiplié par la probabilité d’avoir une marque dans dx étant
donnée une marque réduite y au temps t.
(3) la troisième ligne n’intervient qu’un nombre fini de fois ; cela suggère que Λ (dt, dx) / [1 − Λ
g
(dt, G)]
peut être interprété mathématiquement comme Λ (dt, dx) ×[1 − Λ
g
({t} × G)]
−1
.
(4) la quatrième ligne intervient uniquement lorsque N n’a pas d’événement dans [t, t + dt[.
Notons que
1 −
Λ
¡
dt, g
−1
(∅)
¢
1 − Λ
g
(dt, G)
=
1 − Λ
g
(dt, G) − Λ
¡
dt, g
−1
(∅)
¢
1 − Λ
g
(dt, G)
=
1 − Λ
¡
dt, g
−1
(G)
¢
− Λ
¡
dt, g
−1
(∅)
¢
1 − Λ
g
(dt, G)
=
1 − Λ (dt, K)
1 − Λ
g
(dt, G)
.
Avec ces transformations, par le fait que
Q
y∈G
Q
x:g(x)=y
∼
Q
x:g(x)6=∅
,
que dans (2), N
g
(dt, dy) = 1, et dans (3) et (4), N
g
(dt, dy) = 0, l’expression de la vraisem-
blance devient
dP = P
t∈[0,τ]
"(
g
Q
y∈G
Λ (dt, dy)
N
g
(dt,dy)
[1 − Λ
g
(dt, G)]
1−N
g
(dt,G)
)
(A.7)
×
(
Q
x:g(x)6=∅
Λ (dx|t, g (x))
N(dt,dx)
)
×
(
Q
x:g(x)=∅
µ
Λ (dt, dx)
1 − Λ
g
({t} × G)
¶
N(dt,dx)
)
×
(
µ
1 − Λ (dt, K)
1 − Λ
g
(dt, G)
¶
1−N(dt,K)
)#
.
La première ligne de la formule (A.7) est la vraisemblance partielle basée sur N
g
et le produit
des autres lignes forme la vraisemblance partielle basée sur le reste de N.
Le cas particulier où K et G sont dénombrables et où Λ est absolument continue sur
F × K par rapport à la mesure de Lebesgue que multiplie la mesure de comptage est
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
170 Annexe A. Théorie statistique
intéressant. Dans ce cas, N est un processus de comptage dans le sens usuel (c-à-d avec un
nombre dénombrable de composantes) et N
g
est une agrégation de N. Soient λ
x
l’intensité
du processus N pour x ∈ K et λ
g
y
celle de N
g
pour y ∈ G avec
λ
g
y
(t) =
X
x:g(x)=y
λ
x
(t) .
Pour l’ensemble fini {x : g (x) = y}, la mesure de transition
Λ (dx|t, g (x)) =
Λ (dt, dx)
Λ
g
(dt, dy)
,
=
λ
x
(t)
λ
g
y
(t)
,
est une mesure de probabilité car Λ est absolument continue.
La partie atomique 1 − Λ
g
({t} × G) disparaît et la factorisation (A.7) devient :
dP ∝ P
t∈[0,τ]
Q
y∈G
λ
g
y
(t)
N
g
y
(dt)
1 −
X
y∈G
λ
g
y
(t) dt
1−
P
y∈G
N
g
y
(dt)
×
Q
x:g(x)6=∅
λ
x
(t)
λ
g
g(x)
(t)
N
x
(dt)
×
Q
x:g(x)=∅
λ
x
(t)
N
x
(dt)
"
1 −
P
x∈K
λ
x
(t) dt
1 −
P
y∈G
λ
g
y
(t) dt
#
1−
P
x∈K
N
x
(dt)
∝
Q
t,y
λ
g
y
(t)
N
g
y
(dt)
exp
−
Z
τ
0
X
y∈G
λ
g
y
(t) dt
×
Q
t,x:g(x)6=∅
λ
x
(t)
λ
g
g(x)
(t)
N
x
(dt)
×
Q
t,x:g(x)=∅
λ
x
(t)
N
x
(dt)
exp
−
Z
τ
0
X
x∈K
λ
x
(t) −
X
y∈G
λ
g
y
(t)
dt
.
On démontre facilement que cette quantité est réellement une factorisation de la vraisem-
blance totale :
dP ∝ P
t∈[0,τ]
Q
x∈K
λ
x
(t)
N
x
(dt)
Ã
1 −
X
x∈K
λ
x
(t) dt
!
1−
P
x∈K
N
x
(dt)
.
7 Processus de comptage et censure à droite
7.1 Notations et définitions
Considérons,
– les conditions initiales, X
0
= (X
i0
, i = 1, ..., n) tel que X
i
(0) = X
i0
.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
7. Processus de comptage et censure à droite 171
– N (t) le processus de comptage multivarié non censuré par rapport à F
t
= σ (X
0
) ∨
σ (N (u) , 0 6 u 6 t) est
N (t) = (N
hi
(t) , i = 1, ..., n; h = 1, ..., k) ,
où
N
hi
(t) = 11
{T
hi
6t}
avec T
hi
le temps d’apparition de l’événement h pour l’individu i.
– Y
hi
(t) qui vaut 1 si l’individu i est à risque pour l’événement h au temps t, 0 sinon.
– C (t) le processus de censure à droite,
C (t) = (C
hi
(t) , i = 1, ..., n; h = 1, ..., k) ,
avec
C
hi
(t) = I
{t6U
hi
}
,
où U
hi
est le temps de censure pour l’individu i à risque pour l’événement h.
– La filtration G
t
telle que
G
t
= F
t
∨ σ (C (u) , 0 6 u 6 t) ,
– N
c
(.) le processus de comptage censuré à droite qui représente la partie observable
de N (.) :
N
c
(t) = (N
c
hi
(t) , i = 1, ..., n; h = 1, ..., k) ,
avec
N
c
hi
(t) =
Z
t
0
C
hi
(s) dN
hi
(s) ,
– Y
c
hi
(t) tel que,
Y
c
hi
(t) = C
hi
(t) Y
hi
(t) , h = 1, . . . , k.
Afin d’obtenir la vraisemblance pour des données censurées, considérons la famille P de
mesures de probabilité sur (Ω, A),
P = {P
θφ
: (θ, φ) ∈ Θ × Φ}.
Le paramètre θ doit être interprété comme le paramètre d’intérêt définissant les intensités
de transition alors que φ est un paramètre de nuisance. Les ensembles Θ et Φ peuvent être
des espaces de dimension finie (modèle paramétrique) ou des espaces de fonctions (modèle
non-paramétrique). Supp osons que la distribution de X
0
dépend des paramètres θ et φ.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
172 Annexe A. Théorie statistique
7.2 Censure à droite indépendante
Définition 21 Soit N (.) un processus de comptage multivarié de compensateur Λ (.) par
rapport à la filtration F
t
et la probabilité P
θφ
. Soit C (.) un processus de censure à droite
prévisible par rapport à G
t
⊇ F
t
.
Alors, la censure à droite générée par C (.) est indépendante si le compensateur de N (.)
par rapport à G
t
est aussi Λ (.).
Proposition 20 Sous l’hypothèse de censure à droite indépendante, le compensateur de
N
c
(.) par rapport à (P
θφ
, G
t
) est
Λ
c
hi
(t, θ) =
Z
t
0
C
hi
(s) dΛ
hi
(s, θ) .
En effet, sous l’hypothèse de censure à droite indépendante, chaque N
hi
(t) a une dé-
composition (A.2)
N
hi
(t) = Λ
hi
(t, θ) + M
hi
(t) ,
avec M
hi
une martingale locale de carré intégrable par rapport à G
t
.
D’après (A.1),
N
c
hi
(t) =
Z
t
0
C
hi
(s) dN
hi
(s) ,
=
Z
t
0
C
hi
(s) dΛ
hi
(s, θ) +
Z
t
0
C
hi
(s) dM
hi
(s) ,
= Λ
c
hi
(t, θ) + M
c
hi
(t) .
Puisque M
hi
est une martingale locale de carré intégrable, C
hi
(.) est un processus prévi-
sible par rapport à G
t
et C
hi
est bornée alors
R
t
0
C
hi
(s) dM
hi
(s) est une martingale locale de
carré intégrable et Λ
c
hi
(t, θ) est un compensateur de N
c
hi
(t) (la décomposition est unique).
Proposition 21 Sous l’hypothèse de censure à droite indépendante, si le processus N (.) a
une intensité multiplicative par rapport à G
t
alors N
c
(.) a aussi une intensité multiplicative
par rapport à G
t
.
En effet, si
λ
hi
(t, θ) = α
hi
(t, θ) Y
hi
(t) ,
est l’intensité de N par rapport à G
t
alors
dΛ
c
hi
(t, θ) = C
hi
(t) dΛ
hi
(t, θ) ,
= C
hi
(t) α
hi
(t, θ) Y
hi
(t) ,
= α
hi
(t, θ) Y
c
hi
(t) ,
= λ
c
hi
(t, θ) .
N
c
hi
a la même intensité individuelle α
hi
(t, θ) que le processus non censuré N
hi
.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
7. Processus de comptage et censure à droite 173
Proposition 22 Sous l’hypothèse de censure à droite indépendante, si le processus N a
une intensité multiplicative par rapport à G
t
alors N
c
a aussi une intensité multiplicative
par rapp ort à F
c
t
, avec
F
c
t
= σ (X
0
, N
c
(u) , Y
c
(u) , 0 6 u 6 t) ,
et
N
c
(u) = (N
c
hi
(u) , h = 1, ..., k; i = 1, ..., n) ,
Y
c
(u) = (Y
c
hi
(u) , h = 1, ..., k; i = 1, ..., n) ,
7.3 Vraisemblance sous censure indépendante
Soit N
c
(t) le processus de comptage censuré à droite, avec censure indépendante. Les
données disponibles au temps t comprennent X
0
, N
c
(t) , 0 6 u 6 t et les temps de censure
U
i
6 t pour les individus n’ayant pas de temps d’absorption avant U
i
ce qui peut, dans le
cadre d’un modèle multiplicatif, être formalisé par
F
c
t
= σ (X
0
, N
c
(u) , Y
c
(u) , 0 6 u 6 t)
La vraisemblance sous censure indépendante est construite en suivant la démarche de
la vraisemblance partielle présentée page 167. Les observations sont représentées par un
processus ponctuel marqué N
∗
de marques de la forme x = (y, u) , avec
– y le type d’événement pour un individu (la censure n’est pas un événement), y = ∅
correspond à l’absence d’événement (« marque vide »),
– u le sous-ensemble de {1, ..., n} (ensemble des individus) des individus censurés.
Le couple (∅, ∅) est impossible car si personne n’est censuré, c’est que forcément un
événement survient. Le processus de comptage observé N
c
(correspondant au processus
réduit N
g
de la page 167) est obtenu par agrégation de N
∗
:
N
c
y
=
X
x:g(x)=y
N
∗
x
.
La fonction g définie par
g(y, u) = y,
permet, via la processus N
c
(.), de décomposer la vraisemblance en plusieurs facteurs condi-
tionnels.
La vraisemblance L
∗
(θ, φ) pour N
∗
par rapp ort à F
c
t
est
L
∗
τ
(θ, φ) = L
0
(θ, φ) P
t∈[0,τ]
P
θφ
(dN
∗
(t) |F
c
t
−
) .
La construction de la vraisemblance partielle page 167 est appliquée du processus réduit
N
c
,
L
∗
τ
(θ, φ)
=
P
t∈[0,τ]
P
θφ
(dN
c
(t) |F
c
t
−
)
|
{z }
=L
c
τ
(θ)
×
L
0
(θ, φ) P
t∈[0,τ]
P
θφ
(dN
∗
(t) |dN
c
(t) , F
c
t
−
)
|
{z }
=L
”
(θ,φ)
,
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
174 Annexe A. Théorie statistique
où L
c
τ
(θ) correspond à la vraisemblance partielle basée sur N
c
L
c
τ
(θ) = P
t∈[0,τ]
n
Q
i=1
k
Q
h=1
[dΛ
c
hi
(t, θ)]
∆N
c
hi
(t)
[1 − dΛ
c
..
(t, θ)]
1−∆N
c
..
(t)
.
et L
”
(θ, φ) correspond à la contribution de X
0
et des événements liés au processus N
∗
dans
[t, t + dt[ sachant N
c
et F
t−
.
La vraisemblance partielle avec censure a la même forme que la vraisemblance (par-
tielle) sans censure. Le fait que la forme de la vraisemblance (partielle) soit préservée par la
censure indépendante implique que les propriétés de martingales restent les mêmes. Le pro-
cessus de score
∂
∂θ
log [L
c
τ
(θ)] est une F
c
t
-martingale de la même manière que
∂
∂θ
log [L
τ
(θ)]
est F
t
-martingale dans le modèle sans censure. Ainsi, lorsque la censure est indépendante,
l’inférence et la théorie asymptotique sont toujours applicables de la même manière que
pour des données non censurées (par la structure de martingale).
7.4 Censure à droite non informative
Soit N (.) un processus de comptage multivarié,
N (t) = (N
hi
(t) , i = 1, ..., n; h = 1, ..., k) ,
sujet à une censure à droite indépendante par le processus C (t) . Les observations sont consi-
dérées comme un processus ponctuel marqué N
∗
, d’après ce qui précède la vraisemblance
pour N
∗
par rapport à F
c
t
est
L
∗
τ
(θ, φ) = L
′′
τ
(φ, θ) L
c
τ
(θ) ,
où L
c
τ
(θ) est la vraisemblance partielle basée sur le processus de comptage observé N
c
. Afin
de déterminer si L
c
τ
(θ) est la vraisemblance totale p our θ pour un φ ∈ Φ fixé, on introduit
la notion de censure non informative.
Définition 22 Si, pour chaque φ ∈ Φ fixé, la vraisemblance L
∗
τ
(θ, φ) peut s’écrire
L
∗
τ
(θ, φ) = L
′′
τ
(φ) L
c
τ
(θ)
alors la censure à droite indépendant C (.) est non informative pour θ.
La censure à droite non informative peut être interprétée de la manière suivante : si pour
chaque φ ∈ Φ et t ∈ T , l’intensité conditionnelle des individus censurés au temps t sachant
le passé juste avant t et sachant un possible événement d’interêts au temps t ne dép end pas
de θ, alors la censure est non informative pour θ.
En d’autres termes, si L
c
τ
(θ) est la vraisemblance complète pour le paramètre θ, alors
la censure est non informative.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
8. Théorème de la limite centrale 175
8 Théorème de la limite centrale
Théorème 7 (Robolledo) Si M
n
est une suite de martingales, et si
(i) hM
n
i
t
converge en probabilité vers v
t
déterministe,
(ii) ∀ε, ∃M
n,ε
suite de martingales telles qu’aucune différence M
n
−M
n,ε
n’ait une amplitude
supérieure à ε,
alors M
n
(t) a une limite M(t) de processus croissant v
t
, et M(t) est un processus gaus-
sien :
M
n
(t)
v
t
L
−→ N(0, 1).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
176 Annexe A. Théorie statistique
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
Annexe B
Programmation de l’estimateur
semi-paramétrique
Cette section fournit des explications détaillées pour une programmation de l’estimateur
semi-paramétrique dans un modèle de Markov non-homogène (cf. chapitre IV page 89). Ce
travail a été soumis, en septembre 2004, dans la revue Computers Methods and Programs in
Biomédicine (Saint-Pierre et al. [2004]).
Les notations et la méthodologie sont celles du Chapitre IV page 71. La méthode de
programmation a été testée sur le jeu de données utilisé dans Andersen et al. [1991] et
Andersen et al. [1993]. Notons que nos programmes (en language R) correspondant à ces
explications dans le cas particulier d’un modèle à trois états avec toutes les transitions
possibles, sont disponibles sur internet (stpierre31@free.fr). Notons également que tous
les programmes utilisés dans cette thèse (en langage S-P lus ou R) sont disponibles auprès
de l’auteur.
La programmation est décrite dans le cas d’un modèle semi-paramétrique avec une seule
covariable. Cep endant, les explications sont facilement généralisables à l’implémentation
d’un modèle avec plusieurs covariables. La méthodologie programmée sera brièvemment
rappelée en début de section dans le cas particulier d’une seule covariable. Considérons les
intensités de transition associées à chaque individu i,
α
hji
(t) = α
hj0
(t) exp(β
hj
Z
i
(t)) , i = 1, ..., n,
où Z
i
(t) et β
hj
sont des réels.
L’objectif est de décrire la programmation de :
– l’estimation les coefficents β
hj
de manière paramétrique en maximisant la vraisem-
blance partielle ;
– l’estimation des variances des coefficients de régression ;
– l’estimation de A
hj0
(t) =
R
t
0
α
hj0
(u)du de manière non-paramétrique par l’estimateur
de Nelson-Aalen ;
– l’estimation de la matrice des probabilités de transition P(s, t).
177
178 Annexe B. Programmation de l’estimateur semi-paramétrique
Remarque 26
–
Les estimatueurs non-paramétriques (cf. chapitre IV page 81) sont obtenus en fixant
β
hj
= 0.
– Le méthode fonctionne pour des variables qualitatives et quantitatives. Cependant,
l’utilisation de variables quantitatives est délicate car il y a un estimateur semi-paramétrique
de la matrice des probabilités de transition pour chaque valeur de la covariable.
– La méthode d’estimation reste valable pour des covariables dépendantes du temps.
L’estimation des coefficients de régression fournit des résultats interprétables ; par
contre, l’interprétation des probabilités de transition pour des covariables dépendantes
du temps est délicate : il y a un estimateur pour chaque ”histoire” de covariable.
– La programmation des estimateurs IPCW (cf. chapitre V page 109) suit la même
démarche que l’estimation semi-paramétrique. Il faut calculer les pondérations et les
inclures dans les estimateurs semi-paramétriques.
1 Données requis es pour l’estimation
1.1 Base d’entrée
Les données nécessaires pour l’utilisation du programme se présentent sous forme d’une
matrice avec 6 colonnes (dans le cas d’un modèle avec une covariable). Le nombre de lignes
est égal au nombre total de consultations présentes dans la base de données. L’information
pour un patient est donnée par au moins 2 lignes dans la base de données (1 ligne pour
chaque consultation). Les colonnes de la matrice sont :
- ID : identifiant du sujet, chaque identifiant est répété plusieur fois ;
- TEMPS0 : représente le temps d’entrée dans ETAT0. Pour la première ligne de chaque
patient, TEMPS0 vaut 0 ;
- ETAT0 : représente l’état de l’individu pendant l’intervalle de temps ]TEMPS0 ;TEMPS1] ;
- TEMPS1 : représente le temps de transition et peut être un temps d’entrée dans ETAT1
ou un temps de censure ;
- ETAT1 : représente l’état d’arrivée d’une transition de ETAT0. Pour la dernière ligne
associée à un patient, ETAT1 est soit un état absorbant soit un état de censure ;
- COVARIABLE : représente la valeur de la covariable pendant l’intervalle de temps ]TEMPS0 ;TEMPS1].
1.2 Quantités à calculer
Certaines quantités doivent être calculées afin d’obtenir les estimations.
– T emps : un vecteur donnant tous les temps de transition différents, classés par ordre
croissant . Vecteur de longueur l.
– P atient : un vecteur donnant les identifiants des patients (tous différents). Vecteur de
longueur n.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
2. Fonction de la log-vraisemblance partielle 179
– MatriceY h : une matrice renseignant sur l’état des individus pour chaque temps.
Matrice de dimension l × n, pour i = 1, ..., n, et k = 1, ..., l, MatriceY h[k, i] = 1 si
l’individu i est à risque dans l’état h au T emps[k], 0 sinon. La colonne i de MatriceY h
correspond à la quantité « Y
hi
(t) ».
– Y h : une matrice renseignant sur le nombre total d’individus à risque dans l’état h
pour chaque temps. Le vecteur Y h (longueur l) corresp ond à la quantité « Y
h+
(t) ».
– Jh : un vecteur de longueur l correspondant à la quantité « J
h
(t) ».
– MatriceNhj : une matrice renseignant sur les transitions observées de l’état h vers
l’état j. Matrice de dimension l×n, pour i = 1, ..., n, et k = 1, ..., l, MatriceNhj[k, i] =
1 si l’individu i subit une transition de l’état h vers l’état j à T emps[k], 0 sinon. La
colonne i de MatriceNhj correspond à la quantité « ∆N
hji
(t) ».
– Nhj : un vecteur renseignant sur le nombre total de transitions observées de l’état h
vers l’état j à chaque temps. Le vecteur Nhj (longueur l) correspond à la quantité «
∆N
hj+
(t) ».
– MatriceCov : un vecteur renseignant sur la valeur de la covariable à chaque temps.
Matrice de dimension l × n, pour i = 1, ..., n, et k = 1, ..., l, MatriceCov[k, i] donne
la valeur de la covariable pour l’individu i à l’instant T emps[k]. La colonne i de
MatriceCov correspond à la quantité « Z
i
(t) ».
1.3 Programmation des quantités
– MatriceY h, MatriceNhj et M atriceCov peuvent être programmées dans la même
boucle :
Initialiser les matrices à 0.
Faire une double boucle pour i = 1, ..., n, et k = 1, ..., l.
Sélectionner les lignes de la matrice d’entrée correspondant à l’individu i. Ensuite :
– pour MatriceY h : sélectionner la ligne pour laquelle TEMPS0 < T emps[k] 6
TEMPS1. A partir de ce vecteur, si l’élément ETAT0 = h alors MatriceY h[k, i] = 1
sinon MatriceY h[k, i] = 0. Si ce vecteur n’existe pas, l’individu n’est pas à risque
pour ce temps.
– pour MatriceN hj : sélectionner la ligne pour laquelle TEMPS1 = T emps[k]. A par-
tir de ce vecteur, si les éléments ETAT0 = h et ETAT1 = j alors MatriceNhj[k, i] =
1 sinon MatriceN hj[k, i] = 0. Si ce vecteur n’existe pas, il n’y a pas de transition
pour ce temps.
– pour MatriceCov : sélectionner la ligne p our laquelle TEMPS0 < T emps[k] 6
TEMPS1. A partir de ce vecteur, MatriceCov[k, i] = COVARIABLE. Quand ce
vecteur n’existe pas, la valeur de la covariable n’est pas nécessaire.
– Y h et Nhj sont obtenus en faisant la somme des colonnes de MatriceY h et MatriceNhj,
respectivement.
2 Fonction de la log-vraisemblance partielle
Afin d’obtenir l’estimation des coefficients de régression, il faut maximiser le logarithme
de la vraisemblance partielle. Pour un mo dèle avec une seule covariable :
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
180 Annexe B. Programmation de l’estimateur semi-paramétrique
LogV rais =
X
h,j=1,...,s
n
X
i=1
Z
τ
0
β
hj
Z
i
(t)dN
hji
(t)
|
{z }
−
Z
τ
0
log(S
(0)
hj
(β, t))dN
hj+
(t)
|
{z }
,
= F
1
= F
2
avec
S
(0)
hj
(β, t) =
n
X
i=1
Y
hi
(t) exp(β
hj
Z
i
(t)).
Définissons betahj un nombre réel. Afin de maximiser la vraisemblance, l’utilisateur doit
programmer une fonction qui reçoit en entrée un vecteur de paramètres et renvoie en sortie
la valeur de la log-vraisemblance.
1. Calcul de S
(0)
hj
(β, t) =
P
n
i=1
Y
hi
(t) exp(β
hj
Z
i
(t)) :
– Considérer Shj
(0)
un vecteur de longueur l (la valeur de Shj
(0)
sera renseignée pour
tous les temps de transition).
– Définir MatriceCalcul une matrice avec l lignes (nombre de temps de transition
différents) et n colonnes (nombre d’individus).
for (i = 1, ..., n),
MatriceCalcul[, i] = MatriceY h[, i] × exp(betahj × MatriceCov[, i])
Pour calculer Shj
(0)
, il faut calculer la somme des colonnes de MatriceCalcul (per-
met de calculer
P
n
i=1
).
2. Calcul de F
2
=
R
τ
0
log(S
(0)
hj
(β, t))dN
hj
(t) :
– Considérer F
2
un réel.
– Soit V ecteurCalcul un vecteur de longueur l,
V ecteurCalcul = log(Shj
(0)
) × N hj,
Le processus de comptage N
hj.
(t) est une fonction en escalier, ainsi,
R
τ
0
est une
somme finie des contributions à chaque temps. Pour obtenir F
2
, il faut calculer la
somme de chaque coordonnée de V ecteurCalcul.
3. Calcul de F
1
=
P
n
i=1
R
τ
0
β
hj
Z
i
(t)dN
hji
(t) :
– Considérer F
1
un réel.
– Définir MatriceCalcul une matrice avec l lignes et n colonnes,
for (i = 1, ..., n),
MatriceCalcul[, i] = MatriceNhj[, i] ×exp(betahj × MatriceCov[, i])
Pour calculer F
1
il faut calculer la somme de chaque élément de la matrice (pour le
calcul de
P
n
i=1
et
R
τ
0
)
4. Minimisation de −LogV rais :
– La contribution à la vraisemblance pour betahj est la somme de F
1
et F
2
. La vrai-
semblance totale est la somme de toutes les contributions pour h, j = 1, ..., s, h 6= j.
– Les paramètres initiaux sont fixés à 0 (aucun effet de la covariable).
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Ecart-types des coefficients de régression 181
– La fonction ”nlminb” de Splus ou la fonction ”optim” de R peuvent être utilisées
pour minimiser −LogV rais. La fonction ”optim” de R fournit la matrice hessienne et
permet ainsi d’obtenir les écart-types. Cependant, les écart-types peuvent également
être programmés (cf. section suivante).
Remarque 27 Dans ce cas simple, la log-vraisemblance peut être maximisée séparément
(car la log-vraisemblance est une somme de plusieurs termes où chaque terme comprend un
seul paramètre à estimer). Ainsi, il suffit de calculer F
1
et F
2
pour un couple h, j fixé, et de
maximiser la somme pour obtenir la valeur du coefficient β
hj
.
3 Ecart-types des coefficients de régression
3.1 Méthodologie pour une covariable
LogV rais =
X
h,j=1,...,s
n
X
i=1
Z
τ
0
h
β
hj
Z
i
(t) − log(S
(0)
hj
(β, t))
i
dN
hji
(t).
Hessienne =
∂
2
LogV rais
∂β
11
∂β
11
···
∂
2
LogV rais
∂β
11
∂β
ss
.
.
.
.
.
.
.
.
.
∂
2
LogV rais
∂β
ss
∂β
11
···
∂
2
LogV rais
∂β
ss
∂β
ss
.
Dans la dérivée de la log-vraisemblance par rapp ort à β
hj
, la somme
X
h,j=1,...,s
disparaît car
seul le terme avec β
hj
est différent de 0.
∂LogV rais
∂β
hj
=
n
X
i=1
Z
τ
0
Z
i
(t) −
S
(1)
hj
(β, t)
S
(0)
hj
(β, t)
dN
hji
(t),
avec
S
(1)
hj
(β, t) =
∂S
(0)
hj
(β, t)
∂β
hj
=
n
X
i=1
Y
hi
(t)Z
i
(t) exp(β
hj
Z
i
(t)).
Les dérivées secondes sont,
∂
2
LogV rais
∂β
hj
∂β
uv
= 0,
∂
2
LogV rais
∂β
hj
∂β
hj
=
n
X
i=1
Z
τ
0
−
S
(2)
hj
(β, t)S
(0)
hj
(β, t) −
³
S
(1)
hj
(β, t)
´
2
³
S
(0)
hj
(β, t)
´
2
dN
hji
(t),
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
182 Annexe B. Programmation de l’estimateur semi-paramétrique
avec
S
(2)
hj
(β, t) =
∂
2
S
(0)
hj
(β, t)
∂β
hj
∂β
hj
=
∂S
(1)
hj
(β, t)
∂β
hj
=
n
X
i=1
Y
hi
(t) (Z
i
(t))
2
exp(β
hj
Z
i
(t)).
La dérivée seconde de la log-vraisemblance par rapport à β
hj
peut aussi s’écrire comme suit
(car le terme sous l’intégrale ne dépend pas de i) :
∂
2
LogV rais
∂β
hj
∂β
hj
= −
Z
τ
0
S
(2)
hj
(β, t)S
(0)
hj
(β, t) −
³
S
(1)
hj
(β, t)
´
2
³
S
(0)
hj
(β, t)
´
2
dN
hj
(t).
La matrice de variance-covariance est égale à moins l’inverse de la matrice hessienne.
Comme les termes qui ne sont pas sur la diagonale sont nuls, la variance des béta est donnée
par (inverse d’une matrice diagonale) :
V ar(β
hj
) = −
1
∂
2
LogV rais
∂β
hj
∂β
hj
.
3.2 Programmation pour une covariable
Soit
\
betahj l’estimateur du maximum de vraisemblance de betahj.
1. Calcul de S
(0)
hj
(
ˆ
β, t), S
(1)
hj
(
ˆ
β, t), S
(2)
hj
(
ˆ
β, t) :
S
(0)
hj
(
ˆ
β, t) =
n
X
i=1
Y
hi
(t) exp(
ˆ
β
hj
Z
i
(t)),
S
(1)
hj
(
ˆ
β, t) =
n
X
i=1
Y
hi
(t)Z
i
(t) exp(
ˆ
β
hj
Z
i
(t)),
S
(2)
hj
(
ˆ
β, t) =
n
X
i=1
Y
hi
(t) (Z
i
(t))
2
exp(
ˆ
β
hj
Z
i
(t)).
Soit MatriceCalcul une matrice avec l lignes et n colonnes
Shj
(0)
, Shj
(1)
, Shj
(2)
sont des vecteurs de longueur l.
– Shj
(0)
:
for (i = 1, ..., n)
MatriceCalcul[, i] = MatriceY h[, i] × exp(
\
betahj × M atriceCov[, i])
Shj
(0)
est la somme des colonnes de MatriceCalcul.
– Shj
(1)
:
for (i = 1, ..., n)
MatriceCalcul[, i] = MatriceY h[, i]×M atriceCov[, i]×exp(
\
betahj×MatriceCov[, i])
Shj
(1)
est la somme des colonnes de MatriceCalcul.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
3. Ecart-types des coefficients de régression 183
– Shj
(2)
:
for (i = 1, ..., n),
MatriceCalcul[, i] = MatriceY h[, i] × (MatriceCovariable[, i])
2
×exp(
\
betahj ×
MatriceCovariable[, i])
Shj
(2)
est la somme des colonnes de MatriceCalcul.
2. Calcul de
∂
2
LogV rais
∂
ˆ
β
hj
∂
ˆ
β
hj
:
Soit V ecteurCalcul un vecteur de longueur l,
V ecteurCalcul = −
h
Shj
(2)
Shj
(0)
−
(
Shj
(1)
)
2
i
(Shj
(0)
)
2
× Nhj, avec la convention 0/0 = 0.
∂
2
LogV rais
∂
ˆ
β
hj
∂
ˆ
β
hj
est la somme des coordonnées du vecteur V ecteurCalcul.
3. Calcul des écart type :
Soit sd(
ˆ
β
hj
) l’écart type de
\
betahj
sd(
ˆ
β
hj
) =
r
−
1
∂
2
LogV rais
∂β
hj
∂β
hj
3.3 Méthodologie pour deux covariables
Dans le cas de plusieurs covariables, la matrice hessienne n’est plus une matrice diago-
nale. Il faut calculer toutes les composantes de la matrice hessienne afin de l’inverser pour
obtenir la matrice de variance-covariance.
LogV rais =
X
h,j=1,...,s
n
X
i=1
Z
τ
0
£
(β
hj
Z
1
i
(t) + α
hj
Z
2
i
(t)) − log(S
hj
(β, t))
¤
dN
hji
(t),
S
(0)
hj
(t) =
n
X
i=1
Y
hi
(t) exp(β
hj
Z
1
i
(t) + α
hj
Z
2
i
(t)),
Dans la dérivée de la log-vraisemblance par rapport à β
hj
ou α
hj
la somme
X
h,j=1,...,s
disparait.
∂LogV rais
∂β
hj
=
n
X
i=1
Z
τ
0
Z
1
i
(t) −
∂
β
hj
S
(0)
hj
(t)
S
(0)
hj
(t)
dN
hji
(t),
∂LogV rais
∂α
hj
=
n
X
i=1
Z
τ
0
Z
2
i
(t) −
∂
α
hj
S
(0)
hj
(t)
S
(0)
hj
(t)
dN
hji
(t),
avec
∂
β
hj
S
(0)
hj
(t) =
∂S
(0)
hj
(β, t)
∂β
hj
=
n
X
i=1
Y
hi
(t)Z
1
i
(t) exp(β
hj
Z
1
i
(t) + α
hj
Z
2
i
(t)),
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
184 Annexe B. Programmation de l’estimateur semi-paramétrique
∂
α
hj
S
(0)
hj
(t) =
∂S
(0)
hj
(β, t)
∂α
hj
=
n
X
i=1
Y
hi
(t)Z
2
i
(t) exp(β
hj
Z
1
i
(t) + α
hj
Z
2
i
(t)).
Les termes différents de zéro dans la matrice hessienne sont ∀h, j = 1, ..., s
∂
2
LogV rais
∂β
hj
∂β
hj
=
n
X
i=1
Z
τ
0
−
∂
2
β
hj
β
hj
S
(0)
hj
(t)S
(0)
hj
(t) −
³
∂
β
hj
S
(0)
hj
(t)
´
2
³
S
(0)
hj
(t)
´
2
dN
hji
(t),
∂
2
LogV rais
∂α
hj
∂α
hj
=
n
X
i=1
Z
τ
0
−
∂
2
α
hj
α
hj
S
(0)
hj
(t)S
(0)
hj
(t) −
³
∂
α
hj
S
(0)
hj
(t)
´
2
³
S
(0)
hj
(t)
´
2
dN
hji
(t),
∂
2
LogV rais
∂β
hj
∂α
hj
=
∂
2
LogV rais
∂α
hj
∂β
hj
=
n
X
i=1
Z
τ
0
−
∂
2
α
hj
β
hj
S
(0)
hj
(t)S
(0)
hj
(t) − ∂
α
hj
S
(0)
hj
(t)∂
β
hj
S
(0)
hj
(t)
³
S
(0)
hj
(t)
´
2
dN
hji
(t).
Avec
∂
2
β
hj
β
hj
S
(0)
hj
(t) =
n
X
i=1
Y
hi
(t)
¡
Z
1
i
(t)
¢
2
exp(β
hj
Z
1
i
(t) + α
hj
Z
2
i
(t)),
∂
2
α
hj
α
hj
S
(0)
hj
(t) =
n
X
i=1
Y
hi
(t)
¡
Z
2
i
(t)
¢
2
exp(β
hj
Z
1
i
(t) + α
hj
Z
2
i
(t)),
∂
2
β
hj
α
hj
S
(0)
hj
(t) == ∂
2
α
hj
β
hj
S
(0)
hj
(t) =
n
X
i=1
Y
hi
(t)Z
1
i
(t)Z
2
i
(t) exp(β
hj
Z
1
i
(t) + α
hj
Z
2
i
(t)).
La matrice de variance-covariance est égale à moins l’inverse de la matrice hessienne.
3.4 Programmation pour deux covariables
La programmation des écart-types pour un modèle avec deux covariables se fait en
suivant la démarche de la programmation pour une covariable.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
4. Estimateur de Nelson-Aalen 185
4 Estimateur de Nelson-Aalen
L’estimateur de Nelson-Aalen du risque de base est,
ˆ
A
hj0
(t;
ˆ
β
hj
) =
Z
t
0
J
h
(u)
P
n
i=1
Y
hi
(u) exp(
ˆ
β
hj
Z
i
(u))
dN
hj+
(u), h 6= j,
– Calculer le vecteur Shj
(0)
(
\
betahj) de longueur l comme précédemment (valeur de
Shj
(0)
pour les valeurs de betahj qui maximise la vraisemblance partielle).
– Soit V ecteurCalcul un vecteur de longueur l,
V ecteurCalcul =
Jh
Shj
(0)
(
\
betahj)
× Nhj, avec la convention 0/0 = 0.
– Programmer le vecteur Ahj0 de longueur l,
for (k = 1, ..., l),
Ahj0[k] =
P
k
u=1
V ecteurCalcul[u] (la somme des k premières coordonnées du
vecteur V ecteurCalcul permet de calculer
R
t
0
).
5 Estimateur des probabilités de transition
La matrice des probabilités de transition est définie par
ˆ
P(s, t | Z
i
(t)) =
Y
]s,t]
(I + d
ˆ
A(u | Z
i
(t))),
d
ˆ
A
hj
(t | Z
i
(t)) =
J
h
(t)
S
(0)
hj
(
ˆ
β
hj
, t)
× ∆N
hj.
(t) × exp(
ˆ
β
hj
Z
i
(t)), h 6= j,
d
ˆ
A
hh
(t | Z
i
(t)) = −
X
j6=h
d
ˆ
A
hj
(t | Z
i
(t)), h = 1, ..., s,
avec
I + d
ˆ
A =
1 −
P
j6=1
d
ˆ
A
1j
d
ˆ
A
12
··· d
ˆ
A
1s
d
ˆ
A
21
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
d
ˆ
A
s−1s
d
ˆ
A
s1
··· d
ˆ
A
ss−1
1 −
P
j6=s
d
ˆ
A
sj
.
– calcul de d
ˆ
A(u | Z
i
(t)) (associé à l’individu i) :
Définir un tableau dA de dimension s ×s ×l (s nombre d’états et l nombre de temps
d’événements) et calculer :
dA[h, j, ] =
Jh
Shj
(0)
(
\
betahj)
× Nhj × exp(
\
betahj × M atriceCov[, i]) ∀h 6= j,
dA[h, h, ] = −
P
j6=h
dA[h, j, ].
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
186 Annexe B. Programmation de l’estimateur semi-paramétrique
– calcul de
ˆ
P(0, t | Z
i
(t)) :
Définir un tableau P de dimension s ×s ×l, la (s ×s)-matrice identité I et calculer :
P [, , 1] = I + dA[, , 1],
P [, , k] = P[, , k − 1]% × %(I + dA[, , k]), k = 2, ..., l, où % × % est la multiplication
matricielle.
Remarque 28 La probabilité P(0, t) est souvent utilisée pour l’interprétation des résultats.
p
hj
(0, t) représente le probabilité d’être dans l’état h à l’instant 0 et dans l’état j à l’instant
t.
6 Test de l’hypothèse de proportionnalité des risques
L’hypothèse de proportionnalité des risques peut être testée par l’intermédiaire d’une
covariable artificielle en suivant la démarche présentée au chapitre IV page 96. La méthode
d’implémentation présentée précédemment doit être adaptée au cas de deux covariables afin
de tester l’effet de la covariable artificielle. La programmation de la covariable artificielle
dépendante du temps suit la démarche permettant la programmation de MatriceCov.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
Annexe C
Définition des états de contrôle
L’état de contrôle est défini à partir de plusieurs variables de la base de données. Chaque
variable présentée ci-dessous permet d’attribuer un état de santé à un patient à chaque
consultation. L’état de santé finalement choisi sera le maximum des états obtenus avec les
critères pris en compte. Cet état sera appelé état de contrôle. L’état optimal est symbolisé
par l’état 1, l’état sous-optimal par l’état 2 et l’état inacceptable par l’état 3.
Définition des exacerbations
Les variables se rapportant aux exacerbations sont les variables E-Type (nature des
épisodes) et E-corticoïde (consommation ou non de corticoïdes).
Les mo dalités de la variable E-Type sont :
– aucun
– instabilité
– attaque
– crise_grave_hôpital
– crise_grave_maison
– crise_grave_réa
Les mo dalités de la variable E-corticoïde sont :
– FALSE
– TRUE
Les patients sont classés dans les états de la manière suivante :
◮ si E-Type est codée « crise_grave_··· » et E-corticoïde est codée « TRUE », alors ce
patient est classé dans l’état 3 ;
◮ si E-Type est codée « crise_grave_··· » et E-corticoïde est codée « FALSE », alors ce
patient est classé dans l’état 2 ;
◮ Dans tous les autres cas, le patient est classé dans l’état 1.
Consommation de beta2 associée à la présence de symptômes
187
188 Annexe C. Définition des états de contrôle
Les variables entree_beta2_spray_dose et entree_beta2_spray_unite renseignent sur
la quantité de béta2 consommée. La présence de symptôme est renseignée par la variable
crise_frequence_recent.
La variable entree_beta2_spray_dose est quantitative (elle varie de 0 à 30).
Les mo dalités de la variable entree_beta2_spray_unite sont :
– bouffées/semaine
– bouffées/jour
Les mo dalités de la variable crise_frequence_recent sont :
– absente
– une_par_mois
– moins_une_par_semaine
– une_par_semaine
– plusieurs_par_semaine
– une_par_jour
– plusieurs_par_jour
Les patients sont classés dans les états de la manière suivante :
◮ si la quantité de béta2 consommée est supérieure (ou égale) à 1 bouffée par jour et si la
fréquence des crises est supérieure (ou égale) à 1 par jour, alors le patient est classé
dans l’état 3 ;
◮ si le patient ne vérifie pas les conditions pour être classé dans l’état 3 et si la quantité de
béta2 consommée est supérieure (ou égale) à 1 bouffée par semaine et si la fréquence
des crise est supérieure (ou égale) à 1 par semaine, alors le patient est classé dans
l’état 2 ;
◮ dans tous les autres cas (la quantité de béta2 consommée est inférieure à 1 bouffée par
semaine ou si la fréquence des crise est inférieure (ou égale) à 1 par semaine), le patient
est classé dans l’ état 1.
VEMS mesuré (Volume Maximal Expiré en une Seconde)
La variable correspondante à ce critère est : VEMS_basal_rapport. Elle indique le rap-
port du VEMS mesuré sur le VEMS théorique. Une baisse de plus de 30% du VEMS mesuré
par rapport au VEMS maximal mesuré chez un patient amène à classer ce patient dans
l’état 3, une chute comprise entre 10 et 30% dans l’état 2 , et sinon le patient est classé
dans l’état 1.
Autrement dit :
◮ VEMS_basal_rapport < 70% correspond à l’état 3 ;
◮ 70% < VEMS_basal_rapport < 90% correspond à l’état 2 ;
◮ VEMS_basal_rapport > 90% correspond à l’état 1.
Dyspnée
Les variables correspondant à ce critère sont les variables Dyspnee_effort_recent et
Dyspnee_intercritique_recent.
Les mo dalités de la variable Dyspnee_effort_recent sont :
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
189
– absent
– effort_violent
– pas_rapide
– propre_pas
– moindre_effort
Les mo dalités de la variable Dyspnee_intercritique_recent sont :
– TRUE
– FALSE
Les patients sont classés dans les états de la manière suivante :
◮ si la variable Dyspnee_intercritique_recent est codée « TRUE », alors le patient est classé
dans l’état 3 ;
◮ lorsque la variable Dyspnee_intercritique_recent est codée « FALSE » :
− si la variable Dyspnee_effort_recent est codée « moindre_effort » ou « propre_pas
», alors le patient est classé dans l’état 3 ;
− si la variable Dyspnee_effort_recent est codée « pas rapide », alors le patient est
classé dans l’état 2 ;
− si la variable Dyspnee_effort_recent est codée « effort_violent » ou « absent »,
alors le patient est classé dans l’état 1.
MODÈLES MULTI-ÉTATS DE TYPE MARKOVIEN
Résumé
Dans de nombreux domaines, décrire l’évolution des phénomènes dans le temps est d’un intérêt
capital, en particulier pour aborder les problématiques de la prédiction et de la recherche de fac-
teurs causaux. En épidémiologie, on dispose de données de cohorte qui renseignent sur un groupe
de patients suivis dans le temps. Les modèles multi-états de type Markovien proposent un outil in-
téressant qui permet d’étudier l’évolution d’un patient à travers les différents stades d’une maladie.
Dans ce manuscript, nous rappelons tout d’abord la méthodologie relative au modèle de Markov
homogène. Ce modèle est le moins complexe, il suppose que les intensités de transition entre les états
sont constantes dans le temps. Dans un second temps, nous étudions un modèle semi-Markovien
homogène qui suppose que les intensités de transition dépendent du temps écoulé dans un état de
santé. La théorie des processus de comptage est ensuite présentée afin d’introduire des méthodes
d’estimations non-paramétriques dans le cadre d’un modèle de Markov non-homogène. Dans ce mo-
dèle, les intensités de transition dépendent du temps depuis l’inclusion dans l’étude. Les méthodes
d’estimation supposent que le mécanisme de censure n’apporte aucune information sur l’évolution
de la maladie. Cette hypothèse étant rarement vérifiée en pratique, nous prop osons une méthode
d’estimation permettant de prendre en compte une censure informative. Nous présentons également
une méthode de programmation visant à faciliter la mise en oeuvre des estimateurs basés sur les
processus de comptage. Toute ces méthodes sont appliquées afin d’étudier une base de données
de patients asthmatiques. L’objectif est d’aider les cliniciens à mieux comprendre l’évolution de la
maladie. Les résultats permettent de mettre en évidence l’impact négatif du surp oids sur l’évolution
de l’asthme.
Mots-clés : Asthme, modèles multi-états, processus de Markov homogène et non-homogène, proces-
sus semi-Markovien, processus de comptage, censure informative.
Abstract
In many fields, describe the evolution of the phenomena in time is of a capital interest, in particular to
approach the problems of prediction and research for causal factors. In epidemiology, one has cohort
data which inform about a group of patients followed in time. The multi-states Markov type models
propose an interesting tool which makes it possible to study the evolution of a patient through
the various stages of a disease. First of all, we recall the methodology relating to the homogeneous
Markov model. This model is the least complex, it supposes that the intensities of transition between
the states are constant in time. In the second time, we study a homogeneous semi-Markov model
which supposes that the transition intensities depend on the time spend in the health state. The
theory of counting processes is then presented in order to introduce a non-parametric estimation
methods within the framework of a non-homogeneous Markov model. In this model, the transition
intensities depend on time since inclusion in the study. Most of the estimation methods suppose
that the mechanism of censoring does not bring any information on the evolution of the disease.
This assumption seldom being checked in practice, we propose an estimation method allowing to
take into account an informative censoring. We also present a programmation guideline aiming to
facilitate the implementation of the estimators based on counting processes. These methods are
applied in order to study a data base of asthmatic patients. The objective is to help the clinicians
with a better understanding of the disease evolution. The results make it possible to highlight the
negative impact of overweight on the asthma evolution.
Keyword : Asthma, multi-states models, homogeneous and non-homogeneous Markov process, semi-
Markov process, counting process, informative censoring.