
Michael BückerFH Münster · Faculty of Business Administration
Michael Bücker
Professor
About
15
Publications
1,195
Reads
How we measure 'reads'
A 'read' is counted each time someone views a publication summary (such as the title, abstract, and list of authors), clicks on a figure, or views or downloads the full-text. Learn more
61
Citations
Introduction
Featured research
Statistische Modelle zur Prognose von Kreditausfällen vernachlässigen in der Regel die Beobachtungen
derjenigen Kunden, denen erst gar kein Kredit gewährt wurde. Denn für diese
abgelehnten Kreditnehmer ist schließlich die Zielgröße unbekannt, das heißt die Bank hat üblicherweise
keine Information über die Zahlungsmoral dieser Antragsteller im Falle einer Zusage.
Die Vernachlässigung beeinflusst die Schätzung solcher Modelle nicht, solange die fehlenden
Daten „missing at random” (MAR) sind, das bedeutet, falls die Ausfallwahrscheinlichkeit bei
gegebenen Kovariablen für akzeptierte und abgelehnte Kunden dieselbe ist. In der Praxis ist
diese Annahme dann sinnvoll, wenn der Kreditgeber seine Vergabeentscheidung einzig auf Basis
eines statistischen Modells trifft.
Allerdings ist ein solches Vorgehen in Deutschland nicht legitim. Das Bundesdatenschutzgesetz
untersagt die rein automatisierte Gewährung von Krediten, ohne dass eine Person in den
Entscheidungsprozess einbezogen wird. Das kann zur Folge haben, dass bei zwei Kunden mit
ansonsten identischen Ausprägungen aller Prädiktoren dem einen ein Kredit gewährt wird, dem
zweiten jedoch nicht. Anders ausgedrückt ist die Wahrscheinlichkeit für die Bewilligung eines
Kredits bei gegebenen Regressoren nicht identisch mit derWahrscheinlichkeit bei gegebenen Regressoren
und dem Wissen über die eventuelle spätere Rückzahlung, falls die Beurteilung durch
einen Bankangestellten zusätzliche Information über letztere liefert. Dann sind die fehlenden
Beobachtungen nicht-ignorierbar fehlend oder „missing not at random” (MNAR).
Die vorliegende Arbeit schlägt einen neuen Ansatz zur Bewältigung der oben beschriebenen
„Reject Inference” vor. Er basiert auf Qin, Leung und Shao (2002), die bei Vorliegen nichtignorierbar
fehlender Daten die vorliegenden Beobachtungen so gewichten, dass sie deren Erwartungswert
konsistent schätzen können. Dazu verwenden sie ein parametrisches Modell für
das Fehlen und nutzen zudem die Theorie der Empirischen Likelihood. In statistischen Modellen
wie Generalisierten Linearen Modellen liefert dieselbe Gewichtung der Likelihood unter nicht
allzu restriktiven Annahmen konsistente und asymptotisch normalverteilte Parameterschätzer.
Damit können Logistische Regressionsmodelle im Kreditscoring unverzerrt geschätzt werden,
auch wenn Vergabeentscheidung und Kreditausfall bei gegebenen Regressoren korrelieren.
Mit Hilfe eines Hausman-Test lässt sich die Hypothese des nicht-ignorierbaren Fehlens untersuchen.
In Simulationen erweist sich die vorgeschlagene Testprozedur als zuverlässig. Eine
Anwendung auf Daten von fast zehntausend Privatkunden einer großen deutschen Bank zeigt,
dass das neue Schätzverfahren zu signifikant unterschiedlichen Parameterschätzungen gegenüber
konventionellen Methoden führt, sowohl im ökonomischen als auch im statistischen Sinne.
Zahlreiche weitere Anwendungsmöglichkeiten des neuen Schätzers sind denkbar, da fehlende
Daten in der Praxis immer wieder auftreten und die Ursache dafür oft unbekannt ist
Publications
Publications (14)
Statistische Modelle zur Prognose von Kreditausfällen vernachlässigen in der Regel die Beobachtungen
derjenigen Kunden, denen erst gar kein Kredit gewährt wurde. Denn für diese
abgelehnten Kreditnehmer ist schließlich die Zielgröße unbekannt, das heißt die Bank hat üblicherweise
keine Information über die Zahlungsmoral dieser Antragsteller im Falle...
A major requirement for credit scoring models is to provide a maximally accurate risk prediction. Additionally, regulators demand these models to be transparent and auditable. Thus, in credit scoring, very simple predictive models such as logistic regression or decision trees are still widely used and the superior predictive power of modern machine...
A major requirement for credit scoring models is to provide a maximally accurate risk prediction. Additionally, regulators demand these models to be transparent and auditable. Thus, in credit scoring, very simple predictive models such as logistic regression or decision trees are still widely used and the superior predictive power of modern machine...
We generalize an empirical likelihood approach to deal with missing data to a model of consumer credit scoring. An application to recent consumer credit data shows that our procedure yields parameter estimates which are significantly different (both statistically and economically) from the case where customers who were refused credit are ignored. T...
Using an empirical likelihood approach, we show that generalized linear models can still be consistently estimated even if dependent variables are not missing at random, and derive a Hausman test by comparing this estimator to the standard one.
We generalize an empirical likelihood approach to missing data to the case of consumer credit scoring and provide a Hausman test for nonignorability of the missings. An application to recent consumer credit data shows that our model yields parameter estimates which are significantly different (both statistically and economically) from the case wher...
Die statistische Qualität von Kreditausfallprognosen lässt sich auf verschiedene Weise messen und vergleichen. Der vorliegende
Übersichtsartikel fasst die in der Literatur gemachten Vorschläge zusammen und diskutiert deren Eignung für Kreditausfallprognosen
im Privatkundengeschäft. Es zeigt sich, dass nicht alle Qualitätskriterien hier gleichermaße...
We generalize an empirical likelihood approach to missing data to the case of consumer credit scoring and provide a Hausman test for nonignorability of the missings.
An application to recent consumer credit data shows that our model yields parameter
estimates which are significantly different (both statistically and economically)
from the case wher...
“Global” classifiers may fail to distinguish classes adequately in discrimination problems with inhomogeneous groups. Instead,
local methods that consider latent subclasses can be adopted in this case. Three different models for local discrimination
of categorical variables are presented in this work. They are based on Latent Class Models, which re...
Die statistische Qualität von Kreditausfallprognosen läßt sich auf unterschiedliche Art und Weise messen und vergleichen. Die vorliegende Arbeit faßt die in der Literatur gemachten Vorschläge zusammen und diskutiert deren Eignung für das Alltagsgeschäft von Kreditausfallprognosen im Privatkundenbereich. Es zeigt sich, daß nicht alle Qualitätskriter...