ThesisPDF Available

Computergestützte Bildrekonstruktion auf Basis FTIR- mikrospektrometrischer Daten humaner Tumoren

Authors:

Abstract and Figures

FT-IR Microspectroscopic maps of unstained thin sections from human melanoma and colon carcinoma tissues were obtained on a conventional infrared microscope equipped with an automatic xy stage. Mapped infrared data were analyzed by different image re-assembling techniques, namely functional group mapping ("chemical mapping", CM) and, for the first time by cluster analysis (CA), principal component analysis (PCA) and artificial neural networks (ANN). The output values of the different classifiers were recombined with the original spatial information to construct IR-images whose color or gray tones were based on the spatial distribution of individual spectral patterns. While the functional group mapping technique could not reliably differentiate between the different tissue regions, the approach based on pattern recognition yielded images with a high contrast that confirmed standard histopathological techniques. The new technique turned out to be particularly helpful to improve discrimination between different types of tissue structures in general, and to increase image contrast between normal and cancerous regions of a given tissue sample in particular.
Content may be subject to copyright.
Aus dem Robert Koch-Institut
Präsident: Prof. Dr. R. Kurth
Projekt P34 "Biophysikalische Strukturanalyse"
Leiter: PD Dr. D. Naumann
und dem Institut für Medizinische/Technische Physik
und Lasermedizin (WE09)
Computergestützte Bildrekonstruktion auf Basis FTIR-
mikrospektrometrischer Daten humaner Tumoren
Inaugural-Dissertation
zur
Erlangung der Doktorwürde
des Fachbereichs Humanmedizin
der Freien Universität Berlin
vorgelegt von Peter Lasch
aus Freiberg
Referent: Prof. Dr. Ing. G. Müller
Koreferent: PD Dr. D. Naumann
Gefördert von der Deutsch-Israelischen Stiftung für
wissenschaftliche Forschung und Entwicklung, German-Israeli
Foundation (G.I.F.), Projekt Nr. I-371-155.02/94
Gedruckt mit Genehmigung des Fachbereichs Humanmedizin der
Freien Universität Berlin
Disputation am 12. Oktober 1999
I
Computergestützte Bildrekonstruktion auf Basis FTIR-mikrospektrometrischer Daten
humaner Tumoren
1. Einleitung
1.1. Vorbemerkungen
1.2. Das kutane Maligne Melanom
1.2.1. Inzidenz und Etiologie
1.2.2. Histologie und Klassifikation des kutanen malignen Melanoms
1.2.3. Diagnostik und Differentialdiagnose
1.2.4. Therapie
1.3. Das Kolorektale Karzinom
1.3.1. Inzidenz und Etiologie
1.3.2. Histologie und Klassifikation
1.3.3. Diagnostik und Differentialdiagnose
1.3.4. Therapie
1.4. Infrarot-Spektroskopie
1.4.1. Grundlagen
1.4.2. Die Fourier Transform Infrarot (FTIR)-Spektroskopie
1.4.3. IR-Spektroskopie an Proteinen
1.4.4. IR-Spektroskopie an biologischen Membranen
1.4.5. IR-Spektroskopie an Nukleinsäuren
1.4.6. IR-Spektroskopie an komplexen biologischen Proben
1.5. Spektrenauswertung
1.5.1. Bildgebung mittels konventioneller Bandenanalyse
1.5.2. Faktoranalyse
1.5.3. Clusteranalyse
1.5.4. Definition spektraler Fenster
1.5.5. Künstliche Neuronale Netze
2. Aufgabenstellung und Zielsetzung der Arbeit
3. Material und Methoden
3.1. Probenvorbere itung
3.2. FTIR-spektroskopische Messungen - allgemeine Überlegungen
3.2.1. FTIR-Mikrospektrometrie
3.2.2. Einzelpunktmessungen
3.2.3. FTIR-Mapping-Spektroskopie
3.2.4. Messungen an FTIR-Array-Detektor-Systemen
3.2.5. Messungen an isolierten Proteinen der Gewebe
3.3. Computerhardware
3.4. Spektrenauswertung
3.4.1. Automatisierte Spektrenbearbeitung, Qualitätstest
1
1
2
2
3
7
7
8
8
9
11
11
12
12
13
17
18
19
20
21
22
23
25
27
30
33
35
35
37
38
41
42
43
46
47
47
47
II
3.4.2. Bildgebung mittels konventioneller Bandenanalyse
3.4.3. Digitale Bildrekonstruktion auf der Basis der Faktoranalyse
3.4.4. Clusteranalyse
3.4.5. Definition spektraler Fenster
3.4.6. Arbeit mit Künstlichen Neuronalen Netzen
4. Ergebnisse
4.1. FTIR-spektroskopische Charakterisierung von Kryodünnschnitten des kutanen
malignen Melanoms
4.1.1. Einzelpunktmessungen
4.1.2. Chemical Mapping
4.1.3. Ergebnisse der Faktoranalyse
4.1.4. Mustererkennung mit Künstlichen Neuronalen Netzen.
4.1.5. Vergleich von Referenzspektren des Koriums mit FTIR-Spektren von Kollagen
und Elastin
4.2. Vergleichende IR-spektroskopische Untersuchungen an Dünnschnitten kolorektaler
Karzinome
4.2.1. Ergebnisse der Einzelpunktmessungen
4.2.2. Vergleich von Gewebespektren mit FTIR-Spektren isolierter Proteine
4.2.3. Chemical Mapping
4.2.4. Untersuchungen zur intra- und inter-Klassen Varianz durch nicht-überwachte
Klassifizierungstechniken
4.2.5. Die Faktoranalyse FTIR-spektroskopischer Daten als Basis für die
Bildverarbeitung
4.2.6. Optimierung der Grenzen spektraler Fenster
4.2.7. Ergebnisse der Klassifizierung und Identifizierung von IR-Spektren durch
ANN
5. Diskussion
5.1 Spektreninterpretation
5.1.1. Bindegewebe und Kollagen
5.1.2. FTIR-Spektren von Muskelgewebe im Vergleich mit Spektren von Aktin und
Myosin
5.1.3. Spektroskopische Differenzen zwischen IR-Spektren der Krypten und des
Kolonkarzinoms
5.2. Datenvorbereitung
5.3. Datenreduktion
5.4. Multivariate Statistik
5.5. Voraussetzungen für den Aufbau einer FTIR-Datenbank von Gewebespektren
6. Zusammenfassung
7. Literaturverzeichnis
48
49
53
53
55
58
58
58
60
60
63
65
66
68
70
71
73
76
80
85
87
87
87
90
91
95
98
101
105
108
110
III
8. Anhang
TNM Klassifikation des malignen Melanoms bzw. kolorektalen Karzinoms
Dokumentationsbogen
Abkürzungen
Softwareübersicht
Publikationsliste, Vorträge, Poster
Lebenslauf
Danksagung
114
114
116
118
119
120
122
123
IV
Verzeichnis der Abbildungen und Tabellen
Einleitung
Abb. 1.2.2a. Schematischer Hautquerschnitt 4
Tab. 1.2.2a. Epidermale und vertikale Melanomwachstumsphasen 4
Tab. 1.2.2b. Melanomzelltypen 5
Tab. 1.2.2c. Stadieneinteilung des malignen Melanoms 6
Tab. 1.2.2d. Tumoreindringtiefe nach Clark 6
Abb. 1.2.2b. Clark-Level beim malignen Melanom 6
Tab. 1.2.2e. Metastasen maligner Melanome, Lokalisation und Häufigkeit 7
Tab. 1.3.2a. Lokalisation des kolorektalen Karzinoms 9
Tab. 1.3.2b. Klassifikation nach Dukes 10
Abb. 1.3.2. Querschnitt der Kolonwand, Kolonkarzinom 10
Tab. 1.3.3. klinische Symptomatik des kolorektalen Karzinoms 11
Abb. 1.4.2a. Michelson Interferometer 14
Abb. 1.4.2b. Berechnung von Extinktionsspektren 16
Tab. 1.4.3. IR-Schwingungsmoden der Proteine 18
Abb. 1.4.6. FTIR-Übersichtsspektrum einer Gewebeprobe 20
Tab. 1.4.6. Prominente Banden in FTIR-Gewebespektren 21
Abb. 1.5.1. Chemical Mapping 22
Abb. 1.5.2. Variablenraum und Faktorenraum 24
Abb. 1.5.3. Clusteranalyse 27
Abb. 1.5.4. Genetischer Algorithmus 29
Abb. 1.5.5. Topologie eines Neuronalen Netzes 32
Material und Methoden
Tab. 3.1. Übersicht Messungen kolorektaler Karzinome 36
Abb. 3.2. Erklärung zu den FT-Parametern ZFF und RES 38
Abb. 3.2.1. Strahlengang des FTIR-Mikroskops IRscope I 42
Tab. 3.2.5. Übersicht charakterisierter Proteine 47
Tab. 3.4.2. Übersicht mit Parametern für das Chemical Mapping 48
Abb. 3.4.3a. Bildbearbeitung mittels Faktoranalyse 50
Abb. 3.4.3b. Programm VIS_PCA 52
Abb. 3.4.6. Lernkurve eines Neuronalen Netzes 57
V
Ergebnisse
Tab. 4.1. Übersicht Messungen zu den Messungen am malignen Melanom 58
Abb. 4.1.1. FTIR-Spektren des malignen Melanoms 59
Abb. 4.1.2. Chemical Mapping, malignes Melanom 61
Abb. 4.1.3. Faktoranalyse, malignes Melanom 62
Abb. 4.1.4. ANN, malignes Melanom 64
Abb. 4.1.5. Vergleich von Gewebespektren mit Proteinspektren 65
Tab. 4.2. Übersicht Messungen kolorektales Karzinom 67
Abb. 4.2.1. Spektren, Kolorektales Karzinom 69
Abb. 4.2.2. Spektraler Vergleich Protein-Gewebespektren 71
Abb. 4.2.3a. Chemical Mapping, kolorektales Karzinom 72
Abb. 4.2.3b. Chemical Mapping, kolorektales Karzinom 73
Abb. 4.2.4a. CLA an FTIR-Mapping Daten, Kolonkarzinom (CLA I) 74
Abb. 4.2.4b. Inter- und intra-Klassen Varianz, Kolonkarzinom (CLA II) 75
Abb. 4.2.4c. Inter- und intra-Klassen Varianz, Kolonkarzinom (CLA III) 76
Abb. 4.2.5a. Faktoranalyse für die Bildrekonstruktion, Kolonkarzinom 78
Abb. 4.2.5b. Faktoranalyse für die Bildrekonstruktion, Kolonkarzinom 79
Tab. 4.2.6a. Ergebnisse des Programmes TOOLDIAG 81
Tab. 4.2.6b. Ergebnisse des Programmes GA_ORS 83
Abb. 4.2.6. Trivariate Statistik 85
Tab. 4.2.7. Klassifizierungsergebnisse durch ANN, Kolonkarzinom 86
Diskussion
Abb. 5.1.3. Vergleich Spektren Adenokarzinom - Krypten 94
Abb. 5.2. Illustration von Normierungseffekten 98
Einleitung 1
1. Einleitung
1.1. Vorbemerkungen
Optische Verfahren finden mehr und mehr Verbreitung in der medizinischen Diagnostik. Diese
Verfahren sind zumeist nicht-invasiv und erlauben es, objektive Parameter bezüglich
verschiedener pathologischer Prozesse schnell und kostengünstig zu bestimmen. Im Rahmen
der vorliegenden Arbeit wurde ein die strukturelle Information des mittleren Infrarotbereiches
(4000 - 850 cm-1) erfassendes Verfahren, die Fourier Transform Infrarot (FTIR)
Mikrospektrometrie für die optische Gewebecharakterisierung eingesetzt. Es sollte untersucht
werden, ob die IR-spektroskopische Information von Tumordünnschnitten für die
Differenzierung, Klassifizierung und Identifizierung von histologischen Strukturen und zur
Entwicklung eines auf IR-Mikrospektrometrie basierenden bildgebenden Verfahrens genutzt
werden kann.
Aufgabe und Zielsetzungen dieser Arbeit liefen darauf hinaus, sehr komplexe histologische
Objekte allein aufgrund ihrer spektroskopischen Eigenschaften zu charakterisieren, d.h. diese zu
differenzieren, zu klassifizieren und zu identifizieren. Dies sollte in enger Anlehnung an bereits
bestehende Methoden und Verfahren erfolgen, welche z.T. vollkommen andersartige Merkmale
der Untersuchungsobjekte zur Charakterisierung verwenden. Während im folgenden unter dem
Begriff "Differenzierung" die Möglichkeit zur Unterscheidung von Objekten anhand
unterschiedlicher Merkmale verstanden werden soll, wird der Vorgang der "Klassifizierung" als
Zusammenfassung von Objekten in Gruppen anhand ihrer Ähnlichkeit, d.h. aufgrund
gemeinsamer Merkmale beschrieben. Die Klassifizierung ist hierbei die Voraussetzung zur
"Identifizierung", einem Vorgang, unter dem die Zuordnung eines unbekannten Objektes zu
einer bereits definierten Gruppe verstanden wird.
Die Auswahl der zur Differenzierung, Klassifizierung und Identifizierung verwendeten
Merkmale eines Objekts bestimmt maßgeblich die Ergebnisse der Charakterisierung. Da
bekannt ist, daß jedes Objekt durch unendlich viele Merkmale wie Farbe, Temperatur, Geruch,
spektroskopische Eigenschaften etc. beschrieben werden kann und diese unmöglich in ihrer
Gesamtheit zur Charakterisierung herangezogen werden können, ist eine Selektion von
Merkmalen unumgänglich. Die Charakterisierung von Objekten ist demzufolge immer ein mit
Informationsverlust einhergehender Abstraktionsvorgang.
Grundsätzlich betrachtet, können die Ergebnisse einer Charakterisierung nicht "wahr" oder
"falsch" sein. Entscheidend ist letztlich, ob sich die Ergebnisse der Charakterisierung in der
Praxis bewähren, d.h. ob Differenzierung, Klassifizierung und Identifizierung der Objekte
sinnvoll und erfolgreich für die anvisierte Problemlösung sind.
Basierend auf diesen allgemeinen Überlegungen wurden in dieser Arbeit die Ergebnisse der
Charakterisierung von Gewebeproben nach histologischer Begutachtung durch erfahrene
Pathologen mit den Klassifizierungsergebnissen der computergestützten FTIR-
mikrospektrometrischen Technik verglichen. Zusätzlich werden im folgenden zwei neuartige
Methoden zur Erzeugung "spektraler Karten", welche ausschließlich auf der FTIR-
mikrospektrometrischen Information beruhen, vorgestellt.
2 Einleitung
1.2. Das kutane maligne Melanom
1.2.1. Inzidenz und Etiologie
Das maligne Melanom ist ein hochgradig maligner Tumor, welcher von den melaninbildenden
Zellen, den Melanozyten, ausgeht. Diese wachsen sowohl in ihrer physiologischen als auch in
ihrer malignen Form nicht in Zellverbänden, was als eine der Ursachen für die frühzeitig
einsetzende Metastasierung angesehen wird. Die Morbidität nimmt besonders unter der
hellhäutigen Bevölkerung Europas, Nordamerikas, vor allem aber Australiens und Neuseelands
in den letzten Jahrzehnten kontinuierlich zu. Starke regionale Unterschiede in der
Melanomhäufigkeit werden beobachtet. In Asien finden sich im Mittel Inzidenzraten von 0.2
bis 0.3 pro 100.000 Personenjahre [Muir, 1987], während für einige Regionen in Australien
(Queensland) Werte von 43.5 erreicht werden [Balch, 1992]. Für Deutschland werden in der
Literatur Werte des europäischen Durchschnitts (4.0 bis 5.0) mit ansteigender Tendenz
angegeben. Es wird erwartet, daß für Angehörige der weißen Bevölkerung des Jahres 2000 das
Risiko einmal im Leben am malignen Melanom zu erkranken, bei 1:90 liegt [Lee, 1996].
Folgende Risikofaktoren für die Entwicklung eines malignen Melanoms sind bekannt:
1. Vorhergehendes Melanom. Die Wahrscheinlichkeit, ein zweites primäres malignes
Melanom zusätzlich zu einem bereits bestehenden primären malignen Melanom zu
entwickeln liegt bei ca. 5% [Ariyan, 1994]
2. Hellhäutigkeit. Eine hellblonde oder rote Haarfarbe, blaue Augenfarbe und
sonnenempfindliche Haut sind mit einem erhöhten Melanomrisiko verbunden.
3. Rasse/Ethnizität. Das maligne Melanom ist primär eine Erkrankung der Weißen. Besonders
gefährdet sind die Bewohner Nord- und Zentraleuropas.
4. UV-Exposition. In der Literatur finden sich vielfach Hinweise auf einen Zusammenhang von
UV-Exposition und erhöhtem Melanomrisiko [Elwood, 1992; Autier, 1994]. Quellen der
UV-Strahlung können natürlichen (Sonnenlicht) oder künstlichen Ursprungs
(Sonnenstudios) sein. Besonders der B-Anteil der ultravioletten Strahlung (280-315 nm,
UVB) erhöht das Melanomrisiko.
5. Geographischer Breitengrad. Je näher der Wohnort am Äquator liegt, desto höher ist (bei
Weißen) das Melanomrisiko (Süd-Nord Gefälle).
6. Familienanamnese. Familiäre Häufungen des Auftretens maligner Melanome wurden
beschrieben [Holly, 1995].
7. Benigne Nävi. Obwohl ein benigner Nävus nicht als Präkanzerose aufgefaßt werden kann,
ist beim Vorhandensein vieler Nävi das Melanomrisiko erhöht [Holly, 1995].
8. Dysplastisches Nävus Syndrom (atypical mole syndrome). Ca. 20% aller Melanome
entstehen auf dem Boden des Syndroms dyplastischer Nävi, einer Erkrankung mit
wahrscheinlich autosomal-dominantem Erbgang.
Einleitung 3
Ohne Zweifel ist die Entwicklung eines malignen Melanoms kein monokausaler Vorgang.
Neben der als sicher melanominduzierend geltenden UV-Strahlung werden onkogene Viren und
chemische Karzinogene wie 7,12-Dimethylbenzanthrazen (DMBA), Urethan oder 3-
Methylcholanthren in der Literatur aufgeführt [Longstreth, 1992]. Bezüglich der karzinogenen
Wirkung von UV-Strahlung werden diverse Mechanismen diskutiert. So ist beispielsweise seit
längerem bekannt, daß UV-Strahlung zwischen 290 und 320 nm DNA-Doppelstrangbrüche
induzieren kann (Formierung von Pyrimidin-Dimeren). Zumeist werden solche Brüche durch
die Zelle repariert (Exzisionsreparatur, postreplikative Reparatur oder Photoreparatur). Erfolgt
diese nicht, so sind schwerwiegende Konsequenzen für die DNA-Replikation und RNA-
Transkription die Folge. Die genaue Funktionsweise des Übergangs von der UV-induzierten
DNA-Punktmutation zur Tumortransformation ist allerdings ungeklärt. Möglicherweise werden
durch eine stattgefundene Mutation Onkogene aktiviert oder auch Anti-Onkogene deaktiviert.
Als sicher gilt jedoch, daß UV-induzierte DNA-Strangbrüche nur den Beginn einer längeren
Ursachen-Wirkungskette darstellen.
Neben der direkten Initiierung der Melanozytentransformation durch UV-Strahlung werden
weitere Wirkungsmechanismen diskutiert. So ist bekannt, daß eine UV-Bestrahlung der Haut
mitogene und entzündliche Reaktionen hervorruft, daß kutane Immunreaktionen abgeschwächt
werden [Toews, 1980], die Produktion des Melanozyten-stimulierenden Hormons (MSH) und
anderer Melanotropine induziert wird, die Melanozyten nach UV-Exposition verstärkt MSH-
Rezeptoren exprimieren und daß die Wirkung chemischer Kanzerogene kumulativ verstärkt
wird [Romerdahl, 1989]. Obwohl die genauen Wirkungsmechanismen der
Melanozytentransformation nur ansatzweise verstanden werden, scheint - auch aus den
epidemiologischen Daten Australiens und Neuseelands (Ozonproblematik) - klar zu sein, daß
der Dauer und Intensität besonders der UVB-Exposition eine zentrale Stellung bei der
Entwicklung maligner Melanome zukommt.
1.2.2. Histologie und Klassifikation des kutanen malignen Melanoms
Nachfolgend werden Erläuterungen zum kutanen malignen Melanom gegeben. Über diesen
Manifestationsort hinaus gibt es viszerale, okuläre und Melanome des zentralen Nervensystems.
Der histologische Aufbau der Haut ist umfassend in verschiedenen histologischen Lehrbüchern
dargelegt. Im folgenden soll deshalb nur kurz auf die für diese Arbeit wichtigen Aspekte
eingegangen werden.
Die Vorläufer der Melanozyten, sogenannte Melanoblasten wandern im 3. Fetalmonat aus der
Neuralleiste zur Epidermis. Diese sind dann in der Regenerationsschicht der Epidermis als
große runde, mit Ausläufern versehene Zellen zu finden. Die Melanozyten synthetisieren den
Farbstoff Melanin (Eu- bzw. Phäomelanin) und geben das Pigment in Form von Melanosomen
an die unteren Epithelzellschichten ab. Melanin absorbiert effektiv UV-Strahlung und schützt
somit die empfindlichen Mitosen im Stratum germinativum. In der folgenden Abb. 1.2.2a. sind
die Schichtungen der Haut mit Erläuterungen abgebildet.
4 Einleitung
Maligne Melanome können sich auf der Basis bereits bestehenden Nävi oder de novo
entwickeln. Unabhängig davon unterscheidet man zwischen einer biphasischen und
monophasischen Wachstumsform maligner Melanome [Barnhill, 1992]. Bei der biphasischen
Wachstumsform geht der Phase des sogenannten vertikalen Wachstums eine unterschiedlich
lang andauernde Phase des epidermalen (synonym radialen) Tumorwachstums voraus. Tumoren
in der radialen Wachstumsphase werden üblicherweise den superfiziell spreitenden,
acrolentiginösen oder den Lentigo maligna-Melanomen zugeordnet. Bei der monophasischen
Wachstumsform erfolgt das Tumorwachstum sofort in vertikaler Richtung ohne eine
vorhergehende epidermale Phase (Primär noduläres malignes Melanom).
Epidermale Wachstumsphase Vertikale Wachstumsphase
- hauptsächlich intraepidermale Proliferation
(Clark Level I und II) - Wachstum in alle Hautschichten
(Clark Level II, III-V)
- geringes metastatisches Potential - hohes metastatisches Potential
- geringerer Grad von Zell- und Kernatypien - sehr hoher Grad von Zell- und Kernatypien,
hoher Anteil pleomorpher Zellen, u.U.
Ausbildung kompakter Zellaggregate
- meist melaninproduzierend - häufig Verlust der Fähigkeit zur
Melaninsynthese (amelanotische Melanome)
- moderate Prognose - schlechte Prognose
Tab. 1.2.2a. Gegenüberstellung der epidermalen und vertikalen Tumorwachstumsphasen des malignen Melanom
[nach Barnhill, 1992].
Abb. 1.2.2a. Schematischer Querschnitt durch
ein mehrschichtiges, verhornendes Plattenepithel
(Fingerbeere)
1- Stratum corneum
2- Stratum lucidum
3- Stratum granulosum
4- Stratum spinosum (mit Melanozyten)
5- Stratum basale
4 und 5 bilden das Stratum germinativum.
Die Schichten 1-5 bilden die Epidermis.
6 - Stratum papillare des Koriums, enthält
Kollagenfasern (Typ I-Kollagen) sowie Blut- und
Lymphkapillaren.
Das Stratum reticulare des Koriums
(nächstfolgende Schicht) ist hier nicht dargestellt.
Letztere wird von Kollagenfasern und einigen
Elastinfasern durchzogen und enthält im
Vergleich zum Str. papillare generell weniger
zelluläre Elemente
[aus: Leonhardt, 1985]
Einleitung 5
Melanomzelltypen:
Epitheloid-
Zellen
(Pagetoid-
Zellen)
Häufigster Zelltyp, besonders beim superfiziell spreitenden und primär
nodulären malignen Melanom. Findet sich vorzugsweise in der vertikalen
Wachstumsphase und in Metastasen aller Melanomtypen. Ist charakterisiert
durch eosinophiles bis "staubig"-gefärbtes Zytoplasma. Gewöhnlich runde
Nuklei mit dispersen Chromatin, prominente Nukleoli, Pleomorphismus,
Hyperchromasie. "pseudo"-nukleare zytoplasmatische Einschlüsse.
Spindelzellen Kommt vor allem bei Lentigo maligna und im akralentiginösen malignen
Melanom vor. Kann in der vertikalen Wachstumsphase aller Melanome
auftreten. Längliche oder fusiforme Zellformen sowie längliche, oft
pleomorphe Nuclei. Hyperchromasie.
Nävus-artige,
kleine nävoid-
epitheloide
Zellen
Können in allen Melanomtypen gefunden werden. Kernpleomorphie,
Hyperchromasie
Seltenere
Zelltypen Ballonzellen, Riesenzellen, multinukleäre Zellen.
Tab. 1.2.2b. Übersicht der verschiedenen Melanomzelltypen.
Die Histologie des primär nodulär malignen Melanoms (NMM) ist gekennzeichnet durch das
Auftreten von epitheloidzelligen, spindelzelligen oder auch kleinen nävoid-epitheloid
Melanomzellen (auch Mischungen aller drei Zellformen sind möglich). In der Epidermis finden
sich keine atypischen intraepidermalen Melanozyten. Es hat von allen Melanomformen die
schlechteste Prognose, da es rasch in vertikaler Richtung wächst. Der Altersgipfel bei dieser
Melanomform liegt zwischen 20 und 40 Jahren. Beim superfiziell spreitenden malignen
Melanom (SSM) finden sich in Abhängigkeit von der Wachstumsphase über alle Schichten der
Epidermis verteilte pagetoide Melanozyten (radiale Phase). Ist die Basalmembran (dermo-
epidermale Junktionszone) durchbrochen, können in diesen nodulären Bereichen auch
spindelförmige und kleinzellig-maligne Melanozyten beobachtet werden. Ausgeprägte
immunologische Reaktionen mit Rundzellinfiltraten und starker Melanophagenaktivität sind
besonders für depigmentierte Areale typisch. In der hellhäutigen Bevölkerung Europas und
Nordamerikas ist das superfiziell spreitende Melanom der häufigste Melanomtyp (70%). Vor
allem sind Patienten im Alter zwischen 40 und 60 Jahren betroffen. Da anfangs das Wachstum
in horizontaler Richtung dominiert, ist bei früher Diagnose die Prognose moderat. Lentigo
maligna Melanom (LMM): umfaßt ca. 5% aller malignen Melanome. LMM entwickeln sich
über Jahre bis Jahrzehnte auf dem Boden einer Präkanzerose, der Lentigo maligna. Die meisten
Patienten sind älter als 60 Jahre. Akrolentiginöses malignes Melanom: kommt besonders häufig
in der nicht-weißen Bevölkerung vor und entwickelt sich primär im Bereich der Phalangen, der
Handinnenflächen und Fußsohlen sowie an den Schleimhäuten. Die Prognose ist besser als
beim nodulären Melanom, da vertikales Wachstum erst recht spät einsetzt.
6 Einleitung
Drei-Stadien Modell des malignen Melanoms (modifizierte Form):
Stadium Beschreibung
I Lokale Krankheit
Ia nur Primärtumor vorhanden
Ib Primärtumor mit Satelliten im Umkreis von weniger als 5 cm
Ic lokale Rezidive nach Resektion des Primärtumors mit einem Abstand von der
Resektionsstelle < 5 cm
Id Metastasen weiter als 5 cm vom Primärtumor entfernt, aber noch im primären
Lymphabflußareal lokalisiert (Intransitmetastasen)
II Regionale Lymphknotenmetastasen
III Hämatogene oder lymphogene Fernmetastasen
Tab. 1.2.2c. Stadieneinteilung des malignen Melanoms [Balch, 1992].
Diese Klassifikation ist einfach und überschaubar, hat allerdings den Nachteil, daß eine
Risikoabschätzung mit dieser Einteilung nur unvollständig gelingt. Da maligne Melanome z.T.
sehr frühzeitig diagnostiziert werden (also fast ausschließlich in Gruppe I fallen), kommt dieser
Klassifikation nur noch eingeschränkte Bedeutung zu.
Tumoreindringtiefe nach Clark:
Tab. 1.2.2d. Tumoreindringtiefe nach Clark
[aus: Jung, 1991].
Abb. 1.2.2b. Clark-Level beim malignen Melanom.
Schematische Illustration zur nebenstehenden Tabelle.
1 - Epidermis, 2 - Stratum germinativum der Epidermis,
3 - Stratum papillare (Korium), 4 - Stratum reticulare
(Korium), 5 - Subkutis
Die Metastasierung maligner Melanome erfolgt frühzeitig (lymphogen oder/und hämatogen).
Dies ist eine wesentliche Ursache für die hohe Mortalität dieser Tumorerkrankung. Regionale
Lymphknoten können eine Zeit lang als Barriere gegen die weitere Tumorausbreitung dienen
(diese Tatsache ist besonders therapeutisch bedeutsam). Ist diese Barriere aber erst einmal
überwunden, können Tumorzellen über weitere Lymphknotenstationen in die Blutbahn
gelangen und Tochterabsiedlungen in diversen inneren Organen (v.a. Lungen) ausbilden. In
nachfolgender Tabelle sind die wichtigsten Lokalisationen von Melanommetastasen aufgeführt.
Stadium Beschreibung
Level I Tumorzellen ausschließlich in der
Epidermis
Level II Tumorzellen durch die
Basalmembran bis in das Str.
papillare
Level III Tumorzellen im oberen Korium
(gesamtes Str. papillare) bis zur
Grenzzone vom Str. reticulare
Level IV Tumorzellen im mittleren und
unteren Korium
Level V Tumorzellen im subkutanen
Fettgewebe
Einleitung 7
Lokalisation Häufigkeit
klinisch Autopsie
Haut, subkutanes Gewebe 42-59% 50-75%
Lunge 18-36% 70-87%
Leber 14-20% 54-77%
Hirn 12-20% 36-54%
Knochen 11-17% 23-49%
Gastrointestinaltrakt 1-7% 26-58%
Niere, Harnblase 1% 35-48%
Tab. 1.2.2e. Übersicht zu Lokalisation und Häufigkeit von Metastasen maligner Melanome
[aus Balch, 1992].
1.2.3. Diagnostik und Differentialdiagnose
Die Diagnose kann durch den erfahrenen Dermatologen oft schon klinisch gestellt werden, die
Diagnosesicherung erfolgt durch eine jederzeit erweiterbare Exzisionsbiopsie mit
intraoperativer Kryostatschnellschnittdiagnose. Diese ergibt in 90% aller Fälle eine zutreffende
Diagnose (die restlichen 10% sind zumeist falsch positiv). In unklaren Fällen wird deshalb eine
Paraffinschnittdiagnose abgewartet bzw. werden immunhistochemische Verfahren angewendet.
Als Differentialdiagnose kommen v.a. pigmentierte nävoide und melanozytische
Veränderungen (dysplastische Nävuszellnävi, benignes juveniles Melanom, Lentigo maligna,
Nävus coeruleus), vaskuläre Veränderungen (z.B. thrombosiertes Hämangiom, Angiokeratom,
Granuloma pygenicum), dermale Veränderungen (pigmentiertes Histiozytom und
Dermatofibrom) sowie pigmentierte Basaliome, Kerato- und Melanoakanthome und
pigmentierte seborrhoische Keratosen in Betracht.
1.2.4. Therapie
Die Form der Therapie hängt von folgenden Faktoren ab: Lokalisation und Anzahl von
Fernmetastasen, Wachstumsgeschwindigkeit, Ansprechbarkeit auf vorherige Behandlung, Alter,
Geschlecht, körperliche Verfassung und Wünsche des Patienten.
Palliative Therapie: Linderung von Symptomen (z.B. Schmerztherapie), Erhöhung der
Lebensqualität bei infauster Prognose
Chirurgische Behandlung: Diese kann in Abhängigkeit vom Tumorstadium mit kurativer oder
palliativer Zielstellung erfolgen. Im Stadium I erfolgt die Resektion vom Primärtumor mit
einem Sicherheitsabstand von 3-5 cm mit Hautdeckung durch ein Autotransplantat oder eine
Verschiebeplastik. Im Stadium II (regionale Lymphknotenmetastasen) ist ebenfalls eine
chirurgische Intervention zur Entfernung von Primärtumor und Solitärmetastasen indiziert.
Nachfolgend ist eine Chemotherapie und/oder adjuvante Immuntherapie anzuschließen. Im
Stadium III ist eine kurative Zielstellung unrealistisch. Die chirurgische Intervention, oft in
Kombination mit Strahlentherapie und/oder Chemotherapie kann hier nur eine zeitweilige
Reduktion der Tumormasse bewirken.
Chemotherapie: Einige Substanzen sind wirksam gegen metastasierende Melanome und
8 Einleitung
bewirken bei 10-20% aller Patienten eine partielle Regression des Tumors für einen Zeitraum
von 3-5 Monaten. Dacacarbizin (DTIC) ist eine wirksame Einzelsubstanz, sollte aber mit
Antiemetika gegeben werden. Antitumoröse Eigenschaften sind auch bekannt von
Nitrosharnstoffen (z.B. Carmustin) Carboplatin und hochdosiertem Cisplatin + Thiol WR2721.
Viszerale Metastasen sprechen generell schlecht auf eine DTIC-Therapie an, während die
Erfolgsaussichten einer DTIC-Therapie bei z.B. Haut- und Lungenmetastasen höher sind.
Studien berichten von Kombinationstherapien mit Cisplatin und DTIC, wobei Ansprechraten
von 40%-55 erreicht wurden [z.B. McClay, 1988].
Strahlentherapie: Ist angezeigt im Rahmen der palliativen Therapie bei weit fortgeschrittenen
Melanomen. Besonders Knochen- und Hirnmetastasen sowie Metastasen der Haut und des
subkutanen Gewebes oder von Lymphknoten werden in Problemfällen bestrahlt.
Systemische und lokale Immuntherapie: Wenn keine viszeralen Metastasen vorliegen, kann eine
Tumorregression induziert werden, indem man Bacillen-Calmette-Guérin (BCG) in lokalisierte
oberflächliche Hautmetastasen injiziert. Ähnliche Ergebnisse erreicht man bei der lokalen
Applikation von Dinitrochlorobenzen. Allerdings zeichnet sich letzteres durch erhebliche lokale
Nebenwirkungen aus. Bei Verwendung von Interferon α und Interleukin 2 in der systemischen
Therapie werden Erfolgsraten von 10 bis 20% erreicht. Alternativ finden Monoklonale
Antikörper und Tumor-Vaccine zunehmend mehr Anwendung in der Therapie des
metastasierenden malignen Melanoms.
Hypertherme Extremitätenperfusion: Hier erfolgt die temporäre Abtrennung einer von
Metastasen befallenen Extremität vom Körperkreislauf mit anschließender Perfusion für 60 min
bei 41.5°C mit einem hochdosierten Zytostatikum über eine Herz-Lungen-Maschine.
1.3. Das kolorektale Karzinom
1.3.1. Inzidenz und Etiologie
Kolorektale Karzinome gehören inzwischen zu den häufigsten Todesursachen in der
Bundesrepublik Deutschland. Ihre Häufigkeit hat in den letzten 30 Jahren ständig zugenommen.
Bei Männern ist das Dickdarmkarzinom nach dem Bronchialkarzinom der zweithäufigste
Tumor, während bei Frauen dieses Karzinom inzwischen sogar häufiger als das
Mammakarzinom ist. Betroffen sind vor allem die Altersgruppen zwischen 50 und 70 Jahren. In
nur 5% aller Fälle wird das kolorektale Karzinom bei Patienten unter 45 Jahre beobachtet.
Die Inzidenz des kolorektalen Karzinoms differiert regional stark. In den hochentwickelten
Industrienationen Nord- und Westeuropas, Nordamerikas und in Australien ist sie wesentlich
höher als in Asien, Afrika oder Lateinamerika. Grund dafür dürften nicht ethnische, sondern
exogene Faktoren sein. Besonders die Ernährung mit fett- und eiweißreichen Nahrungsmitteln
wird im Zusammenhang mit der Erkrankungshäufigkeit durch kolorektale Karzinome
diskutiert. So belegen epidemiologische Studien in den Vereinigten Staaten, daß Immigranten
in zweiter Generation ein ähnliches Risiko an Dickdarmkarzinom zu erkranken tragen, wenn
die Eßgewohnheiten der US-Gesamtbevölkerung übernommen wurden. Vermutet wird, daß die
zu hohe Zufuhr von Nahrungsfett die Ausschüttung von Gallensäuren induziert und damit zur
Einleitung 9
Veränderung der Darmflora beiträgt. Die veränderte Flora kann dann ihrerseits den
enzymatischen Abbau von primären und sekundären Gallensäuren zu karzinogenen Substanzen
wie z.B. der Desoxycholsäure bewirken. Weitere Karzinogene sollen durch den bakteriellen
Abbau von Tyrosin und Tryptophan entstehen bzw. direkt mit der Nahrung (Benzpyren durch
Braten, Rösten) aufgenommen werden. Eine faserarme Nahrung steigert darüber hinaus die
Konzentration der Karzinogene und Kokanzerogene und ihrer Ausgangssubstanzen im Darm.
1.3.2. Histologie und Klassifikation
Über 90% der kolorektalen Karzinome gehen aus Adenomen (benigne gestielte oder sessile
Neoplasien des Zylinderepithels mit Atypien verschiedenen Grades) hervor. Man unterscheidet
zwischen villösen und tubulären Adenomen. Letztere gehen bei einem Durchmesser kleiner als
1 cm selten direkt in ein Karzinom über und entarten vorwiegend erst, wenn ein größerer
Adenomdurchmesser erreicht wird. Villöse Adenome führen in einem hohen Prozentsatz
(>35%) zu einem meist verschleimenden Dickdarmkarzinom und sind daher als fakultative
Präkanzerosen anzusehen. Die UICC definiert als Unterscheidungskriterium eines Adenoms
vom Karzinom die Infiltration der Submucosa. Erst in dieser Schicht werden Lymphgefäße, d.h.
die entscheidende anatomische Grundlage für die lymphogene Metastasierung ausgebildet.
Nach der Ansicht der UICC gibt es im Gegensatz zur Position der WHO kein in situ-Karzinom.
Insbesondere erbliche Formen der Dickdarm-Polypose wie z.B. die familäre adematöse
Polypose (Adenomatosis) und das Gardner Syndrom sind als obligate Präkanzerosen
einzuschätzen. Etwa 1% aller Dickdarmkarzinome lassen sich auf chronisch entzündliche
Darmerkrankungen wie Colitis ulcerosa und M. Crohn zurückführen, wobei das
Entartungsrisiko bei C. ulcerosa etwa 5-10 mal höher liegt.
95% aller Dickdarmkarzinome sind Adenokarzinome. Plattenepithelkarzinome sind sehr selten
und treten überwiegend im Bereich der Analschleimhaut auf. Adenosquamatöse Karzinome,
undifferenzierte und unklassifizierbare Karzinome sind ebenfalls sehr selten.
Die Adenokarzinome sind meist so differenziert, daß sie tubuläre, azinäre oder papilläre
Strukturen ausbilden. In etwa 10% aller Fälle treten Adenokarzinome als Gallertkarzinome auf
(Muzinöse Adenokarzinome). Diese zeichnen sich durch eine zumeist schon makroskopisch
erkennbare, erhebliche extrazelluläre Schleimablagerung aus und sind prognostisch zumeist
ungünstig. Erfolgt die Schleimakkumulation vorwiegend intrazellulär, werden sogenannte
Siegelringzellen ausgebildet, die dem Karzinom den entsprechenden Namen geben. Die
Prognose dieser Tumorform ist
besonders schlecht.
Bevorzugte Lokalisationen des
kolorektalen Karzinoms sind das
Rektum und das Sigma. Die anderen
Kolonabschnitte und das Zökum sind
seltener betroffen.
Lokalisation Häufigkeit (%)
Rektum 61%
Sigma 21%
Colon descendens 3%
Colon transversum 6%
Colon ascendens 5%
Zökum 4%
Tab. 1.3.2a. Die häufigsten Lokalisationen kolorektaler
Karzinome [Schubert, 1987].
10 Einleitung
Die klinische Staging (TNM) bzw. postoperative histopathologische Klassifikation (pTNM)
sowie das Malignitätsgrading sind im Anhang (s.S. 115) zu finden.
Klinisch bedeutsam ist weiterhin die Klassifikation nach Dukes:
Dukes A Tumor ist auf die Darmwand beschränkt
Dukes B Tumor überschreitet die Darmwand und infiltriert die Umgebung
Dukes C Tumor überschreitet die Darmwand, Lymphknotenmetastasen nachweisbar
C1 Befall der regionalen (perikolischen/perirektalen) Lymphknoten
C2 paraaortaler Lymphknotenbefall
Tab. 1.3.2b. Die Klassifikation kolorektaler Karzinome nach Dukes
Die kontinuierliche Ausbreitung betrifft beim Rektumkarzinom die Harnblase, Ureteren,
Prostata, Os sacrum, Uterus und die Ovarien. Karzinome des Colon ascendens, transversum
und Sigma können die Bauchwand, aber auch Magen und Leber infiltrieren.
Die lymphogene Ausbreitung erfolgt über die regionalen und mesenterialen Lymphknoten
entlang der versorgenden Blutgefäße.
Kolorektale Karzinome metastasieren hämatogen über den Pfortaderkreislauf primär in die
Leber und von dort aus weiter in die Lungen. Auch eine direkte Metastasierung in die Lungen
über Äste der Vena cava ist bei tiefsitzenden Rektumkarzinomen möglich.
A B C
Abb. 1.3.2. A Schemazeichnung zur Darstellung der verschiedenen Wandschichten des Kolons. 1 - Krypten mit
zahlreichen Becherzellen, 2 - Lamina propria mucosae, 3 - Lamina muscularis mucosae, 4 - Submucosa, 5 - Tunica
muscularis mit einer transversalen und einer longitudinalen Muskelschicht, 6 - Serosa. [Leonhardt, 1985]
B Dünnschnitt eines kolorektalen Karzinoms in einer HE-Übersichtsfärbung. Im oberen Anteil ist die intakte
Mukosa mit den Krypten, der Lamina propria mucosae sowie der Lamina muscularis mucosae gut zu erkennen.
Unter der Schleimhaut wurde die Submucosa von einem tubulär wachsenden Adenokarzinom verdrängt. Der Grad
der Reproduktion drüsiger Wachstumsform sowie das Ausmaß der Zellatypien erlauben es, Rückschlüsse auf den
Differenzierungsgrad des Tumors zu ziehen.
Abb. C (rechts) ist eine Detailaufnahme des Übersichtsbildes B. Bedingt durch die enge Nachbarschaft intakter
Krypten und des Adenokarzinoms eignete sich das dargestellte Präparat hervorragend als IR-mikroskopisches
Studienobjekt [Die Fotografien B und C wurden freundlicherweise von Herrn W. Wäsche aus dem Lasermedizin-
Technologie-Bereich Berlin (LMTB) zur Verfügung gestellt].
Einleitung 11
1.3.3. Diagnostik und Differentialdiagnose
Die klinische Symptomatik des kolorektalen Karzinoms ist häufig unspezifisch und kann z.T.
erst sehr spät auftreten. In der folgenden Tabelle sind die wichtigsten Symptome in
Abhängigkeit von der Lokalisation des Primärtumors zusammengefaßt.
Rechtes Kolon Gewichtsverlust, Anämie, Schmerzen im rechten Unterbauch, häufig Tumor
palpabel, selten Durchfälle oder makroskopisch sichtbare Blutungen.
Linkes Kolon Häufig Obstipationen, Blut- und Schleimabgang, Meteorismus, kolikartige
Schmerzen.
Sigma Blut- und Schleimabgang, Stuhlunregelmäßigkeiten, Meteorismus und
Flatulenz.
Rektum Blut- und Schleimabgang, Stuhlunregelmäßigkeiten wie paradoxe Diarrhoen
oder "Bleistiftstuhl", Druckgefühl im Dammbereich
Tab. 1.3.3. Übersicht zur klinischen Symptomatik beim Auftreten eines kolorektalen Karzinoms
[aus: Häring, 1988]
Als Komplikationen eines kolorektalen Karzinoms sind v.a. Stenosen bis hin zur Entwicklung
eines Subileus/Ileus, Tumordurchbrüche (kotige Peritonitis), massive Blutungen,
Fistelbildungen zur Blase oder Vagina sowie bei Einbruch in die Bauchwand
Bauchdeckenabszesse zu nennen.
Die Untersuchung auf okkultes Blut im Stuhl kann zur Früherkennung des kolorektalen
Karzinoms (Hämokkult-Test) eingesetzt werden. Die Methode ist sensitiv, aber nicht
spezifisch. Bei einer digitalen Untersuchung kann ein Drittel der Rektumkarzinome bereits
getastet werden. Die Diagnosesicherung erfolgt durch einen Röntgenkontrasteinlauf und
Endoskopie mit Biopsie. Diese Vorgehensweise hilft zumeist, villöse Adenome oder
Divertikeltumoren differentialdiagnostisch vom kolorektalen Karzinom abzugrenzen. Hilfreich
in der Verlaufskontrolle ist die Titerbestimmung des CEA (Karzinoembryonales Antigen). Oft
indiziert ein Titeranstieg das Auftreten von Rezidiven oder Metastasen noch ehe andere
Verfahren diese entdecken können.
1.3.4. Therapie
Die Standardtherapie des kolorektalen Karzinoms erfolgt primär chirurgisch und richtet sich
nach Tumorstadium, Tumorgröße und der Lokalisation des Tumors. Bei Sitz im Rektum ist die
präoperative hypertherme Radiochemotherapie eine Vorbehandlung, die offensichtlich mit einer
Reduktion postoperativer Lokalrezidive einhergeht. Kann der Primärtumor nicht vollständig
entfernt werden, ist der Vorteil der Reduktion der Tumorlast gegen das perioperative Risiko zu
vergleichen. Umgehungsanastomosen mit Anlage eines Anus praeter naturalis und lokale
Tumorzerstörung (thermisch z.B. durch Laser, Kryotherapie) sind lediglich palliative
Maßnahmen.
12 Einleitung
Oberstes Prinzip während der Resektion ist es, die Zellverschleppungswege zu blockieren. Der
Tumor wird mit einem dreidimensionalen Sicherheitsabstand im Gesunden und möglichst en-
bloc mit den regionalen Lymphknoten entfernt.
Beim Rektumkarzinom ist man bemüht, kontinenzerhaltend zu operieren. Dies ist bei Tumoren
des distalen Rektumdrittels nicht immer möglich. In solchen Fällen wird eine totale mesorektale
Exzision mit Anlage eines endständigen Sigmaafters notwendig.
Solitäre Fernmetastasen z.B. in Leber oder Lunge können oft noch mit gutem Erfolg reseziert
werden. Zur Verkleinerung großer singulärer Metastasen mit dem Ziel des Erreichens der
Operabilität kann eine lokale Chemotherapie bzw. Chemoembolisation erwogen werden.
1.4. Infrarot-Spektroskopie
1.4.1. Grundlagen
Die IR-Spektroskopie ist eine seit langem etablierte Methode in der chemischen Analytik. Die
Einsatzgebiete reichen von der standardisierten Identifizierung verschiedener chemischer
Substanzen über die Prozeßkontrolle (Qualitätssicherung) bis hin zur Bearbeitung
anspruchsvoller wissenschaftlicher Fragestellungen. Das physikalische Prinzip der IR-
Spektroskopie beruht auf der diskreten Absorption einer eingestrahlten elektromagnetischen
Strahlung durch verschiedene Moleküle, welche dadurch in definierte angeregte Schwingungs-
und Rotationszustände versetzt werden. Die Absorption des IR-Lichtes kann nur erfolgen, wenn
mit der Änderung der Schwingungs- bzw. Rotationszustände eine Veränderung des
Dipolmomentes einhergeht. Die Grundschwingungen der meisten biologisch relevanten
Moleküle lassen sich im Wellenlängenbereich von λ€= 2.5 bis 20 µm beobachten. Dies
entspricht in Wellenzahlen ausgedrückt, einem Bereich von = 4000 - 500 cm-1 ( = 1/λ).
Aus historischen Gründen wird in der Infrarotspektroskopie die Einheit Wellenzahlen
verwendet. Diese ist zur Frequenz und damit zur Energie direkt proportional.
Die Grundlagen der IR-Spektroskopie sind in der Literatur umfassend beschrieben [z.B.
Günzler, 1996]. An dieser Stelle soll deshalb nur kurz auf einige für diese Arbeit besonders
wichtige Aspekte eingegangen werden.
Die Stärke der Absorption des IR-Lichtes durch die Probe ist nach Lambert-Beer direkt
proportional zur Konzentration der betreffenden Substanz c, der Schichtdicke d und dem
molaren Extinktionskoeffizienten ε, einer stofflichen Konstante.
Ecd=⋅
ε
(1.4.1a.),
wobei E die Extinktion bezeichnet. Als Durchlässigkeit D wird in der IR-Spektroskopie das
Verhältnis aus der Strahlungsintensität I nach Probendurchtritt und der Strahlungsintensität I0
vor Eintritt in die Probe definiert. Die Parameter I und I0 stehen mit der Extinktion E (1.4.1a.)
Einleitung 13
in folgender Relation:
II E
=⋅
010 (1.4.1b.).
Aus 1.4.1a. und 1.4.1b. folgt somit:
log IIcd E
0
=⋅⋅=
ε
(1.4.1c.).
Dem Begriff der Extinktion entspricht in der englischsprachigen Literatur der Terminus
absorbance. Da der Begriff der Absorption im deutschsprachigen Raum mit 1-D definiert
wurde, können somit strenggenommen absorbance und Absorption nicht gleichgesetzt werden.
Trotzdem werden beide Begriffe häufig synonym verwendet und unter der Absorption zumeist
die Extinktion verstanden.
Die Parameter I, I0, ε (und damit auch E) sind frequenzabhängig. Die Verteilung der Extinktion
E als Funktion der Frequenz f (bzw. der Wellenzahl ) soll in der vorliegenden Arbeit als
Spektrum bezeichnet werden, obwohl auch alternative Darstellungsformen wie
Transmissionsspektren mit D = f( ) sehr weit verbreitet sind.
1.4.2. Die Fourier Transform Infrarot (FTIR)-Spektroskopie
Die konventionelle IR-Spektrometrie, bei welcher das IR-Licht einer polychromatischen IR-
Quelle durch Gitter oder Prismen in die einzelnen spektralen Bestandteile aufgespalten wird
und die einzelnen Wellenlängen separiert detektiert werden, wurde mit der Entwicklung der
Rechentechnik fast vollständig durch die Fourier Transform Infrarot (FTIR) Spektroskopie
verdrängt. Das physikalische Prinzip der FTIR-Spektroskopie beruht auf der Aufspaltung des
Gesamt-IR-Strahls mittels eines Strahlteilers in zwei einzelne Teilstrahlen, welche durch eine
wie in Abb. 1.4.2a dargestellte optische Anordnung wieder zusammengeführt und zur
Interferenz gebracht werden. Die optische Weglängendifferenz (= 2xi) beider interferierender
Teilstrahlen kann durch einen beweglichen Spiegel moduliert werden. Diese Anordnung wurde
erstmals von Michelson [Michelson, 1927] vorgestellt und ist in der Folgezeit vielfach
modifiziert worden [Griffiths, 1986]. Die grundlegende Aufbau eines sogenannten Michelson-
Interferometers ist in Abb. 1.4.2a. schematisch abgebildet.
14 Einleitung
Abb. 1.4.2a. Schematische Darstellung eines Michelson-Interferometers, bestehend aus einem festen Spiegel,
einem beweglichen Spiegel sowie einem Strahlteiler. Die optische Weglängendifferenz beträgt das Zweifache der
Spiegelauslenkung xi. Diese Größe kann sehr genau mittels eines HeNe-Lasers optisch bestimmt werden.
Die am Detektor anliegende Strahlungsintensität des IR-Lichtes wird als Funktion der optischen
Weglängendifferenz beider Teilstrahlen aufgezeichnet (Interferogramm), wobei die interne
Kalibrierung der Position des beweglichen Spiegels durch einen HeNe-Laser mit einer
Wellenlänge von 633 nm erfolgt. Ein Interferogramm stellt somit die Intensität der IR-
Strahlung als Funktion der Position des beweglichen Spiegels dar. Aus dieser Information kann
durch die Fourier-Transformation die spektroskopisch interessierende Intensitäts-Frequenz-
Verteilung des IR-Signals berechnet werden. Generell gilt, daß die physikalische Auflösung,
welche in einer FTIR-spektroskopischen Messung erzielt werden kann, in einem direkten
Zusammenhang mit der maximalen Auslenkung des beweglichen Spiegels xmax steht: je länger
der Spiegelweg, desto höher die physikalische Auflösung. Die Feinstruktur der Infrarotspektren
ist folglich vor allem in den Flanken des Interferogramms enthalten.
Gegenüber der dispersiven IR-Spektroskopie bietet die FT-Technik mehrere wesentliche
Vorteile. Zum einen wird die Strahlung gleichzeitig über den gesamten Frequenzbereich am
Detektor aufgezeichnet (Multiplex- oder Felgett-Vorteil). Zum anderen kann durch die
Laserkalibrierung die Position des beweglichen Spiegels mit höchster Genauigkeit bestimmt
werden, was eine exakte Berechnung von Frequenzwerten ermöglicht (Wellenzahlgenauigkeits-
oder Connes-Vorteil). Zudem tritt bei dispersiven Geräten, bedingt durch die Verwendung von
Monochromatoren (Prismen oder Gittermonochromatoren), ein erheblicher Verlust an
Strahlungsintensität auf, während bei FT-Geräten Strahlung über den gesamten
Frequenzbereich am Detektor registriert werden kann (Durchlässigkeits- oder Jaquinot-Vorteil).
Einleitung 15
Bei dispersiven Spektrometern ist die Aufnahmegeschwindigkeit eines Spektrums eng mit der
geforderten physikalischen Auflösung verbunden, wobei die Meßzeit im Minutenbereich liegt.
Die Zeitdauer einer FTIR-Messung ist dagegen nur durch die Geschwindigkeit des beweglichen
Spiegels limitiert, so daß Spektrenakquisitionen bis in den ms-Bereich hinein möglich sind
(Zeitvorteil). Indem man viele einzelne Interferogramme vor der Fourier Transformation
mittelt, kann eine enorme Verbesserung des Signal/Rausch Verhältnis (S/N) erzielt werden.
Neben den genannten Vorzügen der FT-Technik muß im Rahmen der vorliegenden Arbeit ein
weiterer Aspekt unbedingt angegeben werden: sämtliche FTIR-Spektren sind berechnete
Spektren, d.h. sie liegen in bereits digitalisierter Form auf einem Datenträger eines Computers
für die nachfolgenden Auswerteschritte bereit. Dieser Vorteil wird selten in der Literatur
erwähnt. Die Anfertigung der vorliegenden Arbeit wäre jedoch bei der Fülle des
aufgezeichneten Spektrenmaterials ohne diese Vorbedingung praktisch nicht realisierbar
gewesen.
Der erhebliche Rechenaufwand zur Fourier-Transformation bei der Umrechnung vom
Interferogramm zum Spektrum ermöglichte den breiten Einsatz der FT-Technik erst seit den
siebziger Jahren. Die stürmische Entwicklung der Informationstechnologie und die Anwendung
effizienterer Rechenalgorithmen wie der Fast Fourier Transformation (FFT) führten seitdem zu
einer fast vollständigen Verdrängung dispersiver IR-Spektrometer.
Auf eine Besonderheit der FT-Technik soll in diesem Kapitel noch eingegangen werden.
Bedingt durch einen nur endlich möglichen Betrag der maximalen Spiegelauslenkung xmax
wird im aufgezeichneten Interferogramm eine Unstetigkeitsstelle (endlicher Sprung) im Punkt
der maximalen Spiegelauslenkung beobachtet. Die Fourier-Transformation an dieser
Unstetigkeitsstelle hat zur Folge, daß das resultierende Frequenz-Intensitäts-Spektrum durch
eine Kosinusfunktion moduliert wird. Zur Vermeidung dieses auch als fringing bezeichneten
Abbrucheffektes werden in der FT-Technik die Interferogramme mit speziellen
Apodisationsfunktionen mit dem Ziel multipliziert, die resultierende Funktion vor der
Unstetigkeitsstelle auf Nullwerte zu glätten. Damit verbunden ist allerdings auch ein
Informationsverlust an den Flanken des Interferogramms, was sich praktisch wie eine
Reduzierung der physikalischen Auflösung auswirkt. In der Literatur findet man eine Vielzahl
verschiedener Apodisierungsfunktionen, die sich untereinander durch eine unterschiedliche
Glättung der Interferogramme um die Unstetigkeitsstellen - und damit durch eine mehr oder
weniger starke Verminderung der resultierenden Auflösung - unterscheiden. In dieser Arbeit
wurde ausschließlich mit einer "schwachen", d.h. relativ wenig glättenden
Apodisierungsfunktion (Happ-Genzel) gearbeitet. Übersichten zu verschiedenen, in der FTIR-
spektroskopischen Praxis verwendeten Apodisierungsfunktionen sind in der Literatur reichlich
vorhanden [z.B. Griffiths, 1986].
An Ein-Strahl Geräten muß vor der Vermessung der Probe die spektrale Charakteristik des
gesamten Spektrometers als sogenanntes Einkanal-Hintergrundspektrum aufgezeichnet
16 Einleitung
]
log
10
[
= E( )
ν
I()
0
ν
I( )
ν
Fourier Transformation Fourier Transformation
Abb. 1.4.2b. Schematische Darstellung zur Vorgehensweise bei der Berechnung von IR-Spektren E = f( )
mittels der FT-Technik an Ein-Strahl Geräten. Nacheinander werden Interferogramme der leeren Probenkammer
sowie durch die Probe aufgenommen. Im Anschluß kann die Berechnung der Intensitäts-Frequenz-Verteilungen
als Einkanal-Hintergrund oder -Probenspektrum erfolgen. Extinktionsspektren erhält man, indem der
Logarithmus des Quotienten I0/I als Funktion der Frequenz ermittelt wird.
Einleitung 17
werden. Diese Spektren beinhalten Informationen über die spektrale Verteilung der
Strahlungsintensität der polychromatischen IR-Quelle (zumeist ein Stift aus Siliziumkarbid:
Globar), spektrale Charakteristika des Strahlteilers (meist aus germaniumbeschichtetem KBr),
sowie der optischen Fenster im Strahlengang und - wie im Falle der IR-Mikroskopie - der
jeweils verwendeten IR-Objektive. Indem ein Einkanal-Hintergrundspektrum durch ein
Einkanal-Probenspektrum dividiert wird (und der Quotient logarithmiert wird) erhält man ein
Extinktionsspektrum, welches nunmehr nur noch Informationen über die Probe enthält. Eine
Übersicht zur Vorgehensweise zur Berechnung von Extinktionsspektren ist in der Abb. 1.4.2b
dargestellt.
1.4.3. IR-Spektroskopie an Proteinen
An Proteinspektren im mittleren Infrarotbereich (MIR-Bereich von 4000 - 400 cm-1) kann man
verschiedene charakteristische Banden beobachteten, welche in systematischen Arbeiten den
Schwingungen der Aminosäureseitengruppen [Chirgadze, 1976] bzw. denen des
Peptidrückgrates zugeordnet wurden [Miyazawa, 1958]. Die Schwingungsmoden des
Peptidrückgrates werden als Amid-Banden bezeichnet und wurden anhand der Modellsubstanz
N-Methylacetamid sowohl theoretisch als auch experimentell bestimmt [Miyazawa, 1958]. IR-
spektroskopisch von besonderem Interesse ist die Amid I-Bande (vgl. Tab. 1.4.3.). Diese beruht
hauptsächlich auf einer C=O Streckschwingung, welche mit einer C-N Streckschwingung, einer
N-H Deformationsschwingung sowie einer C-C-N Deformationsschwingung gekoppelt ist. Der
genaue Frequenzwert der Amid I-Bande bei Proteinen ist allerdings von der Stärke der
intramolekularen Wasserstoffbrücken im Peptidrückgrat (>N-H·····O=C<) und damit auch von
der Art der ausgebildeten Sekundärstruktur des Proteins abhängig. Durch eine Analyse der
Amid I-Bande können somit Rückschlüsse auf die Sekundärstruktur des untersuchten Proteins
gezogen werden. In Arbeiten verschiedener Autoren ist die Vorgehensweise zur Bestimmung
der Sekundärstruktur von Proteinen mittels der FTIR-Spektroskopie hinreichend beschrieben
[vgl. Krimm, 1962; Fabian, 1993]. Hinweise auf mögliche Fehlerquellen sind in einer
kritischen Abhandlung von Surewicz zu finden [Surewicz, 1993]. Die Absorptionen der
Aminosäureseitengruppen tragen mit ca. 10-30% zur Gesamtabsorption im Amid I-Bereich bei
globulären Proteinen bei [Chirgadze, 1975]. Ähnlich wie die Amid-Banden können sie wichtige
Strukturinformationen liefern. So bewirkt beispielsweise die Protonierung einer Asp-
Seitenkette (Protein in einer H2O-Lösung) eine Verschiebung des Maximums dieser Bande von
1584 zu 1716 cm-1 [Venyaminov, 1990] Als zweites Beispiel soll hier der Einfluß der
unmittelbaren Umgebung auf den Frequenzwert der "Tyrosinbande" (Ringschwingung der
aromatischen Seitengruppe) bei 1515 cm-1 erwähnt werden. In hydrophober Umgebung ist das
Maximum dieser Bande bei relativ niedrigen Frequenzwerten zu finden. Wenn z.B. bei
größeren konformationellen Änderungen des Proteins die Tyrosin-Seitenketten direkt dem
Lösungsmittel, d.h. H2O ausgesetzt werden, ist typischerweise eine Verschiebung der
Absorptionsmaxima hin zu höheren Wellenzahlen zu beobachten.
18 Einleitung
Bandenposition (cm-1) Bandenzuordnung
1620-1695 Amid I: 80% CO (s), CN (s), CCN (d)- (iE)
1685 (w),
1668 (vw), 1632 (s) Antiparalleles β-Faltblatt §
1648 (w), 1632 (s) Paralleles β-Faltblatt §
1650 (s), 1646 (w) α-helikale Strukturen §
1660 - 1700 β-, γ-turns §
1658 Ungeordnete Strukturen
§
1550 Amid II: 60% NH (be), 40% CH (s), CO (b), CC (s), NC (s) - (iE)
1330-1200 Amid III: 40% CN (s), 30% NH (be), 20% CC (s,m), CO (be) - (iE)
630 Amid IV: 40% CO (b); 30% CC (s,m), CNC (d) - (aEh)
730 Amid V: NH (ba), CN (t) - (aEh)
600 Amid VI: CO (ba), CN (t) - (aEh)
3300 Amid A: 100% NH(s) #- (iE)
3100 Amid B: 1. Oberton der Amid II-Mode (s) #- (iE)
Tab. 1.4.3. (s) - Streckschwingungen, (d) Deformationsschwingungen, (be) Beugeschwingungen in der Ebene, (m)-
Methyl-C-Streckungen, (ba) - Beugeschwingungen aus der Ebene heraus, (t) - Torsionsschwingungen, Alle
Prozentzahlen sind Schätzwerte der Verteilung der potentiellen Energie. Sie sind abhängig vom gewählten
Kraftfeld. (iE) - in der Ebene, (aEh) - aus der Ebene heraus (vw) - sehr schwach, (w) - schwach, (s) - stark, #
Schwingungen über Fermi-Resonanz gekoppelt; § Zuordnung z.T. nur ungenau möglich [nach Krimm, 1962].
1.4.4. IR-Spektroskopie an biologischen Membranen
Isolierte biologische Membranen werden seit ca. 20 Jahren systematisch mit der Methode der
FTIR-Spektroskopie untersucht. Biologische Membranen sind in aller Regel Bilayerstrukturen,
welche in ihrem Lipidanteil hauptsächlich aus verschiedenen Phospholipiden (PL), Cholesterol
und Sphingolipiden bestehen. Eine Vielzahl von Zellorganellen, wie das endoplasmatische
Retikulum, der Golgi Apparat, die Kernmembran, die zytoplasmatische Membran (ZM),
Mitochondrien sowie weitere vesikuläre Strukturen (Peroxisomen, Lysosomen etc.), werden
von Bilayerstrukturen gebildet. Die Fläche der intrazellulären Membransysteme übersteigt
dabei die Fläche der ZM um mindestens das 10-fache, so daß an Zellen bzw. Geweben
gewonnene spektroskopische Membranparameter vor allem Rückschlüsse auf die
intrazellulären Membranstrukturen zulassen.
Von spektroskopischem Interesse sind besonders die Absorptionsbanden der C-H Streck- und
Deformationsschwingungen der >CH2 und -CH3-Gruppen, die Ester-Karbonylbanden
(Übergangsbereich der PL) sowie die PO2--Banden (Kopfgruppen der Phospholipide, vgl. Tab.
1.4.6.). Diese "Markerbanden" erlauben es, strukturelle Information aus verschiedenen
Membrantiefen zu gewinnen und Parameter wie z.B. den Membranordnungsgrad - ein
indirektes Maß für die Fluidität einer Membran - abzuleiten. In der Literatur existieren eine
Vielzahl von Studien, welche den Einfluß von Veränderungen äußerer physikochemischer
Parameter wie Temperatur, Druck, Wassergehalt, Ionenkonzentration, Konzentration
intrinsischer und extrinsischer Proteine auf das Phasenverhalten von Lipiddoppelschichten zum
Thema haben [Review: Casal, 1984]. Medizinisch relevante Fragestellungen wurden mit der
Einleitung 19
FTIR-Spektroskopie zum Thema Oberflächenspannung des pulmonalen Surfactant-Faktors
[Krill, 1994] und zum Thema Alterung und Katarakt der Linse des menschlichen Auges
(anhand des Monitorings des Ordnungsgrades isolierter vesikulärer Lipidstrukturen) bearbeitet
[Borchmann, 1991; Sato, 1996].
1.4.5. IR-Spektroskopie an Nukleinsäuren
Aus didaktischen Gründen werden an FTIR-Spektren von Nukleinsäuren häufig 4 spektrale
Bereiche unterschieden [Liquier, 1996]:
1780 - 1550 cm-1. In-plane Schwingungen von Doppelbindungen der Basen. Die
Absorptionsbanden in diesem spektralen Abschnitt sind sensitiv gegenüber Effekten wie
Basenpaarung und stacking. Die Identifizierung der Basen anhand charakteristischer
Absorptionsbanden (Cytosin: 1647 und 1603 cm-1; Thymin: 1720 und 1660; Guanin: 1690 und
1630 cm-1; Adenin: 1665 und 1605 cm-1; Uracil: 1700, 1680 und 1650 cm-1) ist möglich. Beim
Temperatur-induzierten Aufschmelzen von Doppelstrang DNA (B-Form) können spektrale
Effekte während der Aufhebung der Basenpaarungen studiert werden.
1550 - 1270 cm-1. In diesem Bereich werden die Deformationsschwingungen der Basen, welche
ihrerseits glykosidisch mit den Zuckerschwingungen gekoppelt sind beobachtet. Die
Frequenzwerte dieser Banden hängen stark vom glykosidischen Torsionswinkel ab.
1270 - 1000 cm-1. Zwei starke Absorptionsbanden PO2- (as. und sy.) bei ca. 1230 und 1090 cm-1
dominieren diesen spektralen Abschnitt. Zusätzlich werden Zuckerschwingungen beobachtet.
1000 - 780 cm-1. Neben Schwingungen des Zucker-Phosphat-Rückgrates werden in diesem
Bereich vor allem Zuckerringschwingungen (sugar pucker) und out of plane-
Basenschwingungen beobachtet. Die IR-spektroskopische Differenzierung zwischen DNA und
RNA ist anhand mehren Banden in dieser Region möglich: bei 967 cm-1 wird (nur bei DNA)
eine C-C Streckschwingung eines Diethylphosphatrestes beobachtet [Shimanouchi, 1967]. Drei
weitere Banden (915, 870, 815 cm-1) werden den Ribose-Phosphat-Rückgratschwingungen
zugeschrieben und sind deshalb typisch für RNA [Parker, 1983]. Ebenfalls nur bei RNA wird
eine IR-Bande bei der Position von 1116 cm-1 aufgefunden. Diese wurde ebenfalls einer
Riboseschwingung (in der 2´ Position) zugeordnet [Tsuboi, 1963].
Die beschriebenen Bandenpositionen wurden an isolierten Nukleinsäuren ermittelt und sind
somit nicht immer auf komplexe biologische Systeme übertragbar. Chromosomale DNA ist
beispielsweise in den verschiedenen Stadien des Zellzyklus (G1, S, G2, Mitose) verschieden
kompakt und somit unterschiedlichen Umgebungen ausgesetzt (räumliche Nähe zu
Histonproteinen, Wasserexposition etc.). Zudem sind während der Mitose die Chromosomen
extrem kompakt, so daß an diesen entweder Totalabsorption oder Streuung von IR-Strahlung
stattfindet [Diem, M., 1999]. All diese Effekte sind bis jetzt kaum untersucht und können
besonders in mitotisch aktiven Geweben wie Malignomen den erwarteten spektralen Effekt,
z.B. einer erhöhten Kern/Plasma Relation stark überlagern.
20 Einleitung
1.4.6. IR-Spektroskopie an komplexen biologischen Proben
Biologische Strukturen sind aus einer Vielzahl kompliziert aufgebauter Makromoleküle
zusammengesetzt. Die Infrarotspektren biologischer Proben (Gewebe, Mikroorganismen,
Körperflüssigkeiten) sind deshalb durch extreme Überlagerung sehr vieler unterschiedlicher IR-
Banden charakterisiert. Diese Tatsache erschwert in vielen Fällen die direkte Interpretation von
IR-Spektren ganz erheblich. Nur in Einzelfällen, z.B. wenn bestimmte Einzelsubstanzen, wie
das Kollagen des Bindegewebes oder Speichersubstanzen von Mikroorganismen, in großen
Konzentrationen vorliegen und/oder "atypische" Banden zeigen (wie beispielsweise die Amid
III-Schwingungsmoden des Kollagens), können unmittelbare Schlußfolgerungen anhand
spezifischer Banden aus den Spektren gezogen werden.
Einzelne Bandenparameter (wie diskrete Frequenz- oder Extinktionswerte) eignen sich in der
Mehrzahl der Fälle nur bedingt zu Charakterisierungs- und Identifizierungszwecken des
biologischen Materials. Um die zweifellos vorhandene Heterogenität der Proben vollständig zu
erfassen, wurden deshalb bereits in der Vergangenheit multivariate statistische Methoden zur
Datenevaluation herangezogen [Naumann, 1991; Helm, 1991].
In der nachfolgenden Tabelle (Tab. 1.4.6.) sind noch einmal einige der wichtigsten IR-
Absorptionsbanden, welche in IR-Spektren komplexer biologischer Proben beobachtet werden
können mit den vorläufigen Zuordnungen zusammengefaßt.
1656
1731
2853
3295
3068
2924
2872
2958
1400
1234
1080
1450 1543
Abb. 1.4.6. Übersichtsspektrum einer Gewebeprobe im mittleren Infrarotbereich. Die Positionen ausgewählter IR-
Banden werden in Wellenzahlen angegeben (vgl. auch Tab. 1.4.6.).
Einleitung 21
Bandenposition (cm-1) Bandenzuordnung
~ 3300 Amid A, N-H-Streckschwingung, Proteine.
~ 3100 Amid B, N-H Streckschwingung mit 1. Oberton der Amid I-Bande in
Resonanz (Fermi), Proteine.
~ 3010 C-H Streckschwingung (C=CH2, olefinisch); Lipide, Cholesterol,
Ester.
~ 2920 bzw. 2850 C-H Streckschwingung (>CH2, Methylen) antisymmetrisch/
symmetrisch, Lipide, Proteine, Kohlenhydrate, Nukleinsäuren.
~ 2956 bzw. 2872 C-H Streckschwingung (-CH3, Methyl) antisymmetrisch/
symmetrisch, Lipide, Proteine, Kohlenhydrate, Nukleinsäuren.
~ 1745 - 1735 C=O Streckschwingungen, Ester der Phospholipide,
Karbonylfunktionen von Thymin und Uracil.
~ 1620 - 1695 Amid I-Bande mit sekundärstrukturrelevanten Bandenstrukturen der
Proteine.
~ 1550 Amid II-Bande. Proteine.
~ 1515 Ringschwingung der Tyrosinseitenketten.
~ 1468 >CH2 Deformationsschwingungen, sym. ("Scherendeformation").
~ 1400 C=O Streckschwingungen der -COO--Gruppen (Fettsäuren,
Aminosäureseitengruppen).
~ 1380 -CH3 Deformationsschwingungen, sym. ("Regenschirm").
~ 1310 - 1240 Amid III-Bande. Proteine.
~ 1250 - 1220 P=O, antisymmetrische Streckschwingungen der >PO2--Gruppen.
Phospholipide, Nukleinsäuren.
~ 1170 C-O-C Streckschwingung, antisymmetrisch, Phospholipide.
Cholesterol, Ester.
~ 1080 P=O, symmetrische Streckschwingungen der >PO2--Gruppen.
Phospholipide, Nukleinsäuren.
~ 1060 C-O-C Streckschwingung, symmetrisch. Phospholipide, Cholesterol,
Ester.
Tab. 1.4.6. Tabellarische Übersicht prominenter Banden in IR-Spektren komplexer biologischer Proben wie
kompletter Zellen, Gewebestrukturen oder Mikroorganismen [nach: Naumann, 1996; Jackson, 1997].
1.5. Spektrenauswertung
Die Bildrekonstruktion auf der Grundlage IR-mikrospektrometrischer Daten histologischer
Dünnschnitte ist ein zentrales Thema dieser Arbeit. Der grundlegende Ansatz aller im
folgenden beschriebenen Verfahren ist es, von den IR-Spektren abgeleitete Parameter zu
definieren, welche ausreichend für eine sichere Differenzierung, Klassifizierung und
Identifizierung der jeweiligen histologischen Struktur sind. Verschiedene uni- und multivariate
statistische Methoden, Ansätze zur Datenreduktion sowie Klassifizierungsverfahren wurden auf
ihre Verwendbarkeit für die Bildrekonstruktion getestet und werden deshalb in den nächsten
Abschnitten vorgestellt.
22 Einleitung
1.5.1. Bildgebung mittels konventioneller Bandenanalyse
Dieses Verfahren zur Bildrekonstruktion aus FTIR-mikrospektrometrischen Daten beruht auf
der Idee, einzelne bzw. kombinierte Bandenparameter, wie z.B. Extinktionswerte,
Halbwertsbreiten oder Frequenzwerte, als Funktion der (x,y)-Ortskoordinaten des Spektrums
aufzutragen. In der resultierenden,
nun 3-dimensionalen Darstellung
entsprechen die z-Werte den
spektralen Parametern, während die
(x,y)-Koordinaten die
Ortsinformation des Spektrums
repräsentieren. Indem man
beispielsweise die z-Werte
farbcodiert, ist es möglich den
Informationsgehalt wieder 2-
dimensional als Farb- oder
Graustufenbild auszuweisen.
Dieser in der Literatur als chemical
mapping (CM) oder auch
functional group mapping
bezeichnete Ansatz zur
Bildrekonstruktion erlaubt es
somit, die spezifische Verteilung
einer funktionellen Gruppe bzw.
chemischen Substanz zu
visualisieren. Insbesondere wenn
die Absorptionsbanden der
geprüften Substanzen im IR-
Spektrum bekannt sind, separiert
vorliegen und die entsprechenden
Konzentrationen örtlich stark differieren, kann das CM schnell und effektiv zur Bildgebung
eingesetzt werden (siehe auch Abb. 1.5.1.). Einige medizinisch relevante Fragestellungen, wie
z.B. die Verteilung von β-Amyloid Plaques im Hirn von Alzheimer-Patienten in der post
mortem Analytik [Choo, 1996] oder der Test auf die Ruptur von Mamma-Silikonimplantaten
[Kidder, 1997], lassen sich mit der Methodik des chemical mapping hervorragend bearbeiten,
da sowohl das β-Amyloid als auch das Silikon substanzspezifische "Markerbanden" in den IR-
Spektren aufweisen. Bei der Sichtung des IR-spektroskopischen Datenmaterials menschlicher
Tumore stellte sich jedoch sehr schnell heraus, daß sich derartig spezifische Banden im
Infrarotspektrum nicht ohne weiteres auffinden lassen. Typischerweise wurde eine große
Anzahl diskreter spektraler Differenzen, welche über weite Bereiche der IR-Spektren verteilt
waren, aufgefunden [siehe auch: Helm, 1991; Naumann, 1993]. Aufgrund
.
1000
2000
3000
4000
1000
2000
3000
4000
0,00
0,05
0,10
0,15
0,20
0,25
0,30
Abb. 1.5.1. Darstellung der Konzentration einer spezifischen
Substanz (DMPEd54) als Funktion der (x,y)-Ortskoordinaten
(chemical mapping). In diesem Beispiel wurden 20 · 20 FTIR-
Spektren aufgenommen und die Extinktionswerte der CD2-
Streckschwingungsbande (sy.) bei 2089 cm-1 ausgelesen (z-
Werte). Die graphische Darstellung der Konzentration der
Substanz kann als Höhenprofil oder Farb- bzw. Graustufenbild
erfolgen.
Einleitung 23
dieser Spezifik wurde der Ansatz des CM nicht weiterverfolgt, vielmehr wurde versucht,
alternative Methoden zur Bildrekonstruktion zu entwickeln. Dabei erwiesen sich vor allem
multivariate statistische Verfahren wie Faktor- und Clusteranalyse, Verfahren zur
Datenreduktion sowie Hilfsmittel zur Mustererkennung wie Künstliche Neuronale Netze als
besonders hilfreich.
1.5.2. Faktoranalyse
Die Faktoranalyse ist ein häufig verwendetes multivariates Verfahren zur Datenanalyse, das
ursprünglich für Problemlösungen in der Psychologie entwickelt wurde [Lawley, 1960 & 1963;
Maxwell, 1956].
Als allgemeine Aufgabenstellung der Faktoranalyse läßt sich formulieren, daß aus einer Anzahl
von n Individuen, von denen jedes durch einen Merkmalsbereich mit m Merkmalsvariablen
charakterisiert ist, neue Variablen (Faktorladungen) zu definieren sind, welche untereinander
nicht korrelieren, d.h. voneinander unabhängig (orthonormal) sind. In der vorliegenden Arbeit
soll nicht auf die mathematischen Grundlagen der Faktoranalyse eingegangen werden [vgl.
Weber, 1980], vielmehr soll die Methode nur soweit erläutert werden, wie es für das
Verständnis der hier eingesetzten Methodik der IR-Bildrekonstruktion notwendig ist.
Allgemein geht man in der Faktoranalyse von folgender Annahme aus: An n Individuen sind m
Merkmale gemessen oder beobachtet worden. Der gesamte Merkmalssatz bildet eine Matrix X,
bestehend aus m n-gliedrigen Zeilenvektoren. Die Zeilen der Matrix X entsprechen den m
Merkmalsvariablen und die Spalten den n Individuen.
X
x
x
x
x
xx x x
xx x x
xx x x
xx x x
i
m
jn
jn
ii ij n
m m mj mn
=
=
1
2
11 12 1 1
21 22 2 2
12 3
12
.
.
..
..
......
..
......
..
(1.5.2a.)
Die geometrische Deutung der Datenmatrix X ist der Variablenraum, wobei die Vektoren x1,
x2,.. xm diesen m-dimensional aufspannen.
Zu untersuchen ist, ob sich mittels der Faktoranalyse Aussagen über die Struktur des
Merkmalbereichs machen lassen und ob sich die Beziehungen zwischen den m Variablen auf s
Faktoren reduzieren lassen (mit s < n). Dazu wird die multidimensionale Datenmatrix X derart
rotiert, daß der Masseschwerpunkt der Datenmatrix den Ursprung eines neuen
multidimensionalen und orthonormalen Koordinatensystems bildet, wobei die Achsen
(Faktoren) varianzgewichtet, d.h. nach ihrem Informationsgehalt angeordnet werden. Die
Beziehung zwischen den Merkmalsvariablen xi und den s Faktoren f1, f2, .., fp, ..., fs kann für
das i-te Merkmal und für das j-te Individuum durch das lineare Modell
xij = ai1f1j + ai2f2j + ...+ a kpfkj +... + aisfsj (1.5.2b.)
24 Einleitung
vollständig beschrieben werden. Die Koeffizienten aij werden in der Faktoranalyse als
Ladungen (loadings) bezeichnet. Je höher der Wert eines Koeffizienten, desto höher ist die
Variable x in dem entsprechenden Faktor geladen. Die Ladungen ändern sich von Merkmal zu
Merkmal, jedoch nicht die Faktoren. Da die Faktoren ihrem Informationsgehalt nach
angeordnet werden, repräsentieren die ersten k Faktoren den größten Anteil der Varianz,
während die restlichen s - k Faktoren vernachlässigt werden können. Es ist daher üblich, die
Gleichung (1.5.2b.) auch in der folgenden Form darzustellen:
xij = ai1f1j + ai2f2j + ...+ a kpfkj + e (1.5.2c.),
wobei mit e die Residuen bezeichnet werden. Weiterführende Berechnungen (z.B.
Clusteranalyse) können somit ohne Berücksichtigung von s - k Faktoren bei minimalem
Informationsverlust durchgeführt werden. Aus diesem Grunde werden faktoranalytische
Verfahren auch häufig zur Datenreduktion eingesetzt.
In Analogie zu den Vektoren xi können die Faktoren fi als Koordinatenachsen gewählt werden,
welche den s-dimensionalen Faktorraum aufspannen. In der Abb. 1.5.2. sind Variablenraum
und Faktorraum einander gegenübergestellt. In beiden Fällen sind die Individuen durch Punkte
charakterisiert, deren Koordinaten entweder den jeweiligen Meßwerten entsprechen
(Variablenraum) oder die Ladungen in den entsprechenden Faktoren widerspiegeln
(Faktorraum).
Abb. 1.5.2. Die geometrische Interpretation der Datenmatrix X als Variablenraum (links) und der Faktormatrix als
Faktorraum. 4 Individuen mit je 3 Merkmalen lassen sich in diesem Beispiel als 4 Punkte P1 - P4) in einem 3-
dimensionalen Variablenraum darstellen (links). Der rechte Teil der Abbildung zeigt den orthonormalen
Faktorraum (2-dimensional), in welchem die jeweiligen Individuen eindeutig durch ihre Koordinaten (Ladungen)
charakterisiert sind. Die reduzierte Dimensionalität gegenüber dem Variablenraum soll die Datenreduktion
widerspiegeln.
Einleitung 25
Es ist ohne weiteres möglich, die Ähnlichkeit zweier Spektren über euklidische Distanzen im s-
dimensionalen Faktorraum zu berechnen. Die Distanzen aller Spektren bezüglich eines
ausgewählten Koordinatenursprungs können für die faktoranalytische Bildrekonstruktion in
Analogie zu den Extinktionswerten beim chemical mapping in Farbintensitäten umgesetzt und
anschließend gegen die (x,y)-Ortskoordinaten aufgetragen werden.
1.5.3. Clusteranalyse (CLA)
Als Clusteranalysen werden Klassifizierungsverfahren bezeichnet, welche ausgehend von einer
Distanzmatrix der zu klassifizierenden Objekte diese in Gruppen oder Klassen (Cluster)
einteilen. Ziel ist es dabei, einander ähnliche Objekte in Klassen zusammenzufassen bzw. sich
stark unterscheidende Objekte in verschiedene Klassen einzugruppieren.
Clusteranalysen können in hierarchische und nicht-hierarchische Verfahren unterteilt werden,
wobei man bei ersteren nochmals zwischen aufsteigenden und absteigenden Verfahren
unterscheidet. Im folgenden sollen nur die in dieser Arbeit eingesetzten hierarchischen
aufsteigenden Klassifizierungsverfahren skizziert werden.
Der Algorithmus zur Klassifizierung kann durch folgendes Schema beschrieben werden:
1. Aus einer Anzahl von n Objekten werden anhand eines Ähnlichkeitsmaßes die beiden
einander ähnlichsten Objekte ermittelt und zu einem neuen Cluster fusioniert.
2. Die Abstände zwischen dem neuen Cluster und den restlichen n-2 Objekten werden
berechnet.
3. Nun werden (wie in Punkt 1) erneut die Objekte (oder auch Cluster) mit den geringsten
Abständen aufgesucht und fusioniert.
4. Es erfolgt eine erneute Abstandsberechnung für die verbliebenen n-3 Objekte. Dieses
Verfahren wird so oft wiederholt, bis alle Objekte in einem Cluster vereinigt sind.
Die verschiedenen Methoden oder Algorithmen der Clusteranalyse unterscheiden sich
voneinander durch die Art und Weise der Neuberechnung der Distanzen.
Aus den unter 1. bis 4. beschriebenen Arbeitsschritten ist ohne weiteres ersichtlich, daß das
beschriebene Verfahren keinerlei zusätzliche Information zur Klassifizierung benötigt (nicht-
überwachte Klassifikation). Dies ermöglicht es, Klassifizierungen ausschließlich auf Grundlage
der IR-mikrospektrometrischen Information durchzuführen.
Die Ermittlung spektraler Distanzen zweier Spektren. Die Distanzmatrix D.
Zur Berechnung der spektralen Distanzen zwischen zwei normierten Spektren wurden der
Pearson´sche Produktmoment Korrelationskoeffizient r bestimmt:
ryy nyy
yny yny
yy
i
i
n
i
i
i
n
i
i
n
12
1
1212
1
2
11
22
2
12
2
=
−⋅ ⋅
−⋅
⋅−
=
==
∑∑
(1.5.3a.),
26 Einleitung
wobei y1i und y2i die jeweiligen y-Werte (Extinktionswerte bzw. Werte der 1. oder 2.
Ableitung) bei einer definierten Wellenzahl i und y1 und y2 die arithmetischen Mittel von y über
alle Wellenzahlen bezeichnen. Die Größe n bezeichnet die Anzahl der Datenpunkte (spektraler
Stützpunkte). Der Pearson`sche Produktmoment Korrelationskoeffizient r wurde mittels
folgender Transformation in die spektrale Distanz d (oft auch als D-Wert bezeichnet)
umgerechnet:
()
dr
yy yy12 12
1 1000=− (1.5.3b.),
Der Korrelationskoeffizient ry1y2 kann Werte zwischen 1 (identische Objekte), 0 (keine
Ähnlichkeit) und -1 (vollständig negative Korrelation) annehmen. Folglich bewegen sich die D-
Werte im Bereich von 2000 (negative Korrelation) und 0 (Identität). Wurden insgesamt n
Spektren untersucht, können die Ergebnisse des Vergleichs aller Spektren untereinander in
Form einer symmetrischen Distanzmatrix D zusammengefaßt werden:
D
ddd d
ddd d
ddd d
ddd d
n
n
n
nnn nn
=
⋅⋅⋅
11 12 13 1
21 22 23 2
31 32 33 3
123
(1.5.3c.).
Aus Gleichung 1.5.3a. folgt, daß dij = dji. Außerdem folgt aus den Gleichungen 1.5.3a. und
1.5.3b. im Falle von i = j: dij = 0.
Neben den D-Werten können auch alternative spektrale Abstandsmaße als Grundlage der
Clusteranalyse Anwendung finden. Wie in Kapitel 1.5.2. bereits erwähnt, kann die
Faktoranalyse auch zur effektiven Datenreduktion benutzt werden. Euklidische Distanzen im k-
dimensionalen Faktorraum können ebenso wie die D-Werte für eine Clusteranalyse verwendet
werden (siehe auch Abb. 1.5.3.)
Die verwendeten Algorithmen zur Clusteranalyse griffen auf die in der symmetrischen
Distanzmatrix D zusammengefaßten Distanzen zurück. Wie bereits erwähnt, unterscheiden sich
die verschiedenen clusteranalytischen Verfahren u.a. durch die Art der Neuberechnung der
spektralen Distanzen (Punkt 2 des CLA-Algorithmus). Beim häufig verwendeten Ward´schen
Algorithmus wird die spektrale Distanz dneu,i des aus den Clustern q und p (mit nq und np
Objekten) neugebildeten Clusters zu einem Cluster i mit ni Objekten folgendermaßen
berechnet:
()()
[]
dnn nnd nnd nd
neu i ipi pi qi qiiqp,=+
⋅+++
1 (1.5.3d),
wobei n die Anzahl aller Objekte der Analyse bezeichnet. Ein Vorteil des Ward´schen
Algorithmus ist die Generierung sehr dichter Cluster. Aus einer großen Anzahl weiterer
Clusteralgorithmen soll hier nur noch die average linkage Methode vorgestellt werden. Bei
dieser werden die Distanz des neuen Clusters dneu,i zum Cluster i durch eine ungewichtete
Mittelwertsbildung bestimmt:
Einleitung 27
()
ddd
neu i pi qi,=⋅ +
1
2 (1.5.3e).
Die Ergebnisse der Clusteranalyse lassen sich in Form von Dendrogrammen veranschaulichen.
Je niedriger die Fusionsniveaus zweier Individuen berechnet wurden, desto ähnlicher sind sich
letztere. In nachfolgender Abb. 1.5.3. ist exemplarisch das Resultat einer Clusteranalyse als
Dendrogramm dargestellt.
1.5.4. Definition spektraler Fenster
Die zur Charakterisierung von biologischen Proben erforderliche IR-spektroskopische
Information ist nicht gleichmäßig über den mittleren Infrarotbereich (ca. 4000 - 400 cm-1)
verteilt. Neben dem wichtigsten spektralen Bereich von 1480 - 900 cm-1 sind unter den
Konturen der Amid I- und Amid II-Banden (um 1660 bzw. 1550 cm-1) sowie im C-H und N-H
Streckschwingungsbereich (3400 - 2800 cm-1) für Identifizierung und Klassifizierung
verwendbare spektrale Charakteristika auffindbar. Große Bereiche der Spektren, beispielsweise
von 2800 - 1800 cm-1 sind dagegen scheinbar leer und enthalten kaum verwertbare
spektroskopische Information.
Heterogenität
543210
Wards Algorithmus
Abb. 1.5.3. Die Ergebnisse einer Clusteranalyse in Form eines Dendrogramms. Je geringer die Fusionsniveaus
zweier Individuen (Spektren) ausfallen, desto ähnlicher sind diese einander. Die Werte der Fusionsniveaus zweier
Individuen bzw. Cluster sind an der x-Achse ablesbar und in Form senkrechter Verbindungen in der baumartigen
Gesamtstruktur dargestellt.
In diesem Beispiel wurden 300 FTIR-Spektren mittels Faktoranalyse transformiert und insgesamt 6 Faktorladungen
f2-f7 für die Clusteranalyse herangezogen. Als Abstände wurden euklidische Distanzen im hier 6-dimensionalen
Faktorraum herangezogen (vgl. Text).
28 Einleitung
Multivariate Analyseverfahren zur Erkennung spektraler Muster erfordern meist einen sehr
hohen Rechenaufwand. Es lag daher auf der Hand, daß eine sinnvolle Datenreduktion,
beispielsweise durch die systematische Suche nach Anzahl und Grenzen von sogenannten
"spektralen Fenstern", stattfinden mußte. Die Festlegung von Spektrenabschnitten, welche die
zur sicheren und effektiven Charakterisierung erforderliche spektrale Information enthalten,
führt einerseits zu einer deutlichen Reduktion der Datenmenge und ermöglicht zudem neben
einer verbesserten Sicherheit der Zuordnung auch wichtige strukturelle Aussagen bezüglich der
untersuchten Gewebeproben.
Die bereits angesprochenen, scheinbar "leeren" spektralen Bereiche (wie z.B. von 2800 - 1800
cm-1) wurden im Rahmen der vorliegenden Arbeit mit keinem Analyseverfahren näher
untersucht, während in den übrigen Spektrenabschnitten aufwendige computergestützte Such-
und Optimierungsverfahren zur Auffindung der "spektralen Fenster" eingesetzt wurden.
Voraussetzung für den Einsatz der im folgenden kurz vorgestellten, auch optimal region
selection (ORS) genannten Verfahren war die Kenntnis der Klassenzugehörigkeit der Objekte,
d.h. der FTIR-Gewebespektren.
Mit der sogenannten brute force calculation-Methode wurden alle denkbaren Kombinationen
der Grenzen spektraler Fenster auf ihre Effektivität für die Spektrenklassifikation getestet. Als
Entscheidungskriterium diente eine ermittelte Relation aus inter- und intra-Klassen Varianz.
Sollten beispielsweise 4 spektrale Fenster in FTIR-Spektren mit jeweils 3000 Datenpunkten
aufgefunden werden, so sind bei Einsatz dieser Methode C1000
410
414 10=⋅. Programmzyklen zu
durchlaufen. Ein Vorteil dieser Methode besteht darin, daß das globale Minimum des Fehlers
zwischen Vorgabewert und Klassifizierungswert in jedem Fall aufgefunden wird. Nachteilig
sind die teilweise extrem langen Programmlaufzeiten.
Der Einsatz eines stochastischen Such- und Optimierungsverfahrens, eines sogenannten
Genetischen Algorithmus (GA), verkürzte die Programmlaufzeiten erheblich. Dieser
Algorithmus bezieht seine Bezeichnung aus der groben Ähnlichkeit zu Prozessen in der
biologischen Evolution. Wie beim biologischen Vorbild gibt es eine Population von Individuen,
welche jeweils durch einen Genotyp und einen Phänotyp charakterisiert sind. Der Phänotyp ist
über eine Codierungsfunktion durch den Genotyp repräsentiert. Weiterhin ist die Fitneß jedes
Individuums durch eine Fitneßfunktion auf den Phänotyp berechenbar. Ziel des Verfahrens ist
es nun, die Fitneß zu maximieren. Üblicherweise werden durch Kreuzung zweier Individuen
neue Individuen einer neuen Generation erzeugt. Nach der Bestimmung der Fitneß werden
diese anhand der Fitneß einer Selektion unterworfen, d.h. es kommen bevorzugt Individuen mit
hoher Fitneß zur Fortpflanzung. Die neu erzeugten Individuen werden noch mit einer
einstellbaren Wahrscheinlichkeit einem Mutationsoperator unterworfen, welcher zufällig
Parameter des Genotyps invertiert. In der nachfolgenden Abbildung wurde versucht, diesen
Algorithmus anhand des Beispiels spektraler Fenster zu illustrieren.
Im konkreten Beispiel werden die Grenzen der spektralen Fenster (diese entsprechen dem
Genotyp) optimiert, indem sie als eine Maske über vordefinierte Spektrenklassen gelegt werden
(die Spektrenausschnitte entsprechen den Phänotypen). Anhand einer Linearen (LDA) oder
auch Quadratischen Diskriminanzanalyse (QDA) wird nun über einen leave one out-
Einleitung 29
Algorithmus die Klassenzugehörigkeit eines jeden Individuums bestimmt und der mean
squared error (MSE) zwischen Vorgabe und berechneter Zuordnung ermittelt. Dieser Fehler
entspricht der Fitneß. Je kleiner dieser Parameter, desto besser sind die spektralen
Eigenschaften in den Fensterausschnitten für die vordefinierte Spektrenklassenzuweisung
geeignet. Genotypen mit der besten Fitneß werden nun einem Kreuzungs- und
Mutationsoperator unterworfen, wobei die Individuen mit der besten Trennungsfunktion
(höchsten Fitneß) auch mehr Nachkommen generieren können. Anschließend können die
Phänotypen der f1-Generation bestimmt werden und diese wiederum einer LDA oder QDA
unterzogen werden. Dieser Zyklus läßt sich beliebig oft für n Generationen wiederholen.
Dieser hier nur kurz skizzierte Algorithmus wurde erstmals 1975 von Holland vorgestellt und
wird seitdem auf Optimierungsprobleme verschiedenster Art angewendet [Holland, 1975].
Phänotyp
Spektrenausschnitte
Genotyp
Grenzen spektraler Fenster L
i
Individuen der Generation 1 (P)
1:(L ,L )(L ,L )
2:(L ,L )(L ,L )
3:(L ,L )(L ,L )
12 34
34 56
48
37
Individuen der Generation 2 (f )
1
1:(L ,L );(L ,L )
2:(L ,L );(L ,L )
3:(L ,L );(L ,L )
12 78
34 78
12 56
Kreuzung
Mutation
Selektion
Kreuzung
Mutation
Selektion
L
1
L
2
L
3
L
4
L
4
L
6
L
6
L
4
L
4
L
8
L
8
L
8
L
3
L
5
L
5
L
3
L
3
L
7
L
7
L
7
L
2
L
2
L
1
L
1
Fitness
F
1
Fitness
F
2
Fitness
F
3
Fitness
F
4
Fitness
F
5
Fitness
F
6
LDA LDA
LDA LDA
LDA LDA
f
2
Abb. 1.5.4. Die Optimierung der für eine sichere Differenzierung/Klassifizierung/Identifizierung benötigten
spektralen Fenster mittels eines Genetischen Algorithmus. (LA,LB) bezeichnen die Grenzen eines beliebigen
Spektrenabschnittes. Mehrere dieser spektralen Fenster werden im Laufe des Verfahrens mittels einer Linearen
Diskriminanzanalyse auf ihre Verwendbarkeit zur optimalen Lösung eines - hier drei-Klassen-Problems geprüft.
Für weitere Erklärungen siehe Text.
30 Einleitung
Ergänzend soll noch hinzugefügt werden, daß es verschiedene Ansätze Genetischer
Algorithmen gibt. Als Genetische Algorithmen im engeren Sinne werden Verfahren bezeichnet,
deren Optimierung (Fitneßmaximierung) auf der Ebene des Genotyps stattfindet, während die
in dieser Arbeit verwendete Software eigentlich als den GA verwandte Evolutionsstrategie
bezeichnet werden müßte, da sie den Phänotyp zur Optimierung heranzieht [Goldberg, 1989].
Eine vergleichende Darstellung beider Ansätze findet sich in der Literatur [Bäck, 1991; Bäck,
1993].
1.5.5. Künstliche Neuronale Netze
Künstliche Neuronale Netze (Artificial Neural Networks, ANN) sind selbst-lernende
informationsverarbeitende Systeme, welche aus einer mehr oder weniger großen Anzahl
einfacher Einheiten (Zellen, Neuronen) bestehen. Über gerichtete Verbindungen (links) werden
Informationen ähnlich wie ein Aktionspotential beim biologischen Vorbild in Form von
Aktivierungen von Neuron zu Neuron weitergeleitet.
Die grobe Ähnlichkeit zu erfolgreichen biologischen Systemen (Säugerhirn) und die Tatsache,
daß es sich um lernfähige, massiv-parallele Systeme handelt, machen die Künstlichen
Neuronalen Netze für eine Vielzahl von Forschungsrichtungen interessant. In der Medizin, der
Biologie (speziell der Neurobiologie) stehen vor allem die Ähnlichkeiten mit den biologischen
Vorbildern im Vordergrund. Man versucht, durch Simulation der entsprechenden Modelle
Rückschlüsse auf noch ungeklärte Verhaltensweisen der biologischen Systeme zu ziehen. Im
Unterschied dazu werden beispielsweise in der Informatik ANN als Ansätze zur Erstellung
intelligenter Systeme (künstliche Intelligenz) verstanden. Künstliche Neuronale Netze liegen
zumeist in Form von spezieller neuronaler Hardware (Neurochips) oder in Form von
Programmen (Netzwerksimulatoren) vor.
In der vorliegenden Arbeit fanden Künstliche Neuronale Netze vor allem aufgrund ihrer
Lernfähigkeit Anwendung. Lernfähigkeit bedeutet hier, daß ein ANN eine Fähigkeit (wie
beispielsweise die Fähigkeit zur Klassifikation) selbständig aus Trainingsbeispielen erlernen
kann. Es ist somit nicht notwendig, die Implementierung von Algorithmen oder feststehenden
Regeln zur Differenzierung, Klassifizierung und Identifizierung in einem ANN vorzunehmen.
Weitere wichtige Eigenschaften Neuronaler Netze, wie Parallelität, verteilte
Wissensrepräsentation, hohe Fehlertoleranz, assoziative Speicherung von Information,
Robustheit gegen Rauschen, spontane Generalisierung und aktive Repräsentation,
prädestinieren die ANN zu optimalen Werkzeugen zur Identifizierung und Klassifizierung IR-
spektroskopischer Daten komplexer biologischer Proben. Einige Nachteile der ANN sollen
nicht unerwähnt bleiben. So ist der Wissenserwerb eines ANN (abgesehen von speziellen
Netzarchitekturen) nur durch Lernen möglich, was die Implementierung von Basiswissen in ein
ANN sehr erschwert. Dem Neuronalen Netz ist im Unterschied zu anderen Klassifizierungs-
und Identifizierungswerkzeugen wie z.B. der Clusteranalyse in der Lernphase (synonym:
Trainingsphase) die zur Klassifikation notwendige Information in Form von Trainingsmustern
mitzuteilen (überwachte Klassifikation). Dieser Lernprozeß ist sehr langwierig und trotz
vielfältiger Bemühungen zur Verbesserung und Optimierung der Verfahren immer noch sehr
zeitaufwendig. Als ein gravierender Nachteil hat sich weiterhin die Unmöglichkeit einer
Einleitung 31
Introspektion erwiesen. Es ist sehr aufwendig, das "Wissen" eines ANN zu analysieren, d.h. den
Prozeß der Identifizierung zurückzuverfolgen.
Aufbau und Funktionsprinzip Neuronaler Netze
Ausführliche Beschreibung zu den theoretischen Grundlagen finden sich in großer Anzahl in
der Literatur [z.B. Zell, 1996]. Im folgenden soll deshalb nur kurz auf einige wesentliche
Punkte eingegangen werden.
Künstliche Neuronale Netze bestehen im allgemeinen aus folgenden Komponenten:
1. Neuronen. Diese auch als Zellen oder units bezeichneten Bestandteile werden durch 3
Komponenten gebildet.
1a. Aktivierungszustand ai(t), gibt den Grad der Aktivierung des Neurons an.
1b. Aktivierungsfunktion fact, Funktion zur Berechnung des Aktivierungzustands a(t+1) für
das j-te Neuron aus dem Aktivierungszustand aj(t) und der Netzeingabe (net input)
netj(t). aj(t+1) = fact(aj(t), netj(t),θj(t)) (1.5.5a.),
wobei θj(t) der Schwellenwert des Neurons j ist.
1c. Ausgabefunktion oj. Die Ausgabe des Neurons j wird durch eine Ausgabefunktion
aus der Aktivierungsfunktion aj berechnet:
oj = fout(aj) (1.5.5b).
2. Verbindungsnetzwerk der Zellen. Die Verbindungen zwischen den Zellen i und j sind durch
Gewichte wij charakterisiert. Die Matrix aller Verbindungen (Gewichtsmatrix) wird mit W
bezeichnet.
3. Propagierungsfunktion. Diese gibt an, wie sich die Netzeingabe des Neurons j aus den
Ausgaben der anderen Neuronen und den Verbindungsgewichten berechnet.
net t o w
jiij
i
()=
(1.5.5c).
4. Lernregel. Lernregeln sind Algorithmen, nach denen ein Neuronales Netz lernt, aus einer
Kombination von Eingaben eine gewünschte Ausgabe zu produzieren. Dabei gibt es
verschiedene Möglichkeiten, die Netzausgabe zu optimieren:
- Löschen oder Hinzufügen neuer Verbindungen
- Modifikation der Stärke wij von Verbindungen
- Modifikationen der Schwellenwerte θi
- Modifikation der Aktivierungs- , Propagierungs- oder Ausgabefunktion
- Löschen oder Hinzufügen neuer Zellen (Neuronen)
Zumeist werden nur die Verbindungsgewichte wij während einer Lernphase (=Trainingsphase)
modifiziert. Indem die Verbindungsgewichte wij auf 0 (oder von 0 verschiedene Werte) gesetzt
werden, können so scheinbar Verbindungen/Zellen gelöscht (hinzugefügt) werden.
Während eines Lernzyklus wird versucht, den Fehler zwischen erwarteter Ausgabe (Vorgabe)
und tatsächlicher Ausgabe zu minimieren.
Im Rahmen der vorliegenden Arbeit wurden ausschließlich backpropagation-Lernverfahren in
ihren Modifikationen standard backpropagation, quick propagation und resilient propagation
(rprop) verwendet. Beim standard backpropagation-Verfahren wird die Änderung des
32 Einleitung
Gewichtes wij während eines Lernzyklus nach folgenden Schema berechnet.
wij = η oi δj, (1.5.5d)
wobei η eine Konstante (Lernrate) bezeichnet und δj aus der Differenz der aktuellen
Aktivierung aj und der erwarteten Aktivierung (teaching input) tj berechnet wird. Für Neuronen
aus den verdeckten Schichten (hidden layer) sind keine teaching input-Werte vorhanden. Die
Berechnung von δj gestaltet sich deshalb für Neuronen der Ausgabeschicht und der
Zwischenschichten unterschiedlich:
δδ
j
jjjj
jjkjk
k
f net t o falls j eine Ausgabezelle ist
f net w falls j eine Zwischenzelle ist
=
( )( )), )
(), (1.5.5e)
Die beiden Modifikationen des standard backpropagation Lernverfahrens (quick propagation
und rprop) sind ebenfalls iterative Verfahren, allerdings erfolgt hier die Berechnung der
Gewichteänderung wij komplizierter. Beide Lernverfahren sind umfassend in der Literatur
beschrieben [z.B. Zell, 1994]. Netzwerktopologien: Generell kann man zwischen Netzen ohne
Rückkopplung (feedforward) und solchen mit Rückkopplung (feedback) unterscheiden. Bei
letzteren existiert immer ein Pfad,
welcher von einem Neuron (oder
einem zwischengeschalteten
Neuron) wieder zum
Ausgangsneuron zurückführt
(biologisches Beispiel:
Schaltungsplan der Renshaw-
Hemmung im spinalen
Reflexbogen). Feedback-Netze
kamen in den Studien nicht zum
Einsatz. In der Abb. 1.5.5. ist die
Topologie eines feedforward
Netzes, bestehend aus einer
neuronalen Eingabeschicht (input
layer), einer Zwischenschicht
(hidden layer) sowie einer Schicht
von Ausgabeneuronen (output
layer) dargestellt. Die Neuronen
können ebenenweise miteinander
verbunden sein oder auch
Verbindungen ausbilden, welche
Ebenen überspringen (shortcut
connections). Im Rahmen der
angefertigten Arbeit wurden beide
Topologien von feedforward-
Netzen getestet.
Abb. 1.5.5. Topologie eines typischen feedforward-Netzes. 68
Eingabeneuronen in der Eingabeschicht, 20 Neuronen des hidden
layer und 5 Neuronen der Ausgabeschicht sind direkt miteinander
verbunden (keine shortcut connection). Die Abbildung wurde mit
Hilfe des Stuttgart Neural Network Simulators (SNNS) erstellt.
Aufgabenstellung 33
2. Aufgabenstellung und Zielsetzung der Arbeit
Derzeitig werden in der medizinischen Therapie und Diagnostik eine große Palette optischer
Methoden eingesetzt. Obwohl die FTIR-Spektroskopie seit langem in der chemischen Analytik
Verwendung findet und eine Vielzahl von Problemstellungen bei der Aufklärung von Struktur
und Funktion von Biomolekülen mit diese Methode bearbeitet werden, hat sich noch kein auf
dem Informationsgehalt des mittleren Infrarotbereichs basierendes IR-spektroskopisches
Verfahren als Standardanwendung in der medizinischen Diagnostik durchsetzen können. Dabei
kann gerade diese Methode detaillierte strukturelle Information der untersuchten biologischen
Proben mit höchster Präzision liefern und wäre somit geeignet, schnell, objektiv und
kostengünstig eine Vielzahl struktureller und biochemischer Parameter auch von kleinsten
Proben zu gewinnen. Technische Fortschritte auf dem Gebiet der FTIR-Spektroskopie wie die
Mikrospektrometrie, die Entwicklung von IR-Lichtleitern bzw. neuer Generationen von IR-
Detektoren und die Revolution auf dem Gebiet der Informationstechnologie lassen jedoch
vermuten, daß die weltweit großen Forschungsanstrengungen zur Etablierung der FTIR-
Spektroskopie als neue und effektive Methode in der medizinischen Diagnostik führen werden.
Vor dem Hintergrund dieser Entwicklungen sollte in dieser Arbeit überprüft werden, ob die IR-
spektroskopische Information von Gewebedünnschnitten ausreichend ist, um für ein
bildgebendes spektroskopisches Verfahren genutzt zu werden. Neben der Schaffung von
apparativen Voraussetzungen, d.h. der Anpassung eines FTIR-Mikroskopmeßplatzes an die
Problemstellung und der Etablierung eines Meßprotokolls, war vor allem zu überlegen, welche
Methoden der Datenauswertung den Erfordernissen der IR-Bildgebung am ehesten gerecht
werden.
Bisher wurden in der IR-Mikroskopie ausschließlich uni- bzw. bivariate Analyseverfahren
(chemical mapping) für die Bildrekonstruktion verwendet. Bei diesen werden nur einzelne
spektroskopische Parameter und nicht die spektroskopische Gesamtinformation zur
Kontrastgebung der IR-Bilder benutzt. Das Hauptziel dieser Arbeit bestand darin, ein auf
multivariaten Analyseverfahren basierendes bildgebendes Verfahren zu entwickeln, welches die
Fülle der strukturellen Information der IR-Spektren optimal nutzen kann und somit den Wert
der Diagnose und die Sicherheit der getroffenen Aussage erhöht. Hierzu bot sich an, die
Faktoranalyse und Künstliche Neuronale Netze für die Spektrenauswertung zu verwenden.
Nach Eingrenzung der Problemstellung auf einen speziellen Fall, d.h. nach Auswahl eines
geeigneten Tumortyps, sollte eine größere Anzahl von Kryodünnschnitten mittels
ortsaufgelöster IR-Mikrospektrometrie kartiert und die erhaltenen Spektren einer adäquaten
Datenanalyse zugeführt werden. Im Abgleich mit den Standardverfahren der Histologie sollte
dann mittels überwachter Analysetechniken überprüft werden, ob die ortsaufgelöste
spektroskopische Information für die Differenzierung, Klassifizierung und Identifizierung der
untersuchten histologischen Strukturen ausreichend ist.
Es galt weiterhin zu überprüfen, ob eine Korrelation zwischen der etablierten, d.h. weitgehend
auf histopathologischen Kriterien basierenden Gewebeklassifikation und der
infrarotspektroskopischen und damit strukturell begründeten Klassifikation hergestellt werden
kann.
34 Aufgabenstellung
Eine weitere wichtige Zielstellung dieser Arbeit bestand darin, zu überprüfen, wie weit man die
Anzahl der zur Charakterisierung genutzten spektroskopischen Informationsmerkmale
reduzieren kann, ohne die Fehlerquote wesentlich zu erhöhen. Es sollte getestet werden, ob sich
die Möglichkeiten zur Differenzierung, Klassifizierung und Identifizierung verbessern, wenn
Spektren nur anhand einzelner ausgewählter spektraler Bereiche, sogenannter "spektraler
Fenster, verglichen werden. Durch den Einsatz von speziell für spektroskopische Belange
programmierter Software sollte zudem untersucht werden, ob eine "Frequenz-Technik", d.h. ob
die Charakterisierung histologischer Strukturen anhand eines einzigen bzw. einiger weniger
Extinktionswerte bei festen Frequenzen prinzipiell anwendbar ist. Die Suche nach diesen IR-
"Tumormarkerbanden" ist ein bestä