BookPDF Available

Goeminne, B., Enhus, E., Ponsaers, P. (2003). Criminaliteit in de publieke ruimte - Een inleiding in de hotspot analyse, Reeks Dienst voor het Strafrechtelijke Beleid, n°3, Brussel: Politeia, pp. 112.

Authors:
1
Criminaliteit in de publieke
ruimte.
Bart Goeminne
Els Enhus
Paul Ponsaers Opdrachtgever: FOD Justitie
i
Inhoudsopgave
INHOUDSOPGAVE .............................................................................................................................................. I
TABELLEN .......................................................................................................................................................... II
FIGUREN ............................................................................................................................................................ III
VOORWOORD ..................................................................................................................................................... 3
INLEIDING ........................................................................................................................................................... 5
1.1. ROUTINE ACTIVITEITENTHEORIE ................................................................................................................ 10
1.2. DE PATROONTHEORIE ................................................................................................................................. 14
1.3. VERPLAATSING .......................................................................................................................................... 15
HOOFDSTUK II: HET VOORBEREIDEN VAN DE DATA VOOR DE UITEINDELIJKE HOT SPOT
ANALYSE ........................................................................................................................................................... 20
2.1. POLITIONELE DATA. ................................................................................................................................... 20
2.2. DIGITALE KAARTEN .................................................................................................................................... 24
2.3. GEOCODEREN ............................................................................................................................................. 28
2.4. SOFTWARE ................................................................................................................................................. 31
HOOFDSTUK III : GEAGGREGEERDE HOT SPOT TECHNIEKEN ...................................................... 34
3.1. UITGEMIDDELDE WAARDE OP BASIS VAN DE LENGTE VAN DE STRAAT ....................................................... 34
3.2. SYMBOOLKAARTEN .................................................................................................................................... 37
3.3. CHOROPLETEN. .......................................................................................................................................... 38
3.4. LOCAL MORAN STATISTIC ......................................................................................................................... 39
HOOFDSTUK IV : PUNTGEBASEERDE HOT SPOT TECHNIEKEN. .................................................... 47
4.1. MODE AND FUZY MODE .............................................................................................................................. 47
4.2. DRIE CLUSTERTECHNIEKEN NADER TOEGELICHT ........................................................................................ 51
4.2.1. Nearest Neighbor Hierarchical Clustering (NNH) ............................................................................ 51
4.2.1.1. Nearest Neigbor techniek (single linkage) ................................................................................................... 53
4.2.1.2. Nearest Neighbor Hierarchical Clustering in CrimeStat II ......................................................................... 57
4.2.1.3 Twee criteria ................................................................................................................................................. 60
4.2.1.4. Simulatie van statistische significantie ........................................................................................................ 61
4.2.1.5. CrimeStat II : Nearest Neighbor Hierarchical clustering ............................................................................. 70
4.2.1.6. Risk adjusted nearest neighbor hierarchical clustering (RNNH) ................................................................. 73
4.2.2. Spatial and Temporal Analysis of Crime ........................................................................................... 74
4.2.2.1. CrimeStat II : Spatial and Temporal Analysis of Crime .............................................................................. 79
4.2.3. K-means partitioning clustering ........................................................................................................ 84
4.2.4. Drie clustertechnieken: een samenvatting ......................................................................................... 90
4.3. WAARDE OP BASIS VAN HET AANTAL GEBOUWEN IN DE STRAAT ................................................................ 92
4.4. KERNEL DENSITY ESTIMATION ................................................................................................................... 94
4.4.1. Single density estimates ................................................................................................................... 102
4.4.2. Dual Kernel Density ....................................................................................................................... 104
4.5. SAMENVATTING ....................................................................................................................................... 107
HOOFDSTUK V: BESLUIT ............................................................................................................................ 108
APPENDIX A : CRIMESTAT II : EEN KORTE INTRODUCTIE ............................................................ 112
BIBLIOGRAFIE ............................................................................................................................................... 115
ii
Tabellen
Tabel 1: Controlemechanismen vs. hetgeen ze controleren. .................................................... 12
Tabel 2: Voorbeeld attributentabel ........................................................................................... 26
Tabel 3: Joinen van twee attributentabellen: een fictief voorbeeld .......................................... 29
Tabel 4: Modus : output CrimeStat II ...................................................................................... 48
Tabel 5: Fuzzy Mode ................................................................................................................ 49
Tabel 6: Voorbeeld van een NNH analyse ............................................................................... 63
Tabel 7: Output NNH criminele feiten (Antwerpen, 2001) ..................................................... 71
Tabel 8: STAC output: radius 150, punten 50, MC 1000 ....................................................... 81
Tabel 9: STAC output : radius 100, punten 50, MC 1000 ....................................................... 82
Tabel 10: K-means clustering output ....................................................................................... 88
iii
Figuren
Figuur 1: Criminaliteit als een functie van de mate van het gebruik van een plaats. ............... 13
Figuur 2: Familiarity decay ...................................................................................................... 18
Figuur 3: Studiegebied Antwerpen .......................................................................................... 21
Figuur 4: Voorbeelden van vectorkaarten ................................................................................ 25
Figuur 5: Politiecommissariaten, verkeersassen in Antwerpen................................................ 27
Figuur 6: UWL: enkele voorbeelden. ....................................................................................... 36
Figuur 7: Symboolkaart: aantal delicten per straat ................................................................... 38
Figuur 8: Choropleet: aantal delicten per NIS sector ............................................................... 39
Figuur 9: CrimeStat II: Local Moran Statistic ......................................................................... 43
Figuur 10: LMoran Statistic: opzettelijke slagen en verwondingen ........................................ 44
Figuur 11: Modus en Fuzzy Mode, een voorbeeld. .................................................................. 50
Figuur 12: CrimeStat II : Mode en Fuzzy Mode ...................................................................... 51
Figuur 13: Hierarchische clustering : Nearest Neighbor .......................................................... 53
Figuur 14: NNH uitleg ............................................................................................................. 54
Figuur 15: Dendogram voor het nearest neighbor voorbeeld. ................................................. 56
Figuur 16: Nearest Neigbor Clustering : 2 methoden. ............................................................. 59
Figuur 17: NNH : criminele feiten (Antwerpen, 2001) ............................................................ 68
Figuur 18: CrimeStat II : Nearest Neighbor Hierarchical Clustering ...................................... 72
Figuur 19: NNH : Kiezen van de zoekradius ........................................................................... 72
Figuur 20: Zoekraster in STAC ................................................................................................ 75
Figuur 21: STAC: een voorbeeld ............................................................................................. 77
Figuur 22: CrimeStat II : Spatial and Temporal Analysis of Crime. ....................................... 83
Figuur 23: K-means clustering : een voorbeeld ....................................................................... 89
Figuur 24: CrimeStat II : K-means clustering .......................................................................... 90
Figuur 25: Aantal vs. weging : kernel density als voorbeeld .................................................. 93
Figuur 26: Histogram: methode van verbonden middenpunten ............................................... 95
Figuur 27: Kernel density: gebruik van een normaal verdeling ............................................... 96
Figuur 28: Kernel density: voorbeelden van verschillende bandwijdte ................................... 97
Figuur 29: Kernel density: verschillende rastercellen ............................................................ 101
Figuur 30: CrimeStat II : single kernel density ...................................................................... 102
Figuur 31: Kernel density: woninginbraak ............................................................................. 102
Figuur 32: CrimeStat II: Dual Kernel Density ....................................................................... 105
Figuur 33: Primary File Screen .............................................................................................. 112
Figuur 34: Reference file ........................................................................................................ 114
1
Woord vooraf
Met de technologische evoluties op het vlak van informatica, zoals de automatisering van
politionele gegevensbanken, de verspreiding van goedkope, krachtige computers met
uitgebreide mogelijkheden op het gebied van cartografie en de ontwikkeling van software
voor ruimtelijke analyse en GIS (Geographical Information System) is het mogelijk geworden
om criminele gebeurtenissen op een relatief eenvoudig manier in kaart te brengen.
Eén van de uitdagingen hierbij is het identificeren van concentraties van criminaliteit in de
ruimte, ook wel hot spots genoemd. Immers, wanneer concentraties gekend zijn dan kunnen
de beschikbare politionele middelen op een efficiëntere manier worden gebruikt om
criminaliteit te bestrijden. Hiervoor is het nodig om over methodes te beschikken, die op een
relatief objectieve wijze deze concentraties van criminaliteit identificeren.
Het is deze opdracht geweest die ik aan de promotoren van voorliggend onderzoek, met name
Prof. Dr. Els Enhus (Vrije Universiteit Brussel) en Prof. Dr. Paul Ponsaers (Universiteit
Gent), heb opgedragen. Ik ben er mij van bewust dat het identificeren van hot spots slechts
een eerste aanzet is tot het reduceren van criminaliteit. Maar wanneer deze methode gebruikt
wordt binnen een ruimer beleidsproces, zoals de SARA methode die door de onderzoeksploeg
wordt voorgestaan, kan dit tot een efficiëntere aanpak van criminaliteit leiden. De technieken
die worden gebruikt moeten niet gezien worden als wondermiddelen die ‘het
criminaliteitsprobleem volledig zullen doen verdwijnen’. Het zijn daarentegen nuttige en
krachtige instrumenten, die een aanvulling zijn van het arsenaal van analysetechnieken die nu
reeds door strategisch analisten worden gebruikt om criminaliteit te analyseren.’
Vandaag ligt het antwoord van de onderzoeksploeg op mijn opdracht besloten in voorliggend
boek voor de lezer. Het boek geeft naar mijn gevoelen een goed inzicht in de verschillende
technieken die kunnen gebruikt worden om concentraties te identificeren. Het geeft ook
duidelijk de beperkingen van deze technieken aan. Het wijst tevens nogmaals op het belang
van een goede registratie van criminele feiten en op de beperkingen van officiële
criminaliteitscijfers, wanneer die gebruikt worden om criminaliteitsanalyses uit te voeren.
Het wetenschappelijke werk is hiermee klaar. Het zal nu aan de strategisch analysten van
lokale en federale politie, maar ook aan deze van de parketten, zijn om er hun voordeel mee te
2
doen, zodat beleidsmakers op een inzichtelijker wijze kunnen komen tot een wetenschappelijk
onderbouwde prioriteitstelling.
Rest me nog mijn waardering uit te drukken voor het grondig onderzoek dat door het
onderzoeksteam werd geleverd. Mijn dank en waardering gaat ook uit naar de leden van het
wetenschappelijke begeleidingscomité, die elk vanuit hun invalshoek het onderzoek mee
hebben gevoed en richting gegeven, in het bijzonder naar de leiding van de Dienst voor het
Strafrechtelijk Beleid, dat het voorzitterschap van dit Begeleidingscomité heeft willen
waarnemen.
Marc Verwilgen
Minister van Justitie
3
Voorwoord
Dit boek is geschreven in het verlengde van het project ‘Analyse van
exploitatiemogelijkheden van politionele en parket databanken ten behoeve van het
opsporings- en vervolgingsbeleid’. Dit project werd gefinancierd door Federale
Overheidsdienst (FOD) Justitie en begeleid door
de Dienst voor het Strafrechtelijk beleid. Het werd uitgevoerd door de Interuniversitaire
Onderzoeksgroep Sociale Veiligheidsanalyse onder het promotorschap van de professoren P.
Ponsaers (RUG) en E. Enhus (VUB).
De interuniversitaire onderzoeksgroep ‘Sociale veiligheidsanalyse’ is een
samenwerkingsverband tussen de criminologen Prof. dr. Paul Ponsaers (Universiteit Gent) en
Prof. dr. Els Enhus (Vrije Universiteit Brussel). Deze onderzoeksgroep maakt enerzijds deel
uit van de vakgroep Strafrecht en Criminologie van de Faculteit Rechtsgeleerdheid van de
Universiteit van Gent en van de vakgroep Criminologie van de Faculteit Rechtsgeleerdheid
van de Vrije Universiteit Brussel.
De onderzoeksgroep concentreert zich op criminologische onderzoek naar de ‘sociale
veiligheid’. ‘Sociaal’ verwijst enerzijds naar de selectie- en afhandelingstrategieën gehanteerd
door de actoren in de strafrechtsbedeling en in andere gebieden betrokken bij het
criminaliteitsvraagstuk. De rol van zowel discours als praktijk in deze strategieën vormen
hierbij belangrijke aandachtspunten. Anderzijds wordt ingezoemd op de ervaringen, visies en
beleving van de burgers en gebruikers mbt de selectie- en afhandeling. Meer algemeen gesteld
wordt vooral aandacht besteed aan het herverdelingsvraagstuk inzake veiligheid in onze
samenleving. Het veiligheidsprobleem is immers niet gelijk voor iedereen; de ongelijke
verdeling van macht, inkomen, sociaal en cultureel kapitaal ondermijnt de garanties van de
rechtstaat op gelijke rechten. De maatschappelijke ongelijkheid wordt maw binnen de sfeer
van veiligheid gereproduceerd.
Grondig onderzoek naar selectie- en afhandelingstrategieën is onmogelijk wanneer er geen
systematische gegevens worden verzameld binnen de verschillende onderdelen van de
strafrechtelijke keten. Een aantal projecten hebben tot doel systemen uit de denken om
systematisch cijfermateriaal te generen of te verwerken op overheidsniveau waardoor een
4
beter inzicht kan verkregen worden en de discussie over de gehanteerde oriëntatie kan
gevoerd worden.
Selectie- en afhandelingstrategieën voor een aantal actoren in de strafrechtelijke keten zoals
preventie-initiatieven, de politie, het parket, de bijzondere inspectiediensten werden via
puncturele onderzoeken bestudeerd.
Het gevoerde onderzoek heeft een sterk empirische inslag waarbij zowel kwantitatieve als
kwalitatieve methoden worden gehanteerd.
Onze dank gaat uit naar de Antwerpse Lokale politie, in het bijzonder naar Luc Lamine die de
toestemming gaf om de politionele data te gebruiken, Jo Forceville en Corrine Scoyer die als
strategisch analisten bij de Antwerpse Lokale politie nuttige tips gaven en Ronald Tacq die
voor het praktische gedeelte zorgde. Daarnaast willen wij ook Telepolis Antwerpen danken
voor het ter beschikking stellen van de nodige digitale mappen en willen wij in het bijzonder
Peter Maes en Kristine Jacobs voor geven van tips betreffende het gebruik van GIS-
applicaties.
5
Inleiding
Criminaliteit is niet evenredig verspreid. Dit blijkt uit onderzoek waar zowel de spreiding van
criminaliteit (Loukaitou-Sideris, 1999; Sherman, 1995), als de spreiding van bepaalde
delicttypes (Braga, 1999) werd onderzocht. Sherman (1995) vond bijvoorbeeld dat in
sommige steden in de Verenigde Staten meer dan de helft van alle delicten geconcentreerd
zijn op en rond een beperkt aantal plaatsen. Braga (1999) haalt verschillende studies aan
waaruit blijkt dat verschillende types van criminaliteit zoals woninginbraak, drugsverkoop,
winkeldiefstal, gauwdiefstal, gewone diefstal en autodiefstal een ongelijke ruimtelijke
spreiding kennen. Sommige van deze delicttypes zoals winkeldiefstal en gauwdiefstal zijn
sterk geconcentreerd op en rond enkele plaatsen. Dergelijke plaatsen met een sterke
concentratie van criminaliteit worden hot spots genoemd.
Het identificeren van hot spots kan zowel voor beleidsmakers als voor politiediensten heel
interessant zijn. Immers, één van de prioriteiten van beleidsmakers is vandaag de dag het
aanpakken van criminaliteit. Voor politiediensten is het bestrijden en voorkomen van
criminaliteit sowieso één van de belangrijkste taken. Wanneer beleidsmakers samen met
politie echter een criminaliteitsbeleid uitstippelen worden zij vaak geconfronteerd met het
beperkte aantal middelen waarover politiediensten beschikken. Dit noodzaakt tot het stellen
van prioriteiten.
Bij het bepalen van prioriteiten kan gebruik gemaakt worden van een ‘hot spots analyse’. Dit
is een analyse waar in een eerste fase bestudeerd wordt waar en wanneer criminele feiten het
vaakst voorkomen. Met andere woorden, er wordt getracht concentraties van criminaliteit in
tijd en ruimte te identificeren. Omdat uit verschillende studies (Braga, 1999; Eck, 1995;
Sherman, 1995) is gebleken dat een belangrijk deel van alle criminele feiten zich slechts op
een beperkt aantal plaatsen afspelen, de hot spots, kan er geopteerd worden om de
geïdentificeerde concentraties van criminaliteit prioritair aan te pakken. Op die manier
worden de beschikbare politionele middelen op een efficiëntere manier ingezet.
Alvorens een strategie te ontwikkelen om concentraties van criminaliteit te bestrijden moet
gezocht worden naar de oorzaken waarom criminaliteit zich net op die plaatsen concentreert.
Het zoeken naar oorzaken en verklaring van hot spots is dan ook een tweede belangrijke fase
in een hot spot analyse.
6
Bij het zoeken naar verklaringen kan gebruikt gemaakt worden van reeds uitgevoerd
onderzoek. Zo is uit studies, waar een vergelijking werd gemaakt tussen plaatsen met hoge en
lage concentraties van criminaliteit, gebleken dat de mate van toegankelijkheid tot plaatsen
een rol speelt in de hoeveelheid criminaliteit (Eck, 1995). Op plaatsen die heel toegankelijk
zijn zoals winkelruimtes en transitzones (bus, trein en metrostations), waar met andere
woorden veel mensen komen, worden er meer delicten worden gepleegd. Plaatsen met veel
criminaliteit worden tevens gekenmerkt door een inefficiënte en/of geringe aanwezigheid van
controlemechanismen zoals politie die de potentiële doelwitten normaliter zouden moeten
beschermen. Ook plaatsen met specifieke gebouwen kunnen een verhoogd of verlaagd risico
kennen. Denken we bijvoorbeeld aan politiecommissariaten, kerken, scholen, winkelruimtes,
evenementenhallen, bushaltes, en trein en metrostations (Eck, 1995). Naargelang de functie
zullen deze faciliteiten de mate van criminaliteit in hun omgeving beïnvloeden. Afhankelijk
van de functie van een plaats, zullen immers meer (of minder) potentiële daders, meer (of
minder) geschikte slachtoffers en controlemechanismen aanwezig zullen zijn.
Een minstens even belangrijke bron voor het zoeken naar verklaringen zijn de politiemensen
zelf. Zij hebben als geen ander een zicht op de specifieke problemen die zich voordoen op die
plaatsen waar zij ‘verantwoordelijk’ zijn.
Wanneer men criminaliteit wil bestrijden is het uitvoeren van een ‘hot spot analyse’ niet
voldoende. Eenmaal de hot spots in kaart gebracht zijn en men een goed inzicht heeft in de
oorzaken moet een antwoord worden geboden aan de problemen in de hot spots. Na het
implementeren van dit antwoord (de actie) zal in een laatste stap het effect van de geleverde
inspanningen moeten bestudeerd worden. Deze verschillende stappen om een probleem te
behandelen kunnen samengevat worden met het acroniem SARA
1
. SARA is een methode, een
proces dat bestaat uit vier stappen namelijk ‘Scanning’, ‘Analysis’, ‘Respons’ en
‘Assessment’. Het is een stappenplan dat beleidsmakers kunnen gebruiken om problemen
zoals criminaliteit aan te pakken. Het SARA model zelf werd ontwikkeld in Newport News,
Virginia (USA) in het begin van de jaren tachtig. Sindsdien is het reeds door verschillende
politiekorpsen toegepast.
1
Voor meer informatie betreffende de SARA methode zie : ECK, X, Assesing responses to problems: an
introductory guide for police problem-solvers., www.cops.usdoj.gov, 86.
7
In de ‘scanningsfase’, worden de problemen gedetecteerd. Deze fase is de eerste fase van een
‘hot spot analyse’. Men onderzoekt de concentratie van de verschillende criminaliteitsvormen
en de tijdstippen waarop ze het vaakst voorkomen.
Eenmaal de hot spots geïdentificeerd zijn en nadat beslist is op welke concentraties men zal
inwerken wordt in de ‘analysefase’ gezocht naar de oorzaken en verklaringen waarom
concentraties zich op de gevonden plaatsen en tijdstippen voordoen. De ‘analysefase’ komt
overeen met het tweede gedeelte van een ‘hot spot analyse’.
Op basis van de bevindingen uit de ‘analysefase’ wordt in de ‘actiefase’ (respons) een
strategie ontworpen. Bij het ontwikkelen van de te volgen strategie wordt duidelijke
aangegeven welke acties door wie en op welk moment van de respons moeten uitgevoerd
worden. Dit is noodzakelijk omdat tijdens de ‘evaluatiefase’ (assessment ) bestudeerd wordt
of de strategie is uitgevoerd zoals aanvankelijk gepland. Eenmaal de te volgen strategie
bepaald is kan deze geïmplementeerd worden.
In de laatste stap, de ‘evaluatiefase’, wordt een antwoord gezocht op twee vragen. (1) Is het
probleem gereduceerd? (impactevaluatie) (2) Is de strategie uitgevoerd zoals dit voorzien
was? (procesevalutatie) Om op de eerste vraag een antwoord te formuleren kan er gebruik
gemaakt worden van een tweetal onderzoeksdesigns. Het eenvoudigste design is het pre
post design waarbij het probleem tweemaal gemeten wordt, eenmaal vóór (nulmeting) en
eenmaal de implementatie van de strategie. Een twee design maakt gebruikt van
verschillende metingen voor en na de implementatie (onderbroken tijdserie serie design). Op
die manier wordt een beter inzicht verworven in de evolutie van een probleem. Een pre en een
post meting zijn immers momentopnames waardoor de kans bestaat dat ze een vertekend
beeld geven van de werkelijkheid. Met verschillende metingen wordt getracht aan dit
probleem tegemoet te komen.
Wanneer beleidsmakers enkel geïnteresseerd zijn of een probleem al dan niet gedaald is,
volstaat een impact evaluatie. Wanneer men een ‘succesvolle’ strategie ook op andere
probleemplaatsen wil toepassen moet men er zeker van zijn dat de geïmplementeerde strategie
de daling van het probleem veroorzaakt heeft. Mocht de daling aan andere factoren te wijten
zijn dan de uitgevoerde reactie is het immers weinig zinvol de gevolgde strategie op andere
plaatsen te implementeren. Tevens is het noodzakelijk dat de strategie is uitgevoerd zoals dit
gepland was (procesevaluatie). Wanneer toch een daling van het probleem wordt opgetekend,
dit terwijl de strategie door omstandigheden niet of sterk verschillende geïmplementeerd werd
dan wat was gepland, is het mogelijk dat andere factoren aan de basis van de daling liggen of
dat de veranderde strategie toevallig effectief was. Wanneer dit zo is dan wordt de strategie
8
beter niet op andere probleemplaatsen toegepast. Wanneer de strategie uitgevoerd is zoals
gepland maar er geen daling te noteren valt dan zal de strategie opnieuw bekeken moeten
worden. Wanneer er noch een daling noch een correcte toepassing van de strategie wordt
opgetekend weten we niks. Enkel wanneer EN een daling opgetekend wordt EN de strategie
uitgevoerd is zoals gepland dan kan deze strategie toegepast worden op andere
probleemplaatsen.
In dit boek wordt ingezoomd op de eerste fase van de SARA methode met name de
‘scanningsfase’. Het doel is inzicht te verschaffen in kwantitatieve technieken die gebruikt
worden om hot spots te identificeren, het betreft onder andere ‘Nearest Neighbor Hierarchical
Clustering’ (NNH), ‘Spatial and Temporal Analysis of Crime’ (STAC), ‘K-means
Partitioning Clustering’ en ‘Kernel Density Estimation’. Sommige van deze technieken zijn
beschrijvende technieken, andere zijn inductieve technieken waarbij de significantie van hot
spots aan de hand van ‘Monte Carlo Simulaties’ getoetst wordt.
Om de verschillende technieken te testen werd gebruik gemaakt van door de Antwerpse
lokale politie aangereikte gegevens. Deze gegevens hadden betrekking op het jaar 2001.
Antwerpen werd om een aantal redenen gekozen als ‘proefgebied’. De voornaamste reden is
de grootstedelijke context. Een andere reden is dat de onderzoeksgroep Sociale
Veiligheidsanalyse in het kader van vorige projecten die binnen de onderzoeksgroep werden
uitgevoerd al goede contacten had met de Antwerpse lokale politie. Dit vergemakkelijkte de
samenwerking, waaronder het uitwisselen van gegevens, aanzienlijk. Een derde reden waarom
voor Antwerpen geopteerd werd was het voorhanden zijn van digitale kaarten. Deze zijn
onder andere noodzakelijk om de resultaten van een hot spots analyse te visualiseren.
Wanneer hot spot analyses worden uitgevoerd wordt gewerkt met plaatsen. De aandacht voor
‘plaats’ is niet nieuw binnen de criminologie. In een eerste hoofdstuk zal er dan ook
stilgestaan worden bij de relatie ‘plaats - criminaliteit’ binnen de criminologische
theorievorming. In een tweede hoofdstuk wordt gefocust op enerzijds de data die nodig is om
hot spot analyses uit te voeren en anderzijds op de verschillende software programma’s. In
een derde hoofdstuk komen enkele ‘geaggregeerde technieken aan bod terwijl in een laatste
hoofdstuk uitvoerig wordt stilgestaan bij puntgebaseerde technieken zoals ‘Spatial and
Temporal Analysis of Crime’, ‘Nearest Neighborhood Hierarchical Clustering’ en Kernel
Density Estimation.
9
Hoofdstuk I : Theoretisch overzicht
De aandacht voor de relatie tussen criminaliteit en plaats is niet nieuw. Reeds in de 19de eeuw
hebben wetenschappers, waaronder Quetelet en Guerry (Ainsworth, 2001; Eck, 1995;
Loukaitou-Sideris, 1999), de verdeling van criminaliteit tussen gebieden met verschillende
ecologische en sociale kenmerken bestudeerd. In de Verenigde Staten namen wetenschappers
waaronder Park, Burgess; Eck, (1995); Shaw en McKay (1972) die verbonden waren aan de
‘Chicago School’ het voortouw. Een van de bekendste concepten welke uit de ‘Chicago
School’ voortvloeide, is ongetwijfelde de ‘concentrische zonetheorie’.
Nadat door heftige kritiek op de ‘Chicago school’ de relatie tussen criminaliteit en plaats wat
in het verdomhoekje was geraakt, komt in de jaren 60 en 70 deze relatie opnieuw op de
voorgrond. Het is dan ook niet toevallig dat er in deze periode drie boeken verschijnen waarin
gepleit wordt voor het toepassen van situationele criminaliteitspreventie met als onderliggend
idee dat via het aanpassen van de omgeving criminaliteit voorkomen kan worden. Een eerste
werk is van Jacobs (1961). Zij zag ‘natuurlijk toezicht’ als een sterk middel dat mensen
afschrikt om criminaliteit te plegen. Het design van moderne steden beknotte, volgens haar,
het ‘natuurlijk toezicht’, een toezicht dat zowel door bewoners als door passanten uitgevoerd
moet worden. Zij stelde dan ook voor steden zodanig in te richten dat het ‘natuurlijke
toezicht’ geoptimaliseerd zou worden. Net zoals Jacobs legt ook Jeffery (1971) de nadruk op
het design en fysieke kenmerken van de omgeving. Daar waar Jacobs met het aanpassen van
de omgeving het ‘natuurlijke toezicht’ wil verhogen, wil Jeffery met aanpassingen het aantal
gelegenheden tot het plegen van criminaliteit zoveel mogelijk reduceren.
Het derde, en ongetwijfeld het bekendste boek is ‘Defensible Space’ van Oscar Newman
(1976). Hierin verduidelijkt Newman het concept ‘verdedigbare ruimte’. Net zoals Jacobs
hecht Newman veel belang aan het toezicht dat wordt uitgeoefend. Ook hij stelt dat het
toezicht kan verhoogd worden door het aanpassen van de fysieke omgeving. Daar waar
Jacobs echter pleit voor open en toegankelijke publieke ruimtes waar zowel bewoners als
vreemden gebruik van maken en op deze manier deel uitmaken van een natuurlijk
controlemechanisme pleit Newman voor gesloten en weinig toegankelijke ruimtes waar enkel
de bewoners een rol als natuurlijk controlemechanisme spelen. Bewoners zouden dan sneller
indringers herkennen. Jacobs ziet vreemden als een bron van veiligheid terwijl Newman hen
als een bron van onveiligheid beschouwt (Hillier, 2002).
10
Het ‘defensible space’ concept bleek niet enkel bij de theorie. Het werd in verschillende
Amerikaanse steden toegepast (Newman, 1997). In Dayton, Ohia (VS) werd de wijk Five
Oaks begin jaren negentig geteisterd door toenemende criminaliteit. In 1991 stegen
gewelddadige delicten en berovingen elk met 77% en vandalisme met 38%. Drug dealers,
pooiers en prostituees waren duidelijk aanwezig, vuurgevechten kwamen regelmatig voor.
Verder had de wijk te kampen met veel doorgaand verkeer en overdreven snelheid. Op vraag
van de stad Dayton heeft Newman het ‘defensible space’ concept toegepast. De buurt werd
onderverdeeld in 10 kleinere buurten en verschillende straten werden afgesloten om zo het
doorgaand verkeer dat de wijk teisterde te belemmeren. Binnen een periode van twee jaar
zakte de het totale aantal gepleegde delicten met 25% en het aantal gewelddadige delicten met
50%. Ook andere delicten zoals autodiefstal en woninginbraak daalden aanzienlijk.
1.1. Routine activiteitentheorie
Recent benadrukken enkele ‘nieuwe’ theorieën het belang van ‘plaats’. Een van deze
theorieën is de ‘routine activiteiten theorie’ van Felson (1986, 1994, 1995, 1998). Deze
theorie gaat er vanuit dat opdat een crimineel feit zal gepleegd worden er aan vier
voorwaarden voldaan moet zijn: (1) er moet een gemotiveerde dader aanwezig zijn; (2) er
moet een geschikt doelwit zijn; (3) het doelwit en de dader moeten op hetzelfde moment op
dezelfde plaats samen zijn en (4) er mogen geen controlemechanismen aanwezig zijn.
Felson onderscheid drie soorten controlemechanismen namelijk ‘handler’, bewakers
(guardian) en beheerders van een plaats (place manager). Een ‘handler’ is een persoon die
directe invloed uitoefent op een dader. Het kunnen zowel ouders, leerkrachten, vrienden als
werkgevers zijn. In de aanwezigheid van dergelijke personen zullen potentiële daders volgens
Felson minder snel delicten plegen. Tijdens het uitvoeren van dagelijkse activiteiten (routine
activiteiten) zoals het zich begeven naar school of naar de werkplaats vertoeven potentiële
daders niet constant in het gezelschap van personen die directe invloed uitoefenen en die hen
er van weerhouden criminaliteit te plegen. De afwezigheid van dergelijke toezichthouders
vergroot de kans dat potentiële daders tot het plegen van criminele feiten zullen overgaan
wanneer zij gelegenheden opmerken.
Het begrip ‘handler’ heeft Felson (1994, 1998) gehaald uit de sociale controletheorie van
Hirshi. Deze theorie (Brutsaert, 1990) stelt dat mensen handelen in overeenstemming met de
normen en wetten, omdat er een band bestaat tussen henzelf en de gemeenschap. Delinquente
handelingen zullen zich voordoen wanneer die band tussen individu en maatschappij zwak is
of verbroken wordt. De band tussen individu en maatschappij wordt door Hirshi vergeleken
11
met een koord bestaande uit vier door elkaar geweven strengen namelijk (1) attachment’
2
, (2)
‘commitment’
3
, (3) ‘involvement’
4
en (4) belief
5
. Felson reduceerde deze vier begrippen tot
één concept namelijk ‘handle’ of ‘band’. De maatschappij en meer bepaald de personen die
individuen het nauwst aan het hart liggen en de sociale band die tussen hen is gecreëerd
weerhoudt mensen ervan regels te overtreden
6
. Mensen hebben heel wat te verliezen wanneer
zij tegen de wensen van anderen in handelen, wanneer hun toekomst in gevaar wordt gebracht
door gestelde handelingen die indruisen tegen waarden en normen van ouders, familie,
vrienden of werkgevers. De band is dus een noodzakelijke voorwaarde voor informele sociale
controle. Het gebrek aan ‘commitment’, het gebrek aan ‘attachment’, het gebrek aan
conventionele ‘involvements’ of het gebrek aan ‘beliefs’ zorgt ervoor dat het individu geen
band meer heeft en dat sociale controle nagenoeg onmogelijk wordt.
Het tweede controlemechanisme dat Felson vernoemt zijn bewakers. Zij beschermen
potentiële doelwitten. Felson stelt dat ook zij afwezig moeten zijn opdat een delict zal
gepleegd worden. Personen of voorwerpen die een lange tijd gescheiden zijn van bewakers
hebben een verhoogde kans op victimisatie. Felson (1980) illustreert dit aan de hand van het
delict ‘woninginbraak’. De voorbije decennia werd de Westerse wereld gekenmerkt door
verschillende evoluties. Een van deze evoluties zijn veranderde samenlevingsvormen. Er zijn
nu veel meer eenpersoonshuishoudens dan enkele decennia terug. Het onbewaakt achterlaten
van de woonst gedurende de dag en nacht door personen die alleen wonen verhoogt het risico
2
Attachment slaat op de internalisatie van normen via affectieve banden, welke een jongere heeft gevormd met
personen uit de onmiddellijke omgeving: ouders, broers/zussen, vrienden en school. De gezinsomgeving is
hierbij uiterst belangrijk, omdat de ouders en eventueel broers en zussen als rolmodel handelen en sociaal
aanvaardbaar gedrag aanleren. Jongeren met een hoge graad van attachment zullen waarschijnlijk niet overgaan
tot het stellen van delinquente handelingen uit respect voor hun sociale omgeving. (Brutsaert, 1995, 207)
3
Commitment is de meer rationele component van de band. Een persoon investeert namelijk tijd en energie in
het volgen van een bepaalde gedragslijn. Wanneer deze persoon afwijkend gedrag in overweging neemt, moet
hij/zij rekening houden met de kost daarvan, met name het risico dat zijn investering in conform gedrag
verloren zal gaan. Commitment is als het ware een kosten baten analyse van delinquent gedrag. Voorts
impliceert het begrip dat de maatschappij zodanig georganiseerd is dat de belangen van de meeste personen
zouden geschaad worden indien zij zelf zouden overgaan tot delinquent gedrag. Door in een bepaalde
gemeenschap te leven hebben de meeste mensen een zekere reputatie verworven, houden zij aan hun
waardigheid, hebben eigendomsvooruitzichten : allemaal zaken die ze niet willen verliezen. Kortom hoe meer
geïnvesteerd hoe kleiner de kans op delinquentie. (Brutsaert, 1995, 208)
4
Involvement is de situatie waarbij een persoon het eenvoudigweg te druk heeft om zich afwijkend te gedragen,
het is immers de deelname aan conventionele, conforme en legitieme activiteiten die leidt tot sociaal aanvaard
succes en tot status. Er moet m.a.w. gelegenheid worden geboden om tot delinquent gedrag over te gaan.
Aangezien de meeste mensen het te druk hebben met normale bezigheden, zal de gelegenheid om criminele
handelingen te stellen zich zelden voordoen, aldus Hirshi. (Brutsaert, 1995, 208)
5
Belief wordt omschreven als het aanvaarden van de morele geldigheid van het centrale waardenstelsel van de
maatschappij. Hoe minder goed dit waardenstelsel wordt aanvaard, hoe groter de kans op delinquent gedrag.
(Brutsaert, 1995, 208)
6
Een gelijkaardige zienswijze is terug te vinden in de sociologische theorievorming rond het concept
‘reciprocity’ (wederkerigheid). We verwijzen de lezer hiervoor naar bijdragen van Blau (1964); Coser, (1982,
72-76); Malinowski (1978) en Parsons (1959).
12
op bijvoorbeeld inbraken. Daarom zal volgens Felson een buurt met een hoge proportie van
eenpersoonshuishoudens een meer attractieve omgeving vormen voor het plegen van
woninginbraken dan gebieden met een sterkere familieoriëntatie. Sampson (1986) vond
bevestiging voor deze hypothese van Felson die er van uitgaat dat de familiestructuur invloed
heeft op het aantal woninginbraken die een buurt gepleegd worden. De familiestructuur heeft
volgens deze studie invloed op zowel sociale controle ten opzichte van daders als op het
aantal gelegenheden die zich voordoen om woninginbraken te plegen.
Een laatste controlemechanisme zijn de plaatsbeheerders. Deze staan in voor de informele
sociale controle. Plaatsbeheerders (place managers) zoals receptionisten, lokale
kleinhandelaars, conciërges, liftjongens en treinconducteurs regelen het gedrag op de plaatsen
die zij controleren. Het is slechts wanneer zij afwezig, onoplettend of ineffectief zijn dat
criminaliteit kan gepleegd worden.
We kunnen voorgaande samenvatten in volgende tabel (Tabel 1).
Tabel 1: Controlemechanismen vs. hetgeen ze controleren.
A
B
C
Doelwit
Potentiële dader
Plaats
Bewaker
Intimate handler
Plaatsbeheerder
Bron: Felson (1995, 55)
Een vierde controlemechanisme, het publiek (passanten, buurtbewoners, e.d.) komt in de
routine activiteiten theorie niet tot zijn recht. Toch is ook dit een controlemechanisme. Het
publiek zorgt immers voor een natuurlijke toezicht (Jacobs, 1961). Angel (Block, 1999;
Loukaitou-Sideris, 1999, 399) bestudeerde in deze context de relatie tussen criminaliteit en de
intensiteit waarmee een plaats gebruikt wordt, met andere woorden de relatie tussen
criminaliteit en het aantal doelen die aanwezig zijn op die bepaalde plaats. Angel suggereert
dat wanneer een plaats weinig gebruikt wordt er ook weinig delicten gepleegd zullen worden
(Figuur 1: Zone 3). Het gebrek aan potentiële doelen beperkt immers het aantal
opportuniteiten. Wanneer het gebruik van een plaats intenser wordt, wanneer dus het aantal
potentiële slachtoffers, het aantal opportuniteiten, voldoende groot is, zal die plaats de
aandacht van potentiële daders trekken. Er is op dat moment echter te weinig publiek om in
voldoende sociale controle te voorzien. Volgens Angel is dit een ‘critical intensity zone’
(kritieke intensiteitzone) waarin de meeste delicten plaats vinden (Figuur 1: Zone 2). Wanneer
13
het gebruik van een plaats verder intensifieert, daalt, volgens Angel, criminaliteit (Figuur 1:
Zone 1). Immers de informele sociale controle stijgt.
De theorie van Angel wordt deels bevestigd door onderzoek van Loukatiou-Sideris (1999). Zij
stelt dat de kritieke intensiteitzone een rol speelt bij ernstige delicten. Voor kleinere delicten
zoals gauwdiefstal wordt een tweede kritieke zone onderscheiden namelijk die situatie die
gekenmerkt wordt door een zeer intensief gebruik van de plaats. In tegenstelling tot de eerste
zone (Figuur 1: Zone 1) uit Angel’s theorie, waar criminaliteit daalt door een intenser gebruik,
zal in deze eerste zone het aantal feiten voor minder zware delicten, zoals gauwdiefstal,
stijgen. Het afschrikkend effect van natuurlijke surveillance wordt voor dergelijke delicten
gereduceerd.
Figuur 1: Criminaliteit als een functie van de mate van het gebruik van een plaats.
Intensiteit van het gebruik van een plaats
Aantal delicten
Zone 3
Zone 2
Zone 1
Bron: Block (1999, 146)
Enerzijds kunnen daders zich in dergelijke situaties beter in de massa verschuilen. Anderzijds
zullen omstanders minder snel reageren omdat zij er van uitgaan dat anderen wel zullen
reageren en het slachtoffer helpen. Met andere woorden, Loukatiou-Sideris veronderstelt dat
voor sommige, minder ernstige, delicten de effectiviteit van sociale controle daalt naarmate
het gebruik van een plaats stijgt.
14
1.2. De patroontheorie
Daar waar de ‘routine activiteiten theorie’ plaatsen als problematisch bestempeld omwille van
het type van personen die op die plaatsen aan (potentiële daders) of afwezig
(controlemechanismen) zijn, onderzoekt de ‘patroontheorie’ (Brantingham, 1981) de
interactie tussen daders en hun fysieke en sociale omgeving die de keuze van doelen
beïnvloedt. Volgens de patroontheorie bepaalt de manier waarop doelen in het aandachtsveld
komen van potentiële daders de spreiding van criminaliteit over tijd en ruimte. Dit gebeurt
omdat daders routine activiteiten uitvoeren. Net als niet-criminele personen verplaatsen
daders zich tussen huis, werk (of school), recreatieplaatsen en winkelruimten
7
. Wanneer zij dit
doen worden zij zich bewust van mogelijkheden om criminaliteit te plegen. Het gebied
(awarness space) dat personen echter bestrijken bij het uitvoeren van hun routine activiteiten
is niet zo groot. Criminele opportuniteiten die buiten dit gebied liggen waarin daders zich
verplaatsen om hun dagelijkse activiteiten te vervullen zullen waarschijnlijk niet opgemerkt
worden. Alhoewel sommige potentiële daders actief op zoek gaan naar mogelijke doelwitten
op onbekend terrein zouden volgens Costello (2001) de meeste daders hun doelen selecteren
in gebieden waarmee zij, door toevallige ontmoetingen ten gevolge van hun dagdagelijkse
activiteiten, vertrouwd zijn. Uit onderzoek naar dadermobiliteit is trouwens gebleken dat
daders zich niet zo ver verplaatsen. De afstand tussen woonplaats en pleegplaats is met andere
woorden klein. De afstand waarvan melding wordt gemaakt in verschillende studies (Costello,
2001; Hesseling, 1992) varieert tussen 2 en 4 kilometer. Tevens blijkt dat de frequentie van
het aantal misdrijven, naarmate de afstand tot het woonadres van de dader toeneemt, daalt
(Hesseling, 1992). Met andere woorden, de verdeling van de het aantal misdrijven naar
afstand vertoont een specifiek patroon namelijk een ‘distance-decay’ patroon. Brantingham
(1981) wijst er op dat daders geen doelen zullen selecteren die in de onmiddellijke nabijheid
van hun woonplaats gelegen zijn omdat zij vrezen herkend te worden.
Uit onderzoek blijkt ook dat mobiliteit varieert naargelang leeftijd, geslacht en delicttype
(Costello, 2001, 29; Eck, 1995, 16-17). Zo zullen jonge delinquenten zich minder ver
verplaatsen dan oudere daders (Reiss, 1991), zullen vrouwen grotere afstanden afleggen en
zullen delicten zoals aanranding en verkrachting dichter bij huis worden gepleegd dan
delicten zoals diefstal en woninginbraak.
7
Het is met andere woorden niet denkbeeldig dat concentraties van criminaliteit zich onder andere in de buurt
van belangrijke verkeersassen en transitzones (grote busstations, metrostations en treinstations) zullen
bevinden.
15
Zowel de ‘routineactiviteiten theorie’ als de ‘patroon theorie’ gaan er van uit dat daders
rationeel handelen. Wanneer daders tijdens het uitoefenen van routine activiteiten of via actief
doelgericht zoeken, potentiële doelwitten ontdekken, zullen zij, afhankelijk van de
beslissingen welke ze nemen in een keuzeproces, overgaan tot het plegen van criminaliteit
(Brantingham, 1981; Felson, 1980). Volgens sommige studies (Eck, 1995) die dit keuzeproces
hebben bestudeerd gaat het om een rationeel keuzeproces.
1.3. Verplaatsing
Zowel de hierboven besproken ‘oudere’ theorieën zoals Newmans ‘defensible space’ als meer
recente theorieën zoals de ‘routineactiviteiten theorie’ stellen allen situationele
criminaliteitspreventie voor om criminaliteit te reduceren. Via situationele
criminaliteitspreventie tracht men criminaliteit onder controle te houden door het aantal
gelegenheden die geschikt zijn om criminaliteit te plegen te beperken. Dit gebeurt door
ingrepen in de fysieke omgeving (Clarke, 1992). Een belangrijk hinderpaal voor het gebruik
van situationele preventie, is de idee van verplaatsing. Dit idee, dat wanneer er op bepaalde
plaatsen preventiemaatregelen worden genomen criminaliteit zich zal verplaatsen, is intuïtief
makkelijk te begrijpen en is daardoor wijdverbreid. Net omdat dit idee van verplaatsing zo
verspreid is, staan velen weigerachtig om situationele preventie te gebruiken.
Deze vrees voor verplaatsing bij het implementeren van gerichte situationele
preventiestrategieën komt volgens sommigen door de te nadrukkelijke aandacht op de meer
dadergerichte traditionele criminaliteitstheorieën (Gabor, 1981) die vaak uitsluitend aandacht
hebben voor de interne motivatie van daders om criminaliteit te plegen. Zij hebben geen
aandacht voor omgevingskenmerken zoals sociale en fysieke eigenschappen die het plegen
van criminaliteit kunnen helpen voorkomen. Volgens deze meer traditionele theorieën is
verplaatsing van criminaliteit onvermijdelijk. Immers wanneer daders door
preventiemaatregelen verhinderd worden om delicten te plegen, zullen zij zich aanpassen en
zal de criminaliteit zich verplaatsen. Daders zijn volgens deze theorieën intern gemotiveerd en
zijn voorbestemd om criminaliteit te plegen (Gabor, 1981; Reppetto, 1975). Met andere
woorden, daders zullen, wanneer opportuniteiten tot het plegen van een type van criminaliteit
beperkt of weggenomen worden, op zoek gaan naar alternatieven.
Het probleem van verplaatsing is één van de belangrijkste kritieken op het situationele
criminaliteitspreventie denken. De negatieve aspecten die gepaard gaan met verplaatsing,
gecombineerd met de, volgens de traditionele theorieën, onvermijdelijkheid van verplaatsing
16
worden door critici van het situationeel preventie denken gebruikt om aan te tonen dat sociale
of corrigerende
8
preventie effectiever zou zijn dan het gebruik van situationele
preventiemethoden.
Dit is de tweede belangrijke kritiek op de situationele preventiemethoden. Dergelijke
strategieën zouden de echte oorzaken van criminaliteit niet aanpakken omdat zij niet gericht
zijn op de bereidheid, de interne motivatie en de wens van individuen om criminaliteit te
plegen (Town, 2001).
Behalve ruimtelijke verplaatsing
9
onderscheiden Barnes (1995), Gabor (1981) en Reppetto
(1976) nog andere manieren waarop daders zich kunnen aanpassen. Het betreft temporele
verplaatsing
10
, doelverschuiving
11
, tactische verplaatsing
12
en verandering van het type
gepleegde delicten
13
. Daarnaast is er nog een constante instroom van nieuwe daders
14
. Het
resultaat is dat criminaliteit niet gereduceerd, maar enkel verplaatst wordt.
Verplaatsing kan ook verklaard worden vanuit het rationele keuzeperspectief. Door enerzijds
de inspanningen die vereist zijn om een delict te plegen en de kans op detectie te verhogen en
anderzijds de beloning die het plegen van een delict met zich mee brengt te verlagen, tracht
situationele preventie de kosten - baten analyse die een rationele dader maakt, te beïnvloeden.
Met andere woorden er wordt getracht het plegen van criminaliteit minder aantrekkelijk te
maken. Daders zullen op objectieve veranderingen, die tot stand komen door situationele
criminaliteitspreventie, reageren met het maken van een nieuwe kosten - baten analyse. Als zij
tot de conclusie komen dat het nut van het plegen van een delict onder deze vernieuwde
8
Corrigerende preventie verwijst naar die vormen van preventie waar of individuele daders worden behandeld of
waar via ruimere sociale welvaartsprogramma’s getracht wordt om de kans op het plegen van delicten door
leden van potentiële dadergroepen te reduceren. (Reppetto, 1976)
9
Daders trekken weg uit gebieden waar het plegen van criminaliteit sterk gehinderd wordt. Zij verplaatsen hun
actieterrein naar meer kwetsbare gebieden.
10
Daders blijven hetzelfde type van delicten plegen op dezelfde plaatsen met dezelfde reeds gebruikte
strategieën tegen dezelfde doelwitten. Daders verschuiven enkel het plegen van delicten naar die uren van de
dag of die dagen van de week op welke zij de kans op detectie als kleinst beschouwen.
11
Daders laten goed beschermde doelwitten links liggen en focussen hun aandacht op meer kwetsbare doelen.
12
Daders plegen delicten op dezelfde tijdstippen en plaatsen en tegen dezelfde doelwitten maar zij gebruiken
andere strategieën. Zij doen dit op een manier waarop zij de preventiemaatregelen kunnen omzeilen. Zo is het
mogelijk dat de installatie van alarmsystemen in winkels er daders toe aanzet niet langer op een ‘gewone’
manier, zoals het forceren van een deur, inbreken maar dat zij nu winkels via ramkraken binnendringen om
zich zo op een snelle manier toegang te verlenen en vervolgens na het mee graaien van buit zich snel uit de
voeten maken.
13
Daders reageren op het verhinderen van een specifieke vorm van criminaliteit door het kiezen voor het plegen
van andere vormen van criminaliteit.
14
Wanneer bepaalde daders van het toneel verdwijnen omdat ze of gearresteerd worden of beslissen te stoppen
met het plegen van criminaliteit wordt hun plaats ingenomen door andere delinquenten.
17
omstandigheden te klein zijn, zullen zij het delict niet plegen. Daders zoeken vervolgens naar
andere gelegenheden waar het gepercipieerde nut groter is.
Een ander mogelijk voordeel van situationele criminaliteitspreventie is de gevolgen die het
meebrengt voor daders. Terwijl een groot deel van het criminele carrière (Eck, 1995)
onderzoek heeft aangetoond dat de meeste daders generalisten zijn, blijkt er bij daders toch
een lichte voorkeur te bestaan voor bepaalde delicten. Dit sluit aan bij het denken omtrent de
rationele mens. Het gedrag van een homo-economicus impliceert immers dat een individu
bepaalde zaken op een consistente manier prefereert boven andere (De Clerq, 1996). Zo ook
voor het plegen van criminaliteit. Een potentiële dader zal die opportuniteiten tot het plegen
van criminaliteit benutten die hem toelaten die delicten te plegen die in zijn hiërarchie van
geprefereerde delicten vooraanstaan. Cornish en Clarke (1987) suggereren dat kenmerken van
verschillende delicten door criminelen wordt gebruikt om de meest geprefereerde vorm van
criminaliteit te selecteren. Volgens dit concept zullen daders gelijkaardige gestructureerde
vormen van criminaliteit plegen wanneer hun favoriete manier van het plegen van delicten
verhinderd wordt. Wanneer daders voorkeuren ontwikkelen voor bepaalde delictvormen is het
aannemelijk dat zij meer en meer vertrouwd raken met het type van delict dat zij plegen.
Telkens wanneer hun normale criminaliteitspatronen verstoord worden door externe
interventie zullen criminelen nieuwe minder goed gekende criminele activiteiten gaan
opzoeken. Het concept ‘familiarity decay’ conceptualiseert het effect dat het gebrek aan
kennis van een dader heeft op de kans op verplaatsing. Hoe lager de vertrouwdheid met
alternatieve criminele opportuniteiten, hoe lager de kans op verplaatsing (Figuur 2). Om
effectief te zijn moet preventie dan ook zo storend mogelijk inwerken op de patronen die
daders hanteren.
De aanhangers van de routine activiteiten theorie gaan akkoord dat verplaatsing van
criminaliteit zich kan voordoen, maar verplaatsing is volgens hen beperkt. Zij gaan er immers
vanuit dat het volume van criminaliteit afhankelijk is van de mate van aanwezigheid van
geschikte doelwitten en potentiële daders en de mate van afwezigheid van
controlemechanismen. Wanneer het aantal geschikte doelwitten daalt en de capaciteit van de
controlemechanismen stijgt, wordt er verwacht dat criminaliteit daalt zonder dat er zich een
verplaatsing van criminaliteit hoeft voor te doen. Immers potentiële daders ontdekken
doelwitten tijdens het uitvoeren van hun routineactiviteiten. Wanneer op die plaatsen waar zij
komen tijdens hun routine activiteiten de opportuniteiten tot het plegen van criminaliteit
gereduceerd zijn dan is het waarschijnlijk dat criminaliteit op die plaatsen ook zal dalen.
18
Figuur 2: Familiarity decay
Familiarity Decay
Mate van vertrouwdheid
Hoge mate van verplaatsing
Lage mate van verplaatsing
Huidige opportuniteiten
Alternatieve opportuniteiten
Bron: Barnes (1996, p 106)
Criminaliteit zal zich enkel verplaatsen wanneer daders actief op zoek gaan naar nieuwe
gelegenheden.
Gabor en Eck (Town, 2001, 8) die verplaatsing van criminaliteit bestudeerden, vonden dat
verplaatsing zich minder voordeed dan algemeen werd aangenomen. Hesseling (Town, 2001,
8) die 55 bestaande studies, waarin verplaatsing van criminaliteit onderzocht werd,
analyseerde, concludeerde dat verplaatsing mogelijk is maar dat het geen onvermijdelijk
gevolg is van situationele criminaliteitspreventie. Zelfs wanneer verplaatsing optreedt ten
gevolge van situationele preventie dan nog is de verplaatsing niet volledig en zou dus de
totale criminaliteit gereduceerd worden (Barnes, 1995, 98). Clarke (1992), in een poging om
de kritiek op de situationele preventietheorie betreffende verplaatsing te counteren,
introduceerde het begrip ‘diffusion of benefits’ (verspreiding van voordelen). We spreken van
verspreiding van voordelen wanneer criminaliteitspreventiestrategieën gericht op een
specifieke vorm van criminaliteit of op een bepaalde locatie hun preventieve effecten
verspreiden en een onverwachte daling in het aantal criminele delicten teweegbrengt.
Samenvattend werd in dit eerste deel stilgestaan bij het concept ‘plaats’ binnen de
criminologische theorievorming. Daaruit bleek dat de aandacht voor de relatie tussen
19
criminaliteit en plaats niet nieuw is. Zo werden er in de jaren zestig en zeventig en belangrijke
werken gepubliceerd waarvan onder andere Jacobs en Newman de bekendste auteurs zijn.
Meer recente theorieën zoals de routine activiteiten theorie en de patroontheorie kwamen
vervolgens aan bod. Al deze theorieën stellen situationele criminaliteitspreventie voor om
criminaliteit te reduceren. Uit de meer traditionele dadergerichte stromingen binnen de
criminologie kwam behoorlijk wat kritiek. Zij wezen er op dat situationele
criminaliteitspreventie de interne motivatie van daders om criminaliteit te plegen niet weg
neemt. Zij duidden tenslotte ook op het gevaar van verplaatsing.
20
Hoofdstuk II: Het voorbereiden van de data voor de
uiteindelijke hot spot analyse
Het opzet van dit boek is het bestuderen van verschillende technieken die tijdens een hot spot
analyse kunnen gebruikt worden om concentraties van criminaliteit te identificeren. Vooraleer
tot de identificatie van concentraties kan overgegaan worden moet er echter eerst wat
voorbereidend werk worden uitgevoerd. Zo moet de nodige data verzameld worden. Dit
betreft in eerste instantie politionele data. Daarnaast hebben we ook nood aan digitale kaarten.
Zij laten toe gevonden concentraties van criminaliteit te visualiseren. Naast het verzamelen
van de benodigde data moet ook op zoek gegaan worden naar de geschikte software die kan
gebruikt worden om hot spot analyses uit te voeren. Wij opteerden ervoor ArcView 8.1. en
CrimeStat II te gebruiken.
2.1. Politionele data.
Omdat we niet louter de technieken willen beschrijven die gebruikt kunnen worden om
concentraties van criminaliteit te identificeren maar ook aan de hand van enkele voorbeelden
willen tonen welke resultaten hot spot analyse opleveren, werd aan de Antwerpse lokale
politie data betreffende criminele feiten gevraagd. De Antwerpse politie stelde een
gedepersonaliseerde databank ter beschikking. Het betrof gegevens over criminele feiten die
tijdens het jaar 2001 gepleegd zijn en die door of de Antwerpse politie of een ander
politiekorps in 2001 geregistreerd zijn. Het betreft met andere woorden officiële politiecijfers.
Omdat we slechts voorbeelden willen geven van de verschillende technieken werd er
geopteerd om slechts die data te gebruiken welke betrekking hebben op een bepaald deel van
het grondgebied van fusiegemeente Antwerpen (Figuur 3). De totale politionele databank die
door de Antwerpse lokale politie ter beschikking werd gesteld telde 57 463 records. Het
betreft de aanvankelijke Processen Verbaal voor criminele feiten zoals zedendelicten,
opzettelijke slagen en verwondingen, verdovende middelen, diefstal en vandalisme die in
Antwerpen in 2001
15
werden gepleegd.
15
Er werd geopteerd om data uit 2001 te gebruiken omdat dit de meest recente beschikbare gegevens zijn.
21
Figuur 3: Studiegebied Antwerpen
22
Per proces-verbaal werden volgende gegevens verstrekt: type delict (vb diefstal uit auto,
winkeldiefstal, woningbraak), tijdsvork waarbinnen het delict gepleegd is en het adres
(straatnaam, huisnummer, postnummer). Zoals verder zal blijken zijn vooral de gegevens met
betrekking tot het adres heel belangrijk om hot spot analyses te kunnen uitvoeren.
Omdat we gebruik maken van officiële politiedata is het noodzakelijk de aandacht te vestigen
op de beperkingen die inherent zijn aan dergelijke data. Immers lang niet alle gepleegde
delicten zitten in de officiële cijfers vervat. Dit kan tot een vertekend beeld van de realiteit
leiden. Zonder in herhaling te willen vervallen wijzen we hier op de mogelijke hinderpalen
die er toe leiden dat een delict niet wordt geregistreerd door de politie
16
. Een eerste hinderpaal
of een crimineel feit al dan niet geregistreerd wordt, is de beslissing van een slachtoffer om
een delict aan te geven. Ainsworth (2001, 60-63) onderscheidt in dit kader negen mogelijke
redenen waarom personen al dan niet tot aangifte overgaan :
- het slachtoffer moet er zich van bewust zijn dat er een delict werd gepleegd;
- de ernst van het delict;
- de perceptie van het slachtoffer betreffende het handelen van de politie. Wat zal en kan
de politie ondernemen?
- de perceptie van het individu betreffende de manier waarop hij/zij door de politie zal
behandeld worden;
- de perceptie van het slachtoffer of het rapporteren van een delict hem/haar al dan niet in
een vervelende situatie zal plaatsen (vb. een getrouwde man die in een homobar beroofd
wordt);
- de kans dat het slachtoffer zelf vervolgd zal worden wanneer hij/zij aangifte doet van
een delict (vb. vechtpartijen);
- is het slachtoffer bedreigd?;
- de beslissing van het slachtoffer om al dan niet op een informele manier met het delict
om te gaan;
- economische reden (vb. de vergoeding van de schade door de verzekering op
voorwaarde dat het delict wordt aangegeven);
16
Zie ook: MacDonald, 2001; Van Altert, Enhus, 2003
23
Zelfs wanneer het slachtoffer beslist heeft aangifte te doen van een delict dan nog is het niet
zeker dat het delict uiteindelijk officieel geregistreerd wordt. De agent waarbij het slachtoffer
aangifte doet kan het slachtoffer er immers van overtuigen om het delict niet te laten
rapporteren. (Ainsworth, 2001; Van Altert, Enhus, 2003)
Officiële politiecijfers worden tevens beïnvloed door het gevoerde beleid omtrent
criminaliteit. Dit beleid zou idealiter uitgetekend moeten worden door de politieke overheden
en parketten in samenspraak met politie. Afhankelijk van het uitgestippelde beleid zullen
bepaalde vormen van criminaliteit prioritaire aandacht krijgen. Vaak houdt dit in dat er een
verhoogd aantal van dergelijke delicten, waar er dus specifiek op ingewerkt wordt, in de
officiële politiestatistieken zullen terecht komen. Met andere woorden de wijze waarop politie
te werk gaat, pro-actief of reactief, zal invloed hebben op de officiële politiecijfers.
Zowel de aangiftebereidheid als de door de politie gevolgde strategie kunnen wanneer hot
spots aan de hand van politionele data in kaart gebracht worden, leiden tot een vertekend
beeld. Wanneer bijvoorbeeld de Antwerpse politie in 2001 besloot om aan de tippelprostitutie
in het Schipperskwartier paal en perk te stellen, is het niet denkbeeldig dat er in die buurt
meer processen-verbaal opgemaakt zullen worden dan wanneer er geen acties plaats hadden
gevonden. Als vervolgens op basis van de politionele data voor het jaar 2001 een hot spot
analyse wordt uitgevoerd is het mogelijk dat het Schipperskwartier als hot spot gedetecteerd
wordt.
Ook de mate waarin delicttypes in de belangstelling staan kunnen een invloed hebben op de
registratie van die bepaalde delicttypes. De recente aandacht voor seksueel misbruik van
minderjarigen en vrouwen leidde tot een stijging in het aantal aangiften. Dit betekent niet dat
er meer misbruik zou zijn, maar wel dat er een maatschappelijke verschuiving is opgetreden
in de betekenis die aan dit misdrijf wordt gehecht. (Van Altert, Enhus, 2003)
24
2.2. Digitale kaarten
Digitale kaarten zijn gedigitaliseerde ‘papieren’ kaarten, bijvoorbeeld een stratenatlas maar
dan in digitale vorm. Deze kaarten zijn noodzakelijk om enerzijds criminele feiten te
geocoderen (zie infra) en anderzijds om via hot spots technieken gevonden concentraties te
visualiseren. De digitale kaarten die worden gebruikt om concentraties van criminaliteit te
visualiseren werden door Telepolis Antwerpen
17
ter beschikking gesteld.
De twee soorten digitale kaarten die het vaakst gebruikt worden zijn ‘vectorkaarten’ en
‘rasterkaarten’. Vectorkaarten zijn gebaseerd op ruimtelijk gerefereerde data. Dit zijn
gegevens die enerzijds de geografische locatie van de objecten op aarde bevatten en
anderzijds kenmerken van deze objecten beschrijven. Het standaard kaartformaat voor
vectorkaarten in het softwareprogramma ArcView 8.1. (zie infra) is de ‘shapefile’. In een
shapefile wordt de ruimtelijke locatie en de attribuutinformatie (zie infra) van de in kaart
gebrachte objecten bewaard. Dit gebeurt in minimaal drie en maximaal zeven bestanden met
elk een specifieke extensie
18
. Het bestand met de extensie ‘.dbf’ is het voor ons meest
interessante bestand omdat in dit bestand gegevens betreffende gebeurtenissen of voorwerpen
op plaatsen kunnen bewaard worden. Bijvoorbeeld, de digitale map die gebruikt werd om in
Figuur 4 de ligging van enkele politiecommissariaten in beeld te brengen is een shapefile. De
informatie die nodig is om deze commissariaten op een kaart te kunnen plaatsen wordt
bewaard in een attributentabel. Een attributentabel
19
bevat de gegevens over de plaats van een
object in de ruimte. Zo bevat de attributentabel noodzakelijk om de ligging van de
commissariaten in kaart te brengen, de xy-coördinaten voor elk van deze tien commissariaten.
In Tabel 2 wordt de attributentabel voor de commissariaten getoond. Met andere woorden, in
het hier gegeven voorbeeld vertegenwoordigen de punten de plaatsen waar
politiecommissariaten gevestigd zijn. In de kolom ‘adres’ (Tabel 2) wordt het adres
weergegeven. Dit laat toe om de punten te labelen, in dit geval een adres. Dit gebeurde voor
enkele politiebureaus die op de puntenkaart worden getoond (Figuur 4).
17
Telepolis Antwerpen is de informaticaleverancier van de stad, de haven en het OCMW van Antwerpen. Zie:
http://www.telepolis.be
18
Type bestanden:
- *.shp : dit bestand bevat de geometrie van de elementen
- *.shx : dit bestand bevat de index van de geometrie van de elementen
- *.dbf : dit is een database waarin de onderliggen attribuutgegevens bewaard worden. *.sbn / *.sbx :
deze bestanden bevatten de ruimtelijke index voor de elementen. Ze worden gecreëerd bij het uitvoeren van
‘theme-on-theme’ selecties of ‘spatial join’.
- *.ain / *.aih : deze bestanden bevatten de attributen-index voor de actieve velden in een tabel. Ze
worden aangemaakt bij het uitvoeren van ‘link’-bewerkingen op de tabellen.
19
De gegevens uit een attributentabel worden in een .dbf bestand bewaard.
25
Figuur 4: Voorbeelden van vectorkaarten
26
Tabel 2: Voorbeeld attributentabel
X
Y
ADRES
150771,6274983
209007,9799313
111 SINT BERNARDESTEENWEG
152772,2280122
212231,9430703
40 LANGE NIEUWSTRAAT
151832,5630513
211722,5337898
6 KORTE VLIERSTRAAT
150619,3480102
212477,1083185
84 HALEWIJNLAAN
153450,4080448
211208,5587493
20 QUINTEN MATSYSLEI
152016,2950195
210683,6137889
104 PALEISSTRAAT
153389,9185087
209324,8115476
1 DE WITTESTRAAT
154586,5405259
211444,0569896
1 MAREESTRAAT
154344,6290376
212709,6797107
101 HANDELSSTRAAT
155066,8059983
209934,2314522
27 JUNOTSTRAAT
Shapefiles kunnen echter maar één soort object bevatten. Of ‘punten’, zoals in het voorbeeld
met de politiecommissariaten, of ‘lijnen’ (polyline) of ‘polygonen’ (Figuur 4). De drie
verschillende typen shapefiles kunnen wel over elkaar heen gelegd worden. Op die manier
ontwerpt de gebruiker kaarten waarbij en punten en lijnen en polygonen getoond worden.
Wanneer bijvoorbeeld de puntenkaart en de lijnenkaart uit Figuur 4 boven elkaar worden
geplaatst dan ontstaat een kaart waar zowel de ligging van commissariaten als de belangrijkste
verkeersassen in Antwerpen worden getoond (Figuur 5).
Het tweede type digitale kaarten zijn ‘rasterkaarten’. Deze kaarten zijn net als vectorkaarten
digitale kaarten. Zij worden vaak gebruikt ter ondersteuning van vectorkaarten of als basis om
vectorkaarten aan te passen (editeren) en te digitaliseren. Het grote verschil met een
vectorkaart is dat een rasterkaart opgebouwd is uit pixels en dat er geen onderliggende
attributentabel met verbonden is.
De digitale kaarten waarvan we gebruik maken tijdens het uitvoeren van de hot spot analyse
zijn vectorkaarten. De voor ons belangrijkste digitale kaart is een punten shapefile die
gegevens bevat betreffende de locatie van gebouwen in Antwerpen. De gebouwen worden via
deze shapefile weergegeven door een punt. Naast informatie over de geografische ligging van
de gebouwen is ook het adres (straatnaam, huisnummer, postnummer) dat bij elk punt hoort
opgenomen. Met behulp van deze kaart kunnen criminele gebeurtenissen, afkomstig uit het
politionele databestand, een ruimtelijke locatie toegewezen krijgen (geocoderen).
27
Figuur 5: Politiecommissariaten, verkeersassen in Antwerpen
Een tekortkoming van deze digitale kaart is dat de functie
20
(appartement, kantoor, winkel,
taverne,…) van de gebouwen niet in de onderliggende attributentabel vervat zit. Informatie
betreffende de functie van de gebouwen zou een meerwaarde zijn bij de analyse van de
spreiding van criminaliteit.
Een tweede digitale kaart die we gebruikten is een polyline shapefile die de verschillende
straten in Antwerpen bevat. Deze kaart bevat onder andere per straat informatie over welke
functie (hoofdweg, snelweg, …) de desbetreffende straat heeft. Op basis van deze kaart kan
de lengte van de straten berekend worden. Een andere kaart met informatie over de
verschillende straten in Antwerpen is een punten shapefile. Ze bevat de middelpunten van de
verschillende straten in Antwerpen. Met behulp van deze kaart kunnen symboolkaarten
gecreëerd worden die het aantal gepleegde delicten per straat in beeld brengen (zie infra).
Twee ander kaarten die tenslotte gebruikt werden bevatten gegevens over de NIS sectoren in
Antwerpen. De eerste kaart is een punten shapefile die de middelpunten van de verschillende
28
NIS sectoren bevat. Net als met de digitale kaart die de middelpunten van de straten bevat
kunnen met deze map symboolkaarten worden aangemaakt die inzicht verschaffen over het
aantal delicten per NIS sector. De tweede kaart is een polygonenkaart die de verschillende
NIS sectoren in Antwerpen bevat. Aan de hand van deze digitale map kunnen choropleten
gecreëerd worden.
2.3. Geocoderen
Alvorens de politionele data ruimtelijk te kunnen analyseren, moet deze eerst voor analyse
klaar gemaakt worden. Het politionele databestand waar op gewerkt wordt mag dan wel
gegevens bevatten over waar een delict gepleegd is (straat, huisnummer, postcode), het bevat
echter niet de xy-coördinaten die nodig zijn om de pleegplaats, aan de hand van een digitale
kaart, in de ruimte te plaatsen, xy-coördinaten die tevens nodig zijn om verschillende analyses
met behulp van CrimeStat II uit te voeren. Door het geocoderen
21
van criminele feiten wordt
de te analyseren politionele data voorzien van noodzakelijke geografische informatie, met
name de xy-coördinaten. Met andere worden, geocoderen (Minami, 2000, 506) of het
matchen van adressen is het proces waarbij geometrische representaties gecreëerd worden
voor locaties (zoals puntkenmerken) van beschrijvingen van locaties (zoals adressen). Bij het
matchen van adressen worden xy-coördinaten toegekend aan de adressen zodat ze als punten
op een kaart kunnen getoond worden. Geocoderen kan zowel automatisch als manueel
gebeuren.
Geocoderen kan best vergeleken worden met het ‘joinen’
22
(samenvoegen) van data. Dit is de
techniek waarbij informatie uit verschillende attributentabellen in één tabel wordt
samengevoegd. Dit wordt aan de hand van een voorbeeld geïllustreerd (Tabel 3). Telepolis
Antwerpen stelde een digitale kaart ter beschikking die de verschillende Antwerpse NIS
sectoren bevatte. Bij deze kaart hoort een attributentabel (attributentabel 1). Andere
informatie over Antwerpse NIS sectoren zoals het aantal delicten per sector wordt bewaard in
een tweede attributentabel. Om beide tabellen tot een nieuwe tabel te kunnen samenvoegen
moet er een gemeenschappelijke kolom aanwezig zijn. Beide attributentabellen bevatten in
het hier gebruikte voorbeeld een gemeenschappelijke kolom die NIS sectorcodes bevat. Op
basis van deze kolom kan de ‘join’ plaats vinden. Even noodzakelijk bij het ‘joinen’ is dat de
gegevens uit de gemeenschappelijke kolom identiek zijn aan elkaar. Zo moet de NISCODE
20
Het ontwikkelingsbedrijf van de stad Antwerpen brengt momenteel de functies van gebouwen in kaart.
21
Voor meer informatie betreffende geocoderen met behulp van ArcMap zie Minami (2000, 411-429)
29
voor bijvoorbeeld de eerste record (11002L011) uit attributentabel 1 identiek zijn aan een
NISCODE uit attributentabel 2. Wanneer dit niet het geval is zal niet alle informatie
betreffende deze NISCODE in de nieuwe tabel worden opgenomen. Door het samenvoegen
zal een nieuwe tabel gecreëerd worden die zowel ‘shape’, ‘fid’, ‘NISCODE’ als ‘aantal
delicten’ zal bevatten.
Via joinen kunnen ook adressen gegeocodeerd worden op voorwaarde dat in het te matchen
bestand een kolom aanwezig is die overeenstemt met een kolom uit de attributentabel van de
digitale map waarmee gematched wordt. Het grote verschil tussen geocoderen en joinen is dat
bij het geocoderen foutenmarges kunnen ingesteld worden. Gegevens moeten met andere
woorden niet identiek zijn. Dit laat toe om bijvoorbeeld verkeerd gespelde adressen toch te
geocoderen.
Tabel 3: Joinen van twee attributentabellen: een fictief voorbeeld
Attributentabel 1 (digitale kaart)
Attributentabel 2
Shape
Fid
NISCODE
NISCODE
Aantal delicten
Polygon
1
11002L011
11002L011
8
Polygon
2
11002P50-
11002P50-
10
Polygon
3
11002K214
11002K214
15
Polygon
4
11002R101
11002R101
3
Vooraleer er kan gegeocodeerd worden moet er een geocoding service
23
worden aangemaakt.
Belangrijk hierbij is dat, afhankelijk van de wijze waarop deze geocoding service wordt
opgebouwd, de notatie van een adres aan bepaalde voorwaarden moet voldoen. In dit
onderzoek werd de Amerikaanse notatie gebruikt waarbij eerst het huisnummer en dan de
straatnaam komt. Opdat de data uit de politionele databank gematched kunnen worden moeten
de adressen dezelfde notatie hebben. Met andere woorden eerst huisnummer, dan straatnaam.
Het geocoderen van adressen brengt verschillende problemen met zich mee. Ten eerste, aan
sommige delicten kunnen geen locaties in de ruimte toegewezen worden omdat de nodige
gegevens (straatnaam, huisnummer) ontbreken. Voor criminele feiten is dit niet geheel
onlogisch. Wanneer bijvoorbeeld iemand die na een lange werkdag ‘s avonds moe thuis komt,
vaststelt dat zijn/haar portefeuille verdwenen is, vervolgens aangifte gaat doen bij de politie
22
Voor meer informatie betreffende het joinen van tabellen met behulp van ArcMap zie (2001, 312-319).
23
Dit gebeurt aan de hand van de punten shapefile gebouwen Antwerpen (zie supra).
30
zal hij/zij waarschijnlijk niet kunnen vertellen in welke straat de portefeuille verloren of
gestolen werd, laat staan een huisnummer opgeven. Voor delicten zoals diefstal uit auto zal
vaak de straat waar het delict zich afspeelde gekend zijn, het huisnummer ontbreekt meestal.
Bijvoorbeeld, van de ongeveer 57.500 records, die het door de politie aangeleverde
databestand bevatte, ontbrak voor bijna 24.000 delicten een huisnummer. Voor iets meer dan
de helft van de 11.924 diefstallen uit auto was geen huisnummer gekend. Wanneer echter
enkel de straat gekend is, kunnen geen ruimtelijke coördinaten worden toegewezen aan een
delict. Hiervoor is immers ook kennis nodig van het huisnummer. Afhankelijk van het type
delict, konden tussen 50 en 80% van de feiten gegeocodeerd worden. Dit is heel weinig en
kan tot ernstige vertekeningen leiden van de werkelijkheid wanneer er hot spot analyses
worden uitgevoerd. Sommige Amerikaanse politiekorpsen zoals de Lincoln Police
24
(Lincoln,
Nebraska, USA) slagen erin tot 98% van de feiten te geocoderen. De agenten hebben er onder
andere duidelijke richtlijnen gekregen om gegevens over de locatie te noteren wanneer zij
voor een oproep ter plaatste moeten gaan.
Zelfs wanneer de straatnaam en het huisnummer gekend zijn, kunnen er zich problemen
voordoen bij het geocoderen. Wanneer straatnamen in het politionele databestand verschillend
genoteerd zijn in vergelijking met de straatnamen in de digitale kaart dan zullen de adressen
niet gematched worden. Bijvoorbeeld, de straat ‘Sint Jacobusstraat’ kan in het politionele
databestand als ‘St. Jacobusstraat’ opgenomen zijn, terwijl ze in de onderliggende
attributentabel van de digitale kaart voluit geschreven wordt. Met andere woorden, een adres
uit voornoemde straat die in het politionele databestand vervat zit zal hoogstwaarschijnlijk
niet gegeocodeerd worden wanneer de schrijfwijze in beide bestanden niet met elkaar
overeenstemt.
Niet enkel verschillende schrijfwijzen of het ontbreken van exacte gegevens in het te matchen
databestand zijn oorzaken dat adressen niet gegeocodeerd worden. Ratcliffe (2001)
onderscheidt in dit kader nog enkele andere mogelijke foutenbronnen :
- De gebruikte digitale adressenkaart is niet up to date. Nieuwe straten en/of gebouwen
zijn niet opgenomen.
- Sommige straten in een gemeente hebben de zelfde naam. Hierdoor kunnen adressen een
foutieve plaats in de ruimte toegewezen worden.
- De gebruikte digitale kaart bevat niet bestaande adressen. Dit zijn adressen die foutief
werden ingevoerd. Bijvoorbeeld, de persoon die de digitale kaart construeert, voert het
24
Zie: http://www.ci.lincoln.ne.us/city/police/
31
adres Jan Van Rijswijcklaan nr 110 in. Door een onoplettenheid heeft hij/zij echter het
nr 1100 ingetypt. Dit adres bestaat echter niet.
- ‘Line simplification’: dit is het proces waarbij bochten in een polyline file worden
opgebouwd aan de hand van kleine rechte lijnen (segmenten). Dit proces wordt vaak
gebruikt in GIS toepassingen om de visualisatie van bochten te vereenvoudigen en om
de grootte van het databestand te reduceren. Het gevaar bestaat dat bochten die op deze
manier geconstrueerd zijn niet de werkelijkheid vertegenwoordigen. Hierdoor kunnen
punten een foutieve plaats in de ruimte toegewezen krijgen.
- Ambigue of vage adressen die het onmogelijk maken om het echte adres te
onderscheiden.
2.4. Software
Twee software pakketten werden gebruikt om concentraties van criminaliteit te identificeren.
Een eerste pakket is ‘ArcView 8.1.’
25
. Dit is een GIS (Geographical Information System)
toepassing. Dit software pakket, ontwikkeld door het Environmental Systems Research
Institute
26
(ESRI), is in eerste instantie ontworpen voor geografische datavisualisatie, het
bevragen, analyseren en beheren van geografische data en de opmaak van digitale kaarten.
ArcView 8.1. bestaat uit drie onderdelen namelijk ‘ArcCatalog’, ‘ArcMap’ en ‘ArcToolbox’.
Via ArcCatalog wordt de data beheerd. ArcMap wordt gebruikt voor het aanmaken van
kaarten en het editeren en analyseren van data. ArcToolbox tenslotte wordt gebruikt voor het
converteren van data. (Booth, 2001). Wij hebben ArcView 8.1. in de eerste plaats gebruikt om
de politionele data te geocoderen. De basisversie ArcView 8.1. kan worden uitgebreid met
verschillende extensies zoals ‘Geostatistical Analyst’ en ‘Spatial Analyst’. Deze extensies
laten toe meer gesofistikeerde analyses uit te voeren. Een minpunt van deze extensies is hun
kostprijs. Elke extensie moet immers apart worden aangekocht. Omdat de complexere
analyses die wij willen doen ook via CrimeStat II kunnen uitgevoerd worden, werd geopteerd
enkel dit laatste programma te gebruiken om concentraties van criminaliteit te identificeren.
25
Voor meer informatie over het gbruik van ArcView 8.1. verwijzen we de lezer naar bijdragen van Booth
(2001); Vienneau (2001); Minami (2000); Shaner (2000); Johnston (2001); McCoy (2001) en Kennedy
(2000).
26
www.esri.com
32
Naast het hier gebruikte ArcView 8.1. kan ook MapInfo
27
gebruikt worden. Dit is net als
ArcView 8.1. een GIS toepassing. Deze toepassing wordt momenteel gebruikt door sommige
strategisch analisten van de federale politie.
Een ander nuttig tool voor strategisch analisten is CrimeView 2002. Dit is een software
programma ontwikkeld door ‘The Omega Group’
28
en is compatibel met ESRI’s ArcView
8.1. Het laat toe in een gebruiksvriendelijke klik-omgeving onder andere snel
geautomatiseerde ‘queries’ en analysis uit te voeren. Dergelijke analyses en ‘queries’ kunnen
ook via ArcView 8.1. gebeuren maar daar zal de gebruiker bijvoorbeeld de ‘queries’ manueel
moeten uitvoeren.
‘CrimeStat II’ (Levine, 2002) is een ruimtelijk statistisch programma dat gebruikt wordt om
hot spots te detecteren. Het is ontwikkeld door Ned Levine & Associates op vraag van het
Amerikaanse National Institute of Justice. Het programma is Windows gestuurd en is
complementair met de meeste bestaande GIS applicaties zoals MapInfo en ArcView. Het doel
van dit programma is politiediensten, strategisch analisten in het bijzonder, te voorzien van
bijkomende statistische middelen die toelaten concentraties van criminaliteit te identificeren
en in kaart te brengen. CrimeStat II is de meest recente
29
versie en is, in tegenstelling tot
CrimeStat I complementair, met ArcView 8.1. CrimeStat II en de bijhorende handleiding
kunnen gratis afgehaald worden van het internet
30
.
Het programma laat toe incident locaties (vb. plaatsen waar gauwdiefstallen worden
gepleegd) in te lezen die in verschillende type bestanden (.dbf, .shp en ASCII) bewaard zijn
op voorwaarde dat in deze databestanden geografische informatie, zoals xy-coördinaten,
vervat zit. Het berekent verschillende ruimtelijke statistieken zoals Spatial and Temporal
Analysis of Crime (STAC) en Nearest Neighbor Hierarchical Clustering (NNH). Het
produceert tevens kaarten die in ArcView, MapInfo, Atlas*GIS, Surfer for Windows en
ArcView Spatial Analyst gebruikt kunnen worden. (Levine, 2002)
27
www.mapinfo.com
28
www.theomegagroup.com
29
CrimeStat II is sinds midden augustus beschikbaar.
30
CrimeStat II en de bijhorende manual kan op volgende internet adressen gedownload worden :
http://www.icpsr.umich.edu/NACJD/crimestat.html; http://www.nedlevine.com/nedlevine17.htm
33
Samenvattend, in dit tweede hoofdstuk werd aan vier onderwerpen aandacht geschonken. Er
werd stilgestaan bij de gebruikte data (politionele data) en de beperkingen ervan. Verder werd
uitleg gegeven over de digitale kaarten waarover men moet beschikken om concentraties van
criminaliteit te visualiseren en aangegeven op welke wijze ze kunnen gebruikt worden.
Daarnaast werd ruim aandacht besteed aan het geocoderen van adressen en de mogelijke
problemen die daarmee gepaard om tenslotte nog even blijven stil te staan bij de software
pakketten die gebruikt worden bij het uitvoeren van een hot spot analyse namelijk ArcView
8.1. en CrimeStat II.
34
Hoofdstuk III : Geaggregeerde hot spot technieken
De voorbije jaren is er een grote vooruitgang geboekt in het ontwikkelen van methoden die
criminogene hot spots identificeren (McLafferty, 1999). Ontwikkelingen in GIS toepassingen
en ruimtelijke analyse maken het mogelijk gegeocodeerde criminaliteitsinformatie te
visualiseren en te analyseren op manieren die in voorgaande decennia niet voor mogelijk
werden gehouden.
Twee grote categorieën van technieken die gebruikt worden om concentraties van
criminaliteit te ontdekken, kunnen onderscheiden worden. Een eerste categorie, waarin we in
dit hoofdstuk dieper op ingaan zijn de ‘geaggregeerde hot spot technieken’. Een tweede
categorie zijn de ‘puntgebaseerde methoden’. Wanneer gebruikt gemaakt wordt van
‘geaggregeerde methoden’ wordt gewerkt met geaggregeerde data op straatniveau of op
gebiedsniveau. ‘De uitgemiddelde waarde op basis van de lengte van de straat’ enerzijds en
het gebruik van ‘choropleten’ en de ‘Local Moran statistic’ anderzijds zijn voorbeelden van
respectievelijk op straatniveau en op gebiedsniveau gebaseerde technieken.
3.1. Uitgemiddelde waarde op basis van de lengte van de straat
Een van de problemen bij het werken met sommige puntgebaseerde technieken zoals de
‘modus’ en ‘Spatial and Temporal Analysis of Crime’ (zie infra) is dat dergelijke technieken
geen rekening houden met die delicten waarvan de exacte pleegplaats niet gekend is. Deze
criminele gebeurtenissen kunnen, omdat de nodige gegevens zoals bijvoorbeeld het
huisnummer ontbreken, niet gegeocodeerd. Er worden dus geen xy-coördinaten verbonden
met deze delicten. Bijgevolg kunnen deze delicten niet gevisualiseerd worden met behulp van
een GIS toepassing. Daarnaast zullen deze delicten ook niet worden opgenomen in analyses
die met behulp van CrimeStat II worden uitgevoerd. Immers CrimeStat II maakt gebruik van
xy-coördinaten en dus met die delicten met xy-coördinaten. Hierdoor is het mogelijk dat
resultaten een vertekend beeld van de werkelijkheid weergeven.
Omdat in vele gevallen de exacte pleegplaats niet gekend is (zie supra), wordt met de techniek
van de uitgemiddelde waarde geopteerd om op een hoger niveau, namelijk straatniveau, hot
spot analyses uit te voeren. Op die manier wordt rekening gehouden met die delicten waarvan
de exacte locatie, meer bepaald het huisnummer niet gekend is, maar wel in welke straat het
gepleegd is.
35
In deze techniek wordt eerst een uitgemiddelde waarde op basis van de lengte van de straat
(UWL) berekend. Deze waarde staat voor het gemiddeld aantal gepleegde delicten per x
meter in de desbetreffende straat.
x
L
D
UWL *=
UWL : uitgemiddelde waarde per x meter op basis van de lengte van de straat
D : aantal delicten per straat
L : lengte van de straat in meter
X : aantal meter
De straten geteisterd door een groot aantal feiten en die relatief kort zijn, zullen een hoge(re)
coëfficiënt hebben. Relatief korte straten met een klein aantal feiten krijgen een lage(re)
coëfficiënt, relatief lange straten met een klein aantal feiten een nog lagere coëfficiënt en
relatief lange straten met een zeer groot aantal feiten een hoge coëfficiënt. Deze waarde is met
andere woorden een indicatie van de concentratie van delicten in bepaalde straten.
Op basis van de berekende UWL kunnen in ArcView 8.1. straten geselecteerd worden met
een sterkere concentratie dan een vooraf bepaald criterium. Als criterium kan bijvoorbeeld
gekozen worden dat er gemiddeld 1 delict om de 10 meter in een straat moet gepleegd zijn
opdat de straat geselecteerd wordt
31
. Omdat niet enkel de concentratie in de ruimte maar ook
de concentratie in de tijd belangrijk is, kan een tweede selectiecriterium toegevoegd worden.
Dit is het gemiddeld aantal delicten dat om de x aantal dagen gepleegd wordt in een bepaalde
straat.
Aan de hand van de Antwerpse politionele data voor de periode 2001 werden twee hot spot
analyses op basis van UWL uitgevoerd (Figuur 6). In de eerste analyse opteerden we enkel
die straten te selecteren waar er gemiddeld minstens 1 delict om de 10 meter en waar er
gemiddeld minstens 1 delict om de 7 dagen werd gepleegd
32
, gedurende een periode van 1
jaar. Voor de tweede analyse werden er strengere selectiecriteria gebruikt. Opdat een straat
geselecteerd wordt, moet er, gedurende een periode van 1 jaar (2001), gemiddeld minstens 1
delict om de 5 meter en gemiddeld minstens 1 delict om de drie dagen gepleegd worden in die
straat.
31
Het stellen van de criteria is een belangrijke stap in de analyse van hotspots maar is tevens een puur
subjectieve aangelegenheid. Er bestaat momenteel geen enkele studie waar buiten het nagaan of een
techniek andere resultaten oplevert als de criteria wijzigen op het inhoudelijk probleem wordt ingegaan.
Criteria die zinvol zijn in een grootstad, zijn dit waarschijnlijk niet in een kleinere stad. De criteria dienen dus
bepaald binnen de te onderzoeken context. Ze dienen tenminste in verhouding te staan tot het totale volume
aan onderscheiden criminaliteitsvormen.
36
Figuur 6: UWL: enkele voorbeelden.
32
1 delict om de 7 dagen stemt overeen met iets meer dan 52 delicten op een jaar.
37
In het voorbeeld werd een periode van 1 jaar gebruikt. Mogelijke verplaatsingen van
criminaliteit in de ruimte, met andere woorden van hot spots, komen op deze manier niet te
voorschijn. De gebruiker kan om dit op te lossen, voorgaande analyse 12 keren uitvoeren, dit
voor de 12 maanden in een jaar. Vervolgens kunnen deze 12 analyses met elkaar vergeleken
worden. De gebruiker zal wel een minder streng UWL selectiecriteria moeten hanteren. Het
spreekt immers voor zich dat deze waarde heel wat lager zal liggen wanneer berekend voor
het aantal delicten die gedurende een maand zijn gepleegd dan wanneer berekend op basis van
alle delicten die gedurende een jaar werden gepleegd.
3.2. Symboolkaarten
Bij het gebruiken van symboolkaarten wordt een symbool geplaatst op de precieze plaats van
het voorkomen van een bepaalde variabele of op een vooraf bepaalde gebiedsomschrijving.
Via symboolkaarten kunnen zowel het aantal delicten die op een bepaalde locatie als het
aantal delicten die in een straat of een gebied zijn gepleegd, gevisualiseerd worden. De
grootte van het symbool zal variëren in functie van de absolute waarde van een variabele
(bijvoorbeeld het aantal feiten) (Heremans, 2002) (Figuur 7). Na het bekijken van de
symboolkaart kan men op intuïtieve manier de hot spots aanduiden. Er zijn echter
verschillende nadelen verbonden aan deze methode. Heremans (2002) wijst er op dat
verschillende beoordelaars vaak een andere mening hebben over de plaats en de
uitgestrektheid en over het aantal hot spots. Vooroordelen van de onderzoeker zijn niet uit te
sluiten.
Wanneer er, zoals in Figuur 7, gebruik gemaakt wordt van het middelpunt van de straat om
het aantal delicten per straat in kaart te brengen houdt men ten onrechte geen rekening met de
lengte van de straat. Er wordt met andere woorden geen rekening gehouden met spreiding van
delicten over de gehele lengte van de straat. Dit wordt via de techniek van de uitgemiddelde
waarde op basis van de lengte van de straat (zie supra) wel gedaan.
Eenzelfde opmerkingen kan gemaakt worden wanneer men het middelpunt van een gebied
gebruikt om het aantal delicten in dat bepaalde gebied weer te geven. Ook dan houdt men
geen rekening met de spreiding van delicten over dat bepaalde gebied.
Hoewel bij symboolkaarten met punten gewerkt wordt kunnen symboolkaarten beschouwd
worden als ‘geaggregeerde hot spot technieken’. Zij worden immers vaakst gebruik om
gegevens te tonen op een geaggregeerd niveau.
38
Figuur 7: Symboolkaart: aantal delicten per straat
3.3. Choropleten.
Bij gebiedsgebaseerde methoden worden gegevens geaggregeerd in geografische gebieden
zoals NIS sectoren. Deze geaggregeerde gegevens kunnen via choropleten gepresenteerd
worden. Een choropleet is een kaart waarbij een vooraf bepaalde gebiedsindeling (in dit geval
NIS sector) wordt ingekleurd in functie van een variabele zoals bijvoorbeeld het totaal aantal
delicten, het aantal woninginbraken, het aantal huishoudens of het aantal inwoners per sector
(Figuur 8) (Harries, 1999, 25). Net zoals bij een symboolkaart kan men na het bekijken van de
choropleet op een intuïtieve manier hot spots aanduiden. Het grote nadeel van choropleten is
dat gebiedsindelingen (cfr. NIS sectoren) vaak straten gebruiken als grenzen van de
deelgebieden. Daardoor kan het zijn dat reële hot spots verdeeld worden over verschillende
gebieden (NIS sectoren). Een tweede nadeel is dat vooraf bepaalde gebiedsindelingen zoals
NIS sectoren soms te ruim zijn. Wanneer een bepaald gebied als hot spot gedetecteerd wordt,
39
is het immers mogelijk dat de reële hot spot kleiner is dan het geselecteerde gebied. Een derde
probleem is het ‘modifiable area unit probleem. Dit is het wijzigen van de grenzen van
gebieden. Veranderingen in het aantal en de configuratie van gebieden die gebruikt worden
kunnen resultaten sterk beïnvloeden, zeker wanneer men resultaten over tijd wil vergelijken.
Gebiedsgebaseerde resultaten worden tevens sterk beïnvloed door ruimtelijke onzekerheden
en fouten betreffende criminaliteitslocaties. Kleine ruimtelijke afwijkingen door fouten die
gebeuren bij het geocodoren of onvolledige adresinformatie kan er toe leiden dat feiten,
wanneer zij dicht bij de grens van een gebied liggen, verkeerdelijk worden toegewezen aan
het belendende gebied. (McLafferty, 1999).
Figuur 8: Choropleet: aantal delicten per NIS sector
3.4. Local Moran Statistic
Een laatste techniek die besproken wordt binnen de context van ‘geaggregeerde hot spot
technieken’ is de gebiedsgebaseerd Local Moran Statistic(LMoran). Deze techniek werd
door Anselin ontwikkeld (Levine, 2001). Het basis concept van LMoran is de ‘Local Indicator
of spatial Association’ (LISA). LISA geeft voor elke observatie de mate aan waarin er een
40
significante ruimtelijke clustering is van gelijke waarden rondom de observatie. De som van
LISA voor alle observaties is proportioneel aan de globale indicator van ruimtelijke associatie
L
i
= f(Y
i
, Y
Ji
)
waar L
i
de locale indicator is, Y
i
de waarde van een intensiteitvariabele op plaats i en Y
Ji
de
waarde geobserveerd in de buurt J
i
van i.
Met andere woorden, LISA is een indicator van de mate waarin de waarde van een observatie
gelijk of verschillend is van de belendende observatie. Dit vereist twee voorwaarden. Ten
eerste, elke observatie heeft een variabele waarde die er aan toegewezen kan worden (vb.
intensiteit of gewicht) in aanvulling van de xy-coördinaten. Voor criminaliteit betekent dit dat
de data in zones worden geaggregeerd (vb aantal delicten per NIS sector). Ten tweede moet
de ‘buurt’ gedefinieerd worden. Dit kunnen zowel belendende zones zijn of alle andere zones
die negatief gewogen worden afhankelijk van de afstand tot de geobserveerde zone. Eens de
buurt gedefinieerd is, berekent LISA een waarde welke een indicatie is van de relatie tussen
de geobserveerde zone en de naburige zones. In buurten waarvoor hoge intensiteitswaarden
gevonden worden geeft LISA aan of een bepaalde observatie gelijk (hoog) of verschillend
(laag) is met nabijgelegen zones. In buurten met lage intensiteitswaarden toont LISA of een
bepaalde observatie gelijk (laag) of verschillend (hoog) is. LISA is een indicator van
gelijkheid.
Anselin heeft het concept toegepast op een aantal ruimtelijke autocorrelatie statistieken. De
meest toegepaste, die ook in CrimeStat II wordt gebruikt, is ‘Anselin’s Local Moran statistic
(Ii). De definitie van Ii is
=
=N
jjij
z
i
iZZW
S
ZZ
I1
2)(**
)(
waar
Z
de gemiddelde intenstiteit is van alle observaties. Zi de intensiteit van observatie i, Zj
de intensiteit voor alle observaties j (waar j
i), S
2
z
de variantie van alle observaties en Wij
een gewicht is voor de interactie tussen observaties i en j. i verwijst enkel naar de observatie i
terwijl j de som is van de gewogen waarden van alle observaties (behalve i).
Het gewicht Wij kan zowel een indicator zijn van de nabijheid van een buurt ten opzichte van
de geobserveerde buurt (vb. 1 wanneer belendend, 0 wanneer niet belendend) als een
41
afstandsgebaseerd gewicht welke afneemt naarmate de afstand tussen zone i en j stijgt.
Indicaties van nabijheid zijn zinvol wanneer belendende buurten moeten gedefinieerd worden.
De naburige zones worden volledig meegerekend terwijl met andere, verder afgelegen, zones
totaal geen rekening wordt gehouden. Gewichten gebaseerd op afstand zijn zinvol om
ruimtelijke interactie te definiëren. Verder afgelegen buurten kunnen een invloed uitoefenen
op een geobserveerde, bestuurde buurt maar die is vaak minder sterk dan de invloed van meer
nabijgelegen buurten.
CrimeStat II gebruikt twee soorten afstandsgewichten. Het eerste afstandsgewicht is een meer
traditionele ‘distance decay’ functie
ij
ij d
W1
=
waar dij de afstand is tussen de geobserveerde zone i en de zone j. Met andere woorden een
zone die op twee kilometer ligt van de geobserveerde zone heeft de helft van het gewicht van
een zone dat slechts op een kilometer ligt.
Het tweede houdt rekening met kleine afstanden. Afhankelijk van de gebruikte afstandsschaal
(meter, kilometer, mijl) ontstaan er problemen wanneer de afstand kleiner dan 1 wordt
(kleiner dan 1 kilometer, kleiner dan 1 mijl). Het gewicht stijgt dan naarmate de afstand
kleiner wordt (tot oneindig voor dij= 0). Om dit te corrigeren gebruikt CrimeStat II een
aanpassing voor kleine afstanden zodat het maximum gewicht nooit groter dan 1 kan zijn. De
formule die hiervoor gebruikt wordt is
ij
ij dx x
W+
=11
waar x de gebruikte afstandsschaal is (vb meter, kilometer).
Een exacte significantietest voor de LMoran is nog niet ontwikkeld omdat de verdeling van de
statistiek niet gekend is. Hoge positieve of hoge negatieve gestandaardiseerde scores voor Ii,
Z(Ii), worden als indicator voor van gelijkheid of ongelijkheid genomen. Een hoge positieve
gestandaardiseerde score geeft een ruimtelijke clustering van gelijke waarden (hoge of lage
waarden) aan terwijl een hoge negatief gestandaardiseerde score een clustering van ongelijke
waarden weergeeft (relatief hoog ten opzichte van een buurt met een lage waarde of relatief
42
laag ten opzichte van een buurt met een hoge waarde). Hoe hoger de gestandaardiseerde
score, hoe meer gelijk (positief) of meer verschillend (negatief) een buurt is ten opzichte van
zijn aanpalende buren.
De LMoran is een indicator van ‘hot spots’ en ‘cold spots’. Dit zijn zones die verschillen van
nabijgelegen zones. Hot spots zijn zones waar het aantal incidenten veel hoger is dan in de
buurzones. Cold spots zijn zones waar het aantal incidenten veel lager ligt dan in de naburige
zones. De LMoran kijkt of de buurt verschillend of gelijk is met aanpalende zones. De
gebruiker moet vervolgens naar de absolute waarden kijken om na te gaan of een spot ‘hot’ of
‘cold’ is.
Vooraleer een voorbeeld te geven van het gebruik van de LMoran wordt getoond hoe
CrimeStat II geconfigureerd moet worden om de LMoran statistiek te kunnen berekenen.
Onder tab ‘Spatial description ‘Hot Spot’ Analysis’ (Figuur 9) moet het vakje naast Anselin’s
Local Moran Statistic aangevinkt worden. Er werd hier geopteerd rekening te houden met
kleine afstanden (Adjusted for small distances). Ook de variantie wordt aangevinkt. Dit is
nodig omdat anders de gestandaardiseerde scores voor Ii, Z(Ii) niet berekend worden. Het zijn
net deze gestandaardiseerde scores die gebruikt worden om gebieden met elkaar te
vergelijken. De resultaten kunnen in een .dbf bestand worden bewaard via ‘Save result to…’.
De gebruiker mag wanneer hij/zij de LMoran statistiek via CrimeStat II wil uitvoeren niet
vergeten een Z(intensity) variabele aan te duiden. Wanneer hij/zij dit niet doet dan zal
CrimeStat II de optie LMoran statistic niet activeren. De Z(intensity) variabele is normaal een
variabele die een aantal gebeurtenissen (hier delicten) voor de respectievelijke zones in het te
bestuderen gebied weergeeft.
Aan de hand van het delict opzettelijke slagen en verwondingen wordt een voorbeeld van de
LMoran Statistiek gegeven. In
Figuur 10 worden twee kaarten getoond. In de kaart onderaan wordt het aantal opzettelijke
slagen en verwondingen per NIS sector gepresenteerd. In twee gebieden (A en B) die elk
bestaan uit een drietal NIS sectoren werden in elk van deze sectoren meer dan 68 feiten
betreffende opzettelijke slagen en verwondingen geregistreerd. In de bovenstaande kaart werd
per NIS sector de LMoran z-value getoond. Opvallend is dat slechts voor twee gebieden,
43
namelijk A en B, zeer hoge z-waarden gevonden worden. Hoge waarden (rood ingekleurd)
vallen te noteren voor sommige NIS sectoren in de gebieden A en B.
Figuur 9: CrimeStat II: Local Moran Statistic
Samen met de gegevens uit de onderstaande kaart kan afgeleid worden dat het hier om twee
‘hot spots’ gaat. Het groen gekleurde gebied C daarentegen heeft een zeer lage z-waarde wat
er op wijst dat het sterk verschillend is van de omringende buurten. Uit de onderstaande kaart
kan inderdaad opgemaakt worden dat er in buurt C heel weinig registraties (tussen 0 en 8)
van opzettelijke slagen en verwondingen zijn dit in vergelijking met de belendende buurten.
Deze LMoran statistic heeft twee nadelen. De eerste is de interpreatie. Omdat er moet
rekening gehouden worden met de berekende LMoran z-waarden EN de absolute waarden is
het interpreteren van de resultaten vrij complex waardoor er sneller interpretatiefouten
gemaakt worden. Een tweede beperking is dat de data geaggregeerd wordt op een hoger
niveau namelijk gebieden (cfr. NIS sectoren). Hierdoor bestaat het gevaar dat te grote
44
gebieden als hot spot worden geclassificeerd terwijl slecht een klein deel van dit grotere
gebied echt als hot spot kan benoemd worden.
Figuur 10: LMoran Statistic: opzettelijke slagen en verwondingen
45
A
B
A
B
C
46
Samenvattend, in dit hoofdstuk kwamen vier ‘geaggregeerde hot spot technieken’ aan bod.
Een eerste techniek is de techniek van de ‘uitgemiddelde waarde op basis van de lengte van
de straat’ waarin rekening gehouden wordt met delicten die niet gegeocodeerd zijn. De
techniek is een concentratiemaat van het aantal delicten per straat. Daarnaast werden twee
soorten kaarten gepresenteerd; symboolkaarten en choropleten, die kunnen gebruikt worden
om concentraties te visualiseren. Er werd hierbij gewaarschuwd dat het interpreteren van
dergelijk kaarten subjectief is. Een laatste techniek die getoond werd is de ‘Local Moran
Statistic’ die een indicatie geeft of belendende buurten al dan niet met elkaar overeenstemmen
betreffende een bepaalde eigenschap.
47
Hoofdstuk IV : Puntgebaseerde hot spot technieken.
Sommige van de geschetste problemen inherent aan de geaggregeerde methoden kunnen
vermeden worden door het werken met puntgebaseerde methoden. Een van de meest
gebruikte puntgebaseerde methoden is ‘Spatial and Temporal Analysis of Crime’ (STAC).
Andere puntgebaseerde methoden zijn de ‘Mode’, ‘Fuzzy Mode’, ‘Nearest Neighbor
Hierarchical Clustering’ (NNH) en ‘K-means Partitioning Clustering’.
STAC, NNH en K-means Partitioning Clustering zijn clusteringtechnieken. Zij gebruiken
allen geometrische vormen (cirkels en ellipsen) om hot spots visueel weer te geven. Hierdoor
worden onregelmatige gevormde hot spots niet steeds correct weergegeven. Om hot spots op
een meer accurate manier weer te geven moeten er ruimtelijke statistische methoden gebruikt
worden die de onregelmatige vormen van de hot spots vatten. Eén groep van methoden die
hiervoor aangewend worden zijn ‘spatial smoothing methods’ (SSMs). De Kernel Density
Estimation’ procedure is een dergelijke methode die tot SSMs behoort. Het doel van deze
methode is het schatten hoe de densiteit van gebeurtenissen varieert over een studiegebied.
4.1. Mode and fuzy mode
De ‘mode’ (modus) is een puntlocatie hot spot routine. Het gebruik van deze modus is een
meer intuïtieve en exploratieve manier om hot spots te detecteren. Het berekent de locaties
met het grootste aantal incidenten. De in CrimeStat II gebruikte routine telt eerst het aantal
gebeurtenissen (vb aantal gepleegde delicten) per unieke locatie (dit is een punt met unieke
xy-coördinaten) alvorens de locaties op basis van het aantal gebeurtenissen in aflopende
volgorde te sorteren. Met andere woorden, de locatie met het grootst aantal gebeurtenissen
wordt eerst geplaatst, deze met het laagste aantal het laatst.
Tabel 4 toont de door CrimeStat II gegenereerde output bekomen bij het uitvoeren van de
modus routine. Het betreft de 10 plaatsen waar er het meeste delicten gepleegd werden (de
andere locaties werden niet opgenomen). Omdat 5 locaties ex aequo op de 10de plaats
eindigen worden in totaal 14 plaatsen in Figuur 11 getoond. Om meer informatie te verkrijgen
over deze 14 locaties kunnen, wanneer voor handen, andere GIS kaarten aangewend worden.
Mocht bijvoorbeeld een GIS kaart ter beschikking staan die betrekking heeft op de functies
van locaties of gebouwen dan zou op basis van deze kaart de functie van de locatie of het
gebouw snel achterhaald kunnen worden.
48
Tabel 4: Modus : output CrimeStat II
RANK
FREQ
X
Y
1
16
153272,142509
212182,434206
2
13
152010,403947
209037,239835
3
12
153248,048045
212154,193886
4
12
154273,101038
211100,796445
5
11
151738,400939
209041,285595
6
11
152779,831020
210930,484061
7
10
153588,900525
211903,973342
8
10
154021,911981
211495,433118
9
10
152974,583532
210750,830109
10
9
153301,429421
210550,405981
11
9
154143,063021
211076,437725
12
9
153684,127981
212650,819999
13
9
151909,316523
210801,814429
14
9
153176,347053
213251,736799
Het nut van de modus is echter afhankelijk van de precisie waarmee gebeurtenissen
gegeorefereert worden. Bijvoorbeeld, diefstallen uit auto’s die plaats vinden op een groot
parkeerterrein kunnen op twee verschillende manieren gegeorefeert worden. In een eerste
geval kunnen diefstallen die op dit parkeerterrein gebeuren dezelfde xy-coördinaten
toegewezen krijgen. Een tweede mogelijkheid bestaat in het toewijzen van de xy-coördinaten
van één unieke parkeerplaats op het parkeerterrein aan alle diefstallen daar gepleegd.
Wanneer op dit parkeerterrein 100 diefstallen uit auto’s worden gepleegd, bekomt men bij het
berekenen van de modus een waarde 100 voor het parkeerterrein. Wanneer de verschillende
diefstallen toegewezen worden aan xy-coördinaten die de unieke parkeerplaatsen op het
parkeerterrein vertegenwoordigen zal dit niet het geval zijn, op voorwaarde dat diefstallen
verspreid over het parkeerterrein plaats vonden. Er zullen dan verschillende waarde per
unieke parkeerplaats gevonden worden. Wanneer nu de modus wordt berekend voor
diefstallen uit auto’s in een gebied waar dit parkeerterrein gelegen is, is het mogelijk dat in de
eerste situatie, waarin alle feiten die op het parkeerterrein gepleegd zijn dezelfde xy-
coördinaten toegewezen krijgen, het parkeerterrein als een hot spot wordt gedetecteerd, terwijl
in de tweede situatie dit niet het geval is.
Om deze mogelijke vertekening te verhelpen wordt de via de modus routine bekomen
informatie best vergeleken met gegevens bekomen met behulp van een tweede punt locatie
routine, de ‘fuzzy mode’. Deze routine laat de gebruiker toe een kleine zoekradius rond elke
locatie te definiëren die toelaat die gebeurtenissen op te nemen die binnen de zoekradius rond
de locatie plaats vonden. De fuzzy mode routine sommeert eerst het aantal gebeurtenissen (vb
aantal gepleegde delicten) per locatie met die gebeurtenissen die binnen een door de gebruiker
49
vooraf gedefinieerde zoekradius vallen alvorens de locaties op basis van het aantal
gebeurtenissen in aflopende volgorde te sorteren. Door het gebruiken van een zoekradius
worden punten verschillende keren geteld, namelijk telkens wanneer zij in een radius vallen.
Een vergelijking van de modus leert dat hierdoor zowel de frequentie als de hiërarchie van
gebeurtenissen per locatie veranderen.
De fuzzy mode routine werd uitgevoerd op de data die ook als voorbeeld voor de modus
werden gebruikt. De zoekradius die gedefinieerd werd bedroeg 50 meter. In Tabel 5 en Figuur
11 worden de resultaten van de fuzzy mode gepresenteerd. Het betreft 10 plaatsen waar er het
grootst aantal gebeurtenissen plaats vond. 2 locaties eindigen ex aequo op de 10de plaats.
Hierdoor worden er 11 locaties als hot spots gedetecteerd. In Figuur 11 wordt duidelijk dat
deze puntlocaties ongeveer op dezelfde plaats in de ruimte gevestigd zijn. Dit is een mooi
voorbeeld van hoe in sommige gevallen, door het verschillende keren tellen van dezelfde
punten, de fuzzy mode alle top locaties in een klein gebied plaatst. Dit kan tot een vertekend
beeld van de realiteit leiden. Met andere woorden de fuzzy mode moet op een voorzichtige
manier aangewend worden.
Tabel 5: Fuzzy Mode
RANK
FREQ
X
Y
1
49
153248,048045
212154,193886
2
47
153250,173293
212162,741278
3
47
153260,481517
212150,985310
4
47
153225,997997
212173,855006
5
47
153259,899053
212142,037278
6
46
153256,693741
212136,044254
7
45
153262,663533
212159,749406
8
45
153252,637485
212178,371550
9
44
153264,600493
212167,732574
10
42
153267,868973
212174,998750
11
42
153252,439533
212187,035486
In Figuur 12 tenslotte wordt getoond hoe de Mode en de Fuzzy Mode berekend worden. De
opties Mode en Fuzzy Mode worden aangevinkt onder tab ‘Spatial description ‘Hot Spot’
Analysis I’. Voor de Fuzzy Mode moet de zoekradius en de data eenheid worden opgegeven.
De resultaten kunnen bewaard worden via ‘Save result to…’ in een daartoe geselecteerde
map.
50
Figuur 11: Modus en Fuzzy Mode, een voorbeeld.
51
Figuur 12: CrimeStat II : Mode en Fuzzy Mode
4.2. Drie clustertechnieken nader toegelicht
Een vaak toegepaste methode om hot spots te identificeren is het gebruik maken van
clustertechnieken. Drie clustertechnieken die in het navolgende deel onder de loep worden
genomen zijn ‘Nearest Neighbor Hierarchical Clustering’ (NNH), ‘Spatial and Temporal
Analysis of Crime’ (STAC) en ‘K-means partitioning clustering’. Deze drie technieken
groeperen data in clusters. NNH en STAC zijn beiden hiërarchische clusteringtechnieken die
toelaten een confirmatorische analyse uit te voeren. De K-means partitioning techniek
daarentegen is een exploratieve niet hiërarchische clusteringtechniek.
4.2.1. Nearest Neighbor Hierarchical Clustering (NNH)
Bij een hiërarchische classificatie wordt de data niet in één stap ingedeeld in een specifiek
aantal klassen of clusters. Het classificeren bestaat daarentegen uit een reeks verdelingen. Een
verdeling kan één enkele klasse zijn die alle individuen bevat, het kan n-clusters zijn die elk
één individu bevatten of het kan ergens tussen de twee hiervoor geschetste verdelingen liggen.
Hiërarchische clusteringtechnieken kunnen worden onderverdeeld in ‘agglomerative’
52
(cumulatieve) en ‘divisive’ (verdelende) methoden. De cumulatieve methoden werken via een
reeks van opeenvolgende samenvoegingen (fusies) van n-individuen terwijl de verdelende
methoden n-individuen, via een reeks van opeenvolgende splitsingen, verdelen in kleinere
groepen. (Everitt, 2001; 1993).
Wanneer samenvoegingen of splitsingen eenmaal uitgevoerd zijn kunnen ze niet meer
teruggedraaid worden. Wanneer een cumulatief algoritme twee individuen geclusterd heeft
dan kunnen ze niet meer gescheiden worden. Wanneer een verdelend algoritme een splitsing
heeft gemaakt dan kan dit niet meer ongedaan gemaakt worden.
Omdat alle cumulatieve hiërarchische technieken uiteindelijk de data reduceren tot één enkele
cluster die alle individuen bevat, en de verdelende technieken de gehele dataset uiteindelijk
opsplitsen in n groepen die elk één individu bevatten, zal de gebruiker, die op zoek is naar een
oplossing met een optimaal aantal clusters moeten beslissen wanneer te stoppen. De Nearest
Neighbor Hierarchical clustering techniek, die in CrimeStat II gebruikt, laat de gebruiker toe
twee criteria te definiëren die aangeven wanneer de clustering dient te stoppen (zie infra).
Een hiërarchische classificatie die geproduceerd wordt via of de cumulatieve of de verdelende
manier wordt voorgesteld door een dendogram. Dit is een tweedimensioneel diagram die de
samenvoeging of splitising in elke fase van de analyse illustreert. Een voorbeeld van een
dendogram wordt in Figuur 15 gegeven.
De cumulatieve methoden zijn één van de vaakst gebruikte hiërarchische methoden. Ze
produceren een reeks van indelingen van de bestudeerde data. De eerste indeling bestaat uit n-
‘single member clusters’, met andere woorden elk individu wordt als cluster beschouwd. De
laatste indeling bestaat uit één enkele groep die alle n-individuen bevat. De basis operatie van
alle cumulatieve methoden is gelijkaardig en zal geïllustreerd worden aan de hand van de
nearest neighbor techniek. In elke fase groeperen de cumulatieve methoden individuen of
groepen van individuen die het dichtst bij elkaar liggen of die het meest gelijkaardig zijn.
Verschillen tussen de cumulatieve methoden
33
ontstaan doordat de afstand tussen individuen
en groepen die individuen bevatten of de afstand tussen verschillende groepen op een andere
manier gedefinieerd wordt.
33
De meest gebruike agglomeratieve hierarchische clustering methoden zijn ‘single linkage’ (nearest neighbor),
‘complete linkage’ (furthest neigbor), ‘average linkage’ (UPGMA), ‘centroid linkage’ (UPGMC), ‘median
linkage’ (WPGMC) en ‘Ward’s method’ (Minimum sum of squares). Voor meer informatie zie Everitt (2001,
56 67) en Everitt (1993, 56 82)
53
4.2.1.1. Nearest Neigbor techniek (single linkage)
Aan de hand van een voorbeeld wordt hier één van de eenvoudigste hiërarchische clustering
technieken geïllustreerd namelijk de Nearest Neighbor techniek, ook gekend als de ‘single
linkage’ techniek. Het kenmerkende van deze methode is dat de afstand tussen groepen
gedefinieerd wordt als de afstand tussen twee punten (x en y) die elk tot een van beide
groepen behoren (x
Cluster A; y
Cluster B) en waarvan de afstand tussen deze twee
punten het kleinst is in vergelijking met de afstand tussen andere combinaties van punten die
elk tot een van beide groepen behoren (Figuur 13).
Figuur 13: Hierarchische clustering : Nearest Neighbor
Cluster A Cluster B
y
* * *
* * x * *
* * *
*
In Figuur 14 wordt ingezoomd op 6 plaatsen waar er een delict werd gepleegd. De xy-
coördinaten van deze punten worden ook in deze figuur weergegeven. Wanneer de
euclidische afstand
34
2
21
2
21 )()( yyxx +
tussen deze zes punten berekend wordt, bekomt
men de volgende afstandsmatrix:
=
073.12253.16280.23172.20778.209
061.11942.22347.16003.89
023.10547.4694.135
051.8053.234
063.155
0
6
5
4
3
2
1
1
D
De kleinste afstand in deze matrix is deze tussen punten 2 en 4. Deze punten worden
samengenomen tot een cluster bestaande uit twee leden. De afstand tussen deze nieuw
gevormde cluster en de andere individuen wordt als volgt berekend
54
Figuur 14: NNH uitleg
34
Als voorbeeld afstandsmaat wordt gebruik gemaakt van de Euclidische afstand. Dit omdat het een van de twee
afstandsmaten is die door CrimeStat II, afhankelijk van het type coordinatensysteem, gebruikt worden bij het
berekenen van afstanden tussen punten.
55
94.135,min 1414121)24(=== dddd
51.80,min 2334233)24(=== dddd
61.119,min 4545255)24(=== dddd
53.162,min 1446266)24(=== dddd
Een nieuwe afstandsmatrix die zowel inter-individuele als cluster-individu afstanden bevat,
kan nu opgebouwd worden:
=
073.1228.23178.20953.162
042.22303.8961.119
053.23451.80
094.135
0
6
5
3
1
)24(
2
D
De kleinste afstand in deze matrix is deze tussen de cluster (24) en het punt 3. Bij cluster (24)
wordt punt 3 toegevoegd. Er ontstaat met andere woorden een cluster bestaande uit 3
individuen. De afstand tussen deze cluster en de drie overgebleven individuen wordt
vervolgens berekend.
94.135,,min 141413121)234(=== ddddd
61.119,,min 454535255)234( === ddddd
53.162,,min 144636266)234( === ddddd
Dit leidt tot afstandsmatrix:
=
073.12278.20953.162
003.8961.119
094.135
0
6
5
1
)234(
3
D
56
De kleinste afstand in deze matrix is deze tussen punt 1 en 5 en bedraagt ongeveer 89 meter.
Punten 1 en 5 vormen, naast cluster (234), een tweede cluster. De afstanden tussen deze twee
clusters en het nog overgebleven punt worden berekend
61.119,,,,,min 54545352141312)234)(15(=== dddddddd
73.122,min 5656166)15(=== dddd
53.162,,min 144636266)234( === ddddd
en worden in volgende matrix weergegeven.
=
053.16273.122
061.119
0
6
)234(
)15(
4
D
De kleinste entiteit is nu
)234)(15(
d
. De clusters (15) en (234) worden samengevoegd tot de
cluster (12345). In een laatste stap wordt punt 6 toegevoegd.
Het dendogram welke het proces visueel voorstelt, wordt in Figuur 15 weergegeven. Het
illustreert, naast het proces, de indelingen (partitions) die in elke fase geproduceerd zijn.
Figuur 15: Dendogram voor het nearest neighbor voorbeeld.
1 5 2 34 6 P1
P2
P3
P4
P5
P6
Partition Leden
[1 2 3 4 5 6]
[1 2 3 4 5], [6]
[1 5], [2 3 4], [6]
[1], [2 3 4], [5], [6]
[1], [2 4], [3], [5], [6]
[1], [2], [3], [4], [5], [6]
57
Omdat de gebruiker zoekt naar een oplossing met een ‘optimaal aantal clusters zal hij/zij
moeten beslissen wanneer de procedure stopt. Bijvoorbeeld wanneer enkel die punten en/of
clusters die minder dan 100 meter van elkaar liggen mogen gegroepeerd worden dan moet het
algoritme stoppen wanneer er in de afstandsmatrix geen afstanden gevonden worden die
kleiner of gelijk zijn aan 100 meter. In het hierboven gegeven voorbeeld betekent dit dat er
drie clusters gevonden worden cluster (15), cluster (234) en de cluster (6). Wanneer als
bijkomend criterium gesteld wordt dat enkel clusters met meer dan 3 elementen weerhouden
worden dan zal enkel cluster (234) geselecteerd worden.
4.2.1.2. Nearest Neighbor Hierarchical Clustering in CrimeStat II
Een van de problemen met de Nearest Neighbor Hierachical procedure, zoals deze door
Everitt (1993, 2001) beschreven wordt, is ‘chaining’, zeker wanneer gewerkt wordt met grote
data sets. Chaining, of het vormen van kettingen, is het proces waarbij grote clusters op het
i
p
niveau gevormd worden omdat de afstand tussen de onderliggende clusters (niveau
1i
p
)
kleiner is dan de door de gebruiker ingestelde maximumafstand. De in CrimeStat II gebruikte
procedure vermijd dit probleem. Dit wordt dadelijk aan de hand van een voorbeeld
verduidelijkt.
Alvorens de door Everitt (1993, 2001) beschreven procedure te vergelijken met de in
CrimeStat II gebruikte procedure wordt deze laatste eerst besproken. De Nearest Neighbor
Hierarchical Clustering procedure in CrimeStat II berekent eerst alle afstanden tussen alle
mogelijke puntenparen. Deze afstanden worden, zoals bij de NNH door Everitt beschreven, in
een afstandsmatrix gegoten. Nemen we als voorbeeld dezelfde matrix.
=
073.12253.16280.23172.20778.209
061.11942.22347.16003.89
023.10547.4694.135
051.8053.234
063.155
0
6
5
4
3
2
1
1
D
Vervolgens wordt een drempelwaarde (het maximum dat een afstand tussen twee punten mag
bedragen opdat zij in de verdere analyse als combinatie worden weerhouden) berekend (zie
infra). Ter illustratie wordt ook hier een drempelafstand van 100 genomen. Alle puntenparen
met een afstand kleiner dan deze drempelwaarde worden geselecteerd om te clusteren. Voor
58
elk punt wordt het aantal afstanden naar andere punten die kleiner zijn dan de drempelwaarde
geteld. Enkel voor punt 2 worden er twee afstanden naar andere punten gevonden waarvan de
afstand kleiner is dan de drempelwaarde. Voor punten 1, 3, 4 en 5 werd één combinatie
gevonden. De afstand tussen punt 6 en ieder van de andere punten was steeds groter dan 100.
De geselecteerde puntenparen worden vervolgens opgenomen in een gereduceerde matrix.
Alle punten in de gereduceerde matrix worden in een dalende volgorde gesorteerd. Punten
met het hoogst aantal combinaties komen bovenaan, punten met het minst aantal combinaties
onderaan. Punten zonder combinatie worden niet opgenomen.
=
003.89
047.46
051.80
0
0
5
4
3
1
2
2
D
Het punt met het hoogste aantal combinaties (afstanden onder de drempelwaarde) wordt
vervolgens geselecteerd. Alle punten die binnen de drempelwaarde liggen van dit punt
worden geselecteerd om een eerste cluster te vormen. Het aantal punten binnen deze cluster
wordt vervolgens geteld. Wanneer het aantal groter of gelijk is aan een door de gebruiker
gespecificeerd minimum wordt de cluster weerhouden, anders niet. Het punt 2 heeft het
hoogst aantal combinaties. Samen met punten 3 en 4 vormt punt 2 de eerste 1ste orde cluster.
Wanneer deze cluster weerhouden wordt, doordat hij voldoet aan een bijkomend criterium
betreffende een minimaal aantal punten die tot deze cluster moeten behoren, wordt het
centrum berekend. Dit centrum wordt later gebruikt om 2de orde clusters te berekenen. Punten
die tot een weerhouden cluster behoren worden tevens uit de verdere clustering geweerd.
Punten 2, 3 en 4 worden dus eerst verwijderd alvorens de tweede 1ste orde cluster wordt
berekend. Van de overgebleven punten wordt opnieuw het punt geselecteerd met het hoogst
aantal combinaties. Vervolgens wordt de gehele procedure herhaald zoals dit voor het eerste
punt beschreven is. Deze procedure herhaalt zich tot wanneer er geen 1ste orde cluster meer
gevonden wordt die aan de gestelde voorwaarden voldoet.
De berekende centra voor de 1ste orde clusters worden gebruikt om de 2de orde clusters te
berekenen. Dezelfde procedure die bij het bepalen van de 1ste orde clusters wordt gebruikt,
wordt voor het berekenen van deze 2de orde clusters toegepast. Wanneer er 2de orde clusters
59
gevonden worden dan wordt hun centrum gebruikt om 3de orde clusters te bereken. Dit proces
wordt herhaald tot wanneer er geen hoger orde clusters meer gevonden worden.
Door het verwijderen van die punten die aan een cluster worden toegewezen, wordt chaining
vermeden. Dit wordt aan de hand van een voorbeeld geïllustreerd. In Figuur 16 worden de
resultaten getoond van clustering via de door Everitt (1993, 2001) beschreven procedure en de
door CrimeStat II gebruikte procedure.
Twee voorwaarden worden gesteld. Ten eerste de maximumafstand tussen punten en/of
clusters mag niet groter zijn dan de afstand tussen punt x en y. Ten tweede de cluster moet
tenminste 5 punten bevatten opdat hij weerhouden wordt.
Wanneer de Nearest Neighbor Hierarchical procedure, zoals door Everitt (1993, 2001)
beschreven, gebruikt wordt dan zullen eerst clusters A en B geconstrueerd worden en zal
vervolgens één grote cluster gevormd worden. De in CrimeStat II gebruikte NNH procedure
zal daarentegen twee clusters weerhouden namelijk cluster A en B. Eerst zal cluster B zich
vormen waarna de punten die tot deze cluster behoren uit de analyse verwijderd worden.
Vervolgens zal cluster A geconstrueerd worden. Er zal echter geen overkoepelende cluster
gevonden worden waardoor chaining wordt vermeden.
Figuur 16: Nearest Neigbor Clustering : 2 methoden.
60
4.2.1.3 Twee criteria
Zoals reeds aangehaald moet de gebruiker, vooraleer CrimeStat II de Nearest Neighbor
Hierarchical Clustering routine uitvoert, twee parameters definiëren. De eerste parameter is
een drempelafstand De tweede parameter is het minimum aantal punten per cluster. Dit
criterium wordt aangewend om het aantal clusters met een te beperkt aantal delicten uit te
sluiten.
Criterium 1 : Maximumafstand
Het eerste criterium dat gebruikt wordt om punten te groeperen is het
betrouwbaarheidsinterval rond de verwachte ‘nearest neighbor afstand’ (NND) voor de eerste
orde nearest neighbors. De gemiddelde random afstand (mean random distance) wordt
gedefinieerd als
Mean Random Distance
== N
A
SQRTrand 5.0)(
waar A het gebied is waarvoor de berekening gemaakt wordt en N het aantal incidenten. Het
betrouwbaarheidsinterval rond deze afstand wordt gedefinieerd als
Confidence Interval
for Mean Random Distance = Mean Random Distance +/- t* SE
)(rand
= 0.5 SQRT
N
A
+/- t
A
N
SQRT 2
26136.0
waar A het gebied is, N het aantal incidenten en t de t-waarde geassocieerd met het
probaliteitsniveau in de Student’s t-distributie.
Het betrouwbaarheidsinterval definieert een probabiliteit voor de afstand tussen eender welk
puntenpaar. Voor een specifieke ‘one tailed’ probabiliteit p zullen minder dan p% van de
incidenten een NND hebben die kleiner is dan deze geselecteerd limiet wanneer de verdeling
ruimtelijk toevallig is. Voor toevallig verdeelde data, wanneer p
.05
35
dan zal slechts
ongeveer 5% een afstand hebben kleiner dan de drempelwaarde. Dit betekent echter niet dat
de kans op het vinden van clusters gelijk is aan deze probabiliteit van 5%. Het geeft enkel een
idee van de kans twee punten te selecteren op basis van een kansverdeling.
35
De standaardwaarde die CrimeStat II gebruikt is p
.5.
61
Met andere woorden, de drempelafstand is een probabiliteitsniveau voor het selecteren van
gelijk welk puntenpaar op basis van een kansverdeling.
Wanneer een ruimtelijke verdeling toevallig is, dan zullen van de (N*(N-1))/2
36
puntparen
minder dan p% een afstand hebben kleiner dan de drempelafstand. Wanneer er bijvoorbeeld
500 incidenten op een toevallige manier ruimtelijk verdeeld zijn, zullen er 124750
(=(500*(500-1))/2) puntenparen zijn. Wanneer p = 5% dan zullen minder dan 6237
puntenparen een afstand hebben die kleiner is dan de drempelafstand.
Criterium 2 : Minimum aantal punten
Het tweede criterium is het minimum aantal punten dat elke cluster moet bevatten om
geselecteerd te worden. CrimeStat II gebruikt voor dit criteria standaard minstens 10 punten
per cluster. Door dit criterium te versoepelen, dus minder punten per clusters, zullen er meer
clusters gevonden worden. Door dit criterium te verhogen zullen er minder clusters
geproduceerd worden.
De in CrimeStat II gebruikte routine zal enkel punten opnemen in een uiteindelijke cluster die
deel uitmaken van een groep waarbij het minimum aantal punten werd gevonden. Om de
clusterlocatie aan te duiden wordt een standaard afwijkingsellips berekend voor elke cluster.
1X (een standaardafwijking) wordt in Crimestat II als standaard gebruikt. Eén standaard
afwijking zal meer dan 50% van de delicten in de cluster bevatten, anderhalve
standaardafwijking zal meer dan 90% coveren terwijl twee standaardafwijkingen ongeveer
99% van de punten in de geselecteerde cluster zal bevatten.
Het minimum aantal punten is belangrijker dan de drempelwaarde.
4.2.1.4. Simulatie van statistische significantie
In het voorgaande werd beschreven hoe via de Nearest Neighbor Hierarchical Clustering
routine in CrimeStat II concentraties gevormd worden. Via ‘Monte Carlo simulaties’ wordt
getest of de gevonden clusters significant zijn. Met andere woorden of ze al dan niet op basis
van toeval berusten.
Het testen of de via Nearest Neighbor Hierarchical bekomen clusters al dan niet significant
zijn, is complex. Het probleem welke zich stelt is dat wanneer bijvoorbeeld het
probaliteitsniveau p = 5%, ongeveer 5% van alle paren geselecteerd wordt bij een toevallige
62
verdeling. In een dergelijke situatie weet men of het aantal gevonden clusters groter is dan
wat op basis van toeval kan verwacht worden. De routine clustert echter niet enkel
puntenparen maar ook enkel die clusters met een minimum aantal punten. De verdeling voor
deze situatie is niet gekend. Daarom wordt via een Monte Carlo Simulatie een verdeling
geschat, dit onder dezelfde voorwaarden (p%, aantal punten). Deze Monte Carlo Simulaties
schatten benaderende betrouwbaarheidsintervallen voor de 1ste orde NNH clusters.
Eén simulatie plaatst N aantal feiten (gelijk aan het aantal reële feiten) willekeurig verspreid
over het bestudeerde gebied (A) en berekent vervolgens het aantal clusters, aan de hand van
de criteria die gebruikt worden voor de reële data, voor deze simulatie. Dit wordt k-keer (vb
1000) herhaald. Nadat CrimeStat II het aantal 1ste orde clusters voor elke simulatie berekend
heeft, sorteert het deze aantallen. De routine berekent tevens het aantal punten per cluster, de
grootte en de densiteit van de cluster. Vervolgens worden deze gegevens samengevat en
weergegeven (Tabel 6).
Tabel 6 toont een voorbeeld van een hot spot analyse waarbij de Nearest Neighbor
Hierarchical routine gebruikt werd. De NNH werd uitgevoerd op data betreffende berovingen
die in Baltimore County (Verenigde Staten) werden gepleegd. Als maximumafstand werd
gekozen voor de standaard ingestelde drempelafstand (p
.5 voor het groeperen van
puntenparen). Opdat een cluster geselecteerd zou worden moet deze minstens 5 punten
bevatten. (Levine, 2002, 231) Vervolgens werd er een Monte Carlo simulatie (1000
simulaties) uitgevoerd waarbij dezelfde criteria werden gebruikt als voor de reële data. Voor
de reële data identificeerde de NNH routine 69 1ste orde clusters en 7 2de orde clusters. In
Tabel 6 worden de waarden behorend bij de eerste tien 1ste orde clusters gepresenteerd.
Daarnaast worden ook informatie met betrekking tot de Monte Carlo simulatie getoond. Het
betreft de percentielen voor het aantal clusters, het aantal punten per cluster, de grootte van de
cluster en de densiteit.
Om na te gaan of de gevonden clusters in de reële data verschillen van clusters die gevonden
zijn in data die op een toevallige manier verspreid zijn, worden de resultaten betreffende de
reële data vergeleken met de resultaten van de Monte Carlo simulatie. Aan de hand van de
Baltimore County data wordt uitgelegd hoe een vergelijking wordt uitgevoerd.
36
Dit is het totaal aantal mogelijke puntparen die met N punten kunnen gevormd worden.
63
Tabel 6: Voorbeeld van een NNH analyse
Simulated Confidence Intervals for Nnh Routine
Baltimore County Robberie s: N=1181
Nearest Neighbor Hiera rchical Clustering:
-----------------------------------------
Sample size........................…: 1181
Likelihood of grouping
pair of points by chance.…..:. 0.5000 0 (50.000%)
Z-value for confidence
interval............................…..: 0.000
Measurement type............…: Direct
Output units. .......................: Miles, Squared Miles, Points per Squared Miles
Clusters found ..…................: 76
Simulation runs ...................: 1000
Displaying ellipse(s) starting from 1
Order Cluster Mean X Mean Y Rotation X-Axis Y-Axis Area Points Density
1 1 -7.644.927 3.931.455 7.709.164 0.28303 0.09636 0.08568 40 466.828013
1 2 -7.660.219 3.940.050 1.198.132 0.11540 0.27452 0.09952 33 331.580616
1 3 -7.644.601 3.930.490 1.666.988 0.21907 0.16239 0.11176 25 223.684859
1 4 -7.678.123 3.936.088 2.536.983 0.27643 0.14530 0.12618 29 229.826284
1 5 -7.673.103 3.934.319 6.771.617 0.19445 0.16058 0.09810 29 295.628310
1 6 -7.672.945 3.928.910 7.988.383 0.16428 0.25957 0.13396 29 216.476166
1 7 -7.651.486 3.925.986 8.732.563 0.19148 0.29428 0.17703 27