Content uploaded by Timo Haselhoff
Author content
All content in this area was uploaded by Timo Haselhoff on Apr 20, 2022
Content may be subject to copyright.
Die urbane akustische Umgebung durch Zeit und Raum - Eine Analyse der SALVE
Studie.
Timo Haselhoff1, Tobias Braun2, Jonas Hornberg1, Bryce Lawrence3, Susanne Moebus1
1 Institut für Urban Public Health, Universitätsklinikum Essen, 45147 Essen, E-Mail: timo.haselhoff@uk-essen.de
2 Komplexitätsforschung, Potsdam-Institut für Klimafolgenforschung, 14473 Potsdam
3 Fakultät Raumplanung, Technische Universität Dortmund, 44227 Dortmund
Einleitung
Die urbane akustische Umgebung enthält eine Fülle an
Informationen. Dazu gehören z.B. Informationen zur
Stadtplanung, zum Verkehrsaufkommen oder zur
Biodiversität, die bisher aber nur eingeschränkt genutzt
wurden oder genutzt werden konnten. In den letzten Jahren
hat daher das Interesse am sogenannten Passive Acoustic
Monitoring, also dem automatischen Aufzeichnen der
akustischen Umgebung, stark zugenommen – vor allem in
Bereichen wie der Ökoakustik, der Raumplanung oder der
öffentlichen Gesundheit [1-3]. Im letzteren Fachgebiet ist der
negative Effekt von Lärm auf Gesundheit schon lange
bekannt, der Effekt der Gesamtheit der akustischen
Umgebung ist allerdings weitestgehend unerforscht. Hier
fehlt es an umfangreichen längsschnittlichen
epidemiologischen Studien, die Effekte der akustischen
Umgebung – über den Lärm hinaus – bestimmen [3].
Ein Grund für das wachsende Interesse an der Gesamtheit der
akustischen Umgebung dürfte das Sinken der Kosten für
Sensoren und Speicherplatz darstellen. Hierdurch können
mittlerweile große Mengen an Audiodaten aufgezeichnet
werden und deren Eigenschaften im Nachhinein auf vielfache
Weise quantifiziert werden. So muss die Berechnung
verschiedener Parameter nicht im Vorhinein in die
Aufnahmehardware integriert werden.
Insgesamt erfolgt die Quantifizierung häufig sehr heterogen
und meist über verschiedene Einzahlwerte aus
Lärmwirkungsforschung (z.B. Lden), Psychoakustik (z.B.
Rauheit) oder Ökoakustik (z.B. NDSI) [4-6]. Viele dieser
Indizes – und vor allem diejenigen aus der Ökoakustik –
machen dabei Annahmen über die akustische Umgebung, von
denen gezeigt werden konnte, dass sie in der urbanen
Umgebung nicht oder nur ansatzweise haltbar sind
(beispielsweise die Annahme, dass Signale im Bereich
zwischen 2 und 8 kHz tierischen Ursprungs sind [7]).
Dass wir aktuell nicht wissen, ob oder wie solche Indizes
adäquat angepasst werden können, um die oben
beschriebenen Dimensionen der urbanen Umwelt zu messen
zeigt u.a., dass Bedarf nach einem besseren Verständnis der
zeitlichen und räumlichen Dynamik der urbanen akustischen
Umgebung besteht. Bisher fehlen solche langzeitlichen
Betrachtungen der urbanen akustischen Umwelt. Auch
wurden die Unterschiede zwischen heterogenen Orten in der
Stadt nur ungenügend erforscht.
Ziel unserer Arbeit ist es daher, zu einem besseren
Verständnis der akustischen Umgebung beizutragen. Dafür
analysieren wir Daten der SALVE Studie und analysieren
Audioaufnahmen über ca. zehn Monate und von neun Orten
im urbanen Raum einer Metropolregion in Deutschland. Die
Analyse erfolgt mit Hilfe eines Ansatzes, der sowohl das
Frequenzspektrum als auch die zeitliche Dimension der
Audioaufnahmen berücksichtigt. Dadurch sollen so viele
Informationen wie möglich genutzt werden, um daraus erste
Erkenntnisse zur Beschreibung der urbanen akustischen
Umgebung und ihrer Phänomene zu gewinnen.
Daten
Die Datengrundlage unserer Analysen bildet die AcouStic
QuAlity and HeaLth in Urban EnVironmEnts (SALVE)
Studie. Die SALVE Studie ist ein Kooperationsprojekt der
TU Dortmund und des Instituts für Urban Public Health
(InUPH) der Universität Duisburg-Essen. Hierbei handelt es
sich um eine längsschnittliche Studie zur akustischen Qualität
urbaner Räume. Seit 2019 werden u.a. an 23 zufällig
ausgewählten Orten in Bochum täglich je 50
Audioaufnahmen aufgezeichnet [8]. Mittlerweile liegen
Daten über einen Zeitraum von mehr als drei Jahren vor. Für
die hier vorliegende Analyse wurde ein Teildatensatz der
Daten verwendet. Insgesamt analysieren wir Aufnahmen von
neun verschiedenen Orten, die verschiedene
Flächennutzungstypen repräsentieren, im Zeitraum Mai 2019
bis Ende Februar 2020 (Abb. 1). Die Wahl des Endpunktes ist
durch die COVID-19 Pandemie und die damit drastisch
geänderte akustische Umgebung begründet.
Abbildung 1: Bilder der Aufnahmeorte nach
Flächennutzung.
Für die Aufnahmen wurden Wildlife Acosutics SM4
Recorder verwendet (Abb. 2). Die Geräte wurden so
programmiert, dass alle 26 Minuten 3-Minuten Aufnahmen
mit einer Samplingfrequenz von 44.1 kHz und 16 bit-Tiefe
aufgezeichnet wurden. Dementsprechend entstanden rund 50
Aufnahmen pro Tag, rund 15 000 Aufnahmen pro Gerät und
insgesamt rund 135 000 Audioaufnahmen für den gesamten
Analysezeitraum.
Abbildung 2: Beispielbild der Installation eines Wildlife
Acoustics SM4 Recorders.
Vorverarbeitung
Die Vorverarbeitung der Daten bestand aus zwei Schritten: (i)
die Plausibilitätsprüfung der Daten und (ii) die Berechnung
des Frequenzspektrums für jede Aufnahme. Ziel der
Plausibilitätsprüfung war es, fehlerhafte Aufnahmen sowie
Aufnahmen mit wahrnehmbaren Eigengeräuschen der
Aufnahmegeräte zu identifizieren. Hierzu wurden für alle
Aufnahmen der SALVE Studie eine Reihe an ökoakustischen
Indizes (NDSI, BIO, ADI, AEI, ACI, Hf, Hat, H) sowie
Schalldruckindizes (LAeq_min, LAeq_max, LAeq_mean)
berechnet. Im Anschluss wurden alle Indizes mittels
deskriptiver Statistiken auf Auffälligkeiten untersucht, um
somit fehlerhafte Aufnahmen auszuschließen. Eine genaue
Beschreibung des Vorgehens findet sich in [8].
Die Berechnung des Frequenzspektrums erfolgte durch die
Fast-Fourier-Transformation [9] für jede Audioaufnahme
sowie der anschließenden Mittelung der Leistung in 1024
gleichgroßen (disjunkten) Klassenbreiten von 0 bis 22 050
Hz.
Methoden und Ergebnisse
Frequenzspektrum
Zur Darstellung der allgemeinen Unterschiede und
Gemeinsamkeiten verschiedener Flächennutzungen in der
urbanen Umgebung wurde für alle Geräte über den gesamten
Zeitraum ein Median-Frequenzspektrum berechnet (Abb. 3).
Die X-Achse zeigt die Frequenz von 0 bis 22 050 Hz, die Y-
Achse die logarithmierte Leistung des Signals. Die schwarze
Linie bildet das Median-Freuqenzspektrum aller ca. 15 000
Aufnahmen für jedes Gerät. Die blaue Fläche zeigt den
Interquantilbereich zwischen dem 5% und 95% Quantil.
Abbildung 3: Fourier Log-Frequenzspektrum für alle
Aufnahmen, gruppiert nach Flächennutzung. Die schwarze
Linie stellt den Median aller Aufnahmen dar, die blaue
Fläche den Bereich zwischen dem 5 % und 95 % Quantil.
Als Gemeinsamkeit zwischen den Flächennutzungstypen fällt
zunächst die starke Dominanz der Leistung im tiefen
Frequenzbereich (bis ca. 80 Hz) auf, die den überwiegenden
Großteil der Leistung in der urbanen Umgebung repräsentiert.
Zudem lässt sich eine höhere Varianz des Medians zwischen
den einzelnen Frequenzen bis ca. 4.5 kHz erkennen, danach
wird dieser merklich glatter. Dies zeigt eine hohe Diversität
der Geräuschquellen, die diesen Frequenzbereich besetzen.
Zudem ist zu erkennen, dass die Leistung in allen
Flächennutzungstypen ab ca. 13 kHz sehr gering ist und auch
geringe Varianz aufweist, was durch den sehr engen
Interquantilbereich zu erkennen ist. Schließlich fällt die
Leistung in fast allen Geräten ab ca. 19 kHz noch einmal ab.
Die überwiegende Mehrheit der Geräuschquellen der urbanen
Umgebung besetzen demnach Frequenzen bis ca. 13 kHz.
Deutliche Unterschiede sind zwischen den
Flächennutzungstypen bzgl. dem Interquantilbereich zu
erkennen. Vor allem bei den drei Abbildungen der obersten
Reihe erkennen wir, dass das 5% Quantil (bis ca. 3 kHz) die
niedrige Leistung zu keiner Zeit erreicht, die bei allen anderen
Geräten schon ab ca. 1.5 kHz durchgängig erreicht wird. Dies
verdeutlicht die Dominanz der tieferen Frequenzen in diesen
Flächennutzungstypen, die vermutlich durch Straßenverkehr
bedingt werden.
Normalisierte Spektrogramme
Eine weitere Möglichkeit, die akustische Umwelt zu
analysieren, bietet das Spektrogramm. In Abb. 4 bildet die X-
Achse das Datum ab, dabei entspricht jede Spalte einem Tag.
Hierfür wurden die jeweiligen Spektren der 50 Aufnahmen
pro Tag gemittelt. Auf der Y-Achse ist die Frequenz
abgebildet. Die farblich dargestellte Z-Achse repräsentiert die
relative Leistung der Frequenz zu sich selbst, wobei 1 die
maximal gemessene und 0 die minimal gemessene Leistung
der jeweiligen Frequenz darstellt. Die Absolute Leistung wird
folglich nicht dargestellt. Die Normalisierung ermöglicht die
Darstellung von spezifischen Mustern der in Abb. 3
identifizierten niedrigen Leistung im höheren
Frequenzbereich (Abb. 4), die bei der Darstellung der
absoluten Leistung kaum erkenntlich würden.
Abbildung 4: Spektrogramm für alle Aufnahmen, gruppiert
nach Flächennutzung. Es wurde ein mittleres
Leistungsspektrum über alle Aufnahmen pro Datum/Gerät
ermittelt. Im Anschluss wurde für jede Frequenz (also Reihe)
die Leistung normalisiert, sodass die Werte der relativen
Leistung der Frequenz zu sich selbst entsprechen. Hierbei ist
1 die maximal gemessene und 0 die minimal gemessene
Leistung der jeweiligen Frequenz.
In Abb. 4 wird am Beispiel von fünf Mustern verdeutlicht, wie
verschiedene zusammenhängende Frequenzbereiche zu
Phänomenen der urbanen Umwelt korrespondieren.
Zum Ersten erkennen wir in Abb. 4 im tiefen Frequenzbereich
der „Hauptstraße“ bis ca. 2,5 kHz ein sich wiederholendes
Muster. Hier werden längere Abschnitte ähnlicher Leistung in
regelmäßigen Abschnitten von kurzzeitigen Abschnitten
niedrigerer Leistung unterbrochen. Unter Betrachtung der
Zeitreihe fällt hier auf, dass sich die niedrigeren
Frequenzleistungen im Wochenrhythmus wiederholen. Hier
kann davon ausgegangen werden, dass dieses Muster den
Straßenverkehr wiederspiegelt, der vor allem am Samstag und
Sonntag merklich abnimmt. Im Vergleich zu den anderen
Beispielen fällt zudem auf, dass dieses Muster – wenn auch
schwächer ausgeprägt – in fast allen Flächennutzungstypen
wiederzufinden ist. Allein „Urbaner Wald“ lässt dieses
Muster nicht erkennen, was für eine Abwesenheit von
Verkehrsgeräuschen stehen könnte.
Ein weiteres Muster ist der im Mai bis Juni aktiv besetzte
Frequenzbereich zwischen 2.5 und 8.5 kHz. Der Annahme
folgend, dass Vogelgeräusche hauptsächlich in diesem
Frequenzbereich auftreten und dem Wissen über die Brutzeit,
spiegelt diese Aktivität höchstwahrscheinlich die biophone
Aktivität, also den Vogelgesang wider.
Weniger verstanden ist dagegen die auffällige
zusammenhängende Struktur hoher relativer Leistung ab ca.
16 kHz, die in allen Flächennutzungstypen – außer der
Hauptstraße – vom Beginn der Aufnahmen bis ca. Mitte
Oktober zu beobachten ist. Eine mögliche Erklärung wäre ein
hochfrequentes Rascheln von Blättern. Diese Annahme
basiert allerdings nur auf dem zeitlichen Zusammenhang der
beiden Phänomene. Eine weitere Möglichkeit wäre eine
Korrelation von Temperatur und Rauschstärke, die die
saisonal unterschiedliche Leistung erklären könnte.
Ein weiteres Muster ist die in fast allen Flächennutzungstypen
zu beobachtende hohe relative Leistung von 3-16 kHz im
Oktober. Eine mögliche Erklärung wären starke Winde, da
diese die benannten Frequenzbereiche besetzen und im Herbst
häufiger stärker vorkommen.
Durch die Darstellung der Frequenzleistung mit Hilfe eines
normalisierten Spektrogramms über den gesamten
Beobachtungszeitraum lassen sich also nicht triviale Muster
erkennen, die allerdings zeitlich wie räumlich unterschiedlich
ausfallen und daher die hohe Heterogenität der urbanen
akustischen Umgebung in der zeitlichen sowie der räumlichen
Dimension zeigen. Prominent ist vor allem der
Zusammenhang verschiedener Frequenzbereiche. Die
Vermutung liegt nahe, dass zeitlich hochkorrelierte
Frequenzbereiche auf ähnliche bzw. gleiche
Geräuschursachen zurückzuführen sind. Eine Betrachtung
dieser Zusammenhänge könnte folglich ein hohes Potenzial
zur Differenzierung und Klassifizierung verschiedener
urbaner akustischer Räume bieten.
Korrelationsmatrizen
Zur Darstellung der Zusammenhänge verschiedener
Frequenzbereiche über die Zeit, wurden im Folgenden die
Frequenzspektren aller Audioaufnahmen jedes Geräts
miteinander korreliert.
Abbildung 5: Frequenz-Korrelationsmatrizen für alle
Aufnahmen über die Zeit, gruppiert nach Flächennutzung.
Hier wurden die Frequenzspektren jeder Aufnahme
miteinander über die Zeit korreliert, um zeitlich
zusammenhängende Frequenzmuster zu erkennen. Die Z-
Achse stellt das Bestimmtheitsmaß R2 (nach Pearson) dar.
Sowohl die X- als auch die Y-Achse stellen hier die Frequenz
dar. Die Matrizen sind also entlang der Diagonalen
symmetrisch. Aufgrund der zuvor beschriebenen geringen
Leistung in Frequenzen > 13 kHz und der benötigten
Rechenzeit für die Korrelationsanalyse wurden hier nur
Frequenzen ≤ 13 kHz berücksichtigt. Auf der Z-Achse ist
dieses Mal der quadrierte Korrelationskoeffizient (R2) nach
Pearson dargestellt, der beschreibt, wie stark sich die
Frequenzen im zeitlichen Verlauf ähneln.
Im Ergebnis sind u.a. teilweise klare rechteckige
Gruppenstrukturen erkennbar, die abgegrenzt
zusammenhängende Frequenzbereiche darstellen. Diese sind
vor allem in Reihe zwei und drei stark ausgeprägt. Hier
scheinen die Frequenzen > 9.5 kHz konsistent ein Cluster zu
bilden. Unter 9.5 kHz ist ebenfalls eine Gruppe erkennbar, die
sich allerdings etwas unterschiedlicher in ihrer unteren
Frequenzgrenze ausprägt. Diese liegt hier von 2.5 („Urbanes
Agrarland“) bis ca. 4.5 kHz („Spielplatz“).
Dementgegen unterscheiden sich die Strukturen der ersten
drei Abbildungen deutlich. Vor allem an der „Hauptstraße“
erkennen wir, dass tiefe Frequenzen < 100 Hz hoch mit
Frequenzen bis zu 9 kHz korrelieren. Auch Frequenzen > 4
kHz korrelieren hier stark mit fast allen Frequenzen darüber.
Dies spricht für wenige Faktoren, die die Gesamtvarianz der
akustischen Umgebung erklären können, und zurückgeführt
auf die urbane Akustik: Auf sehr dominante Geräuschquellen
– sehr wahrscheinlich Straßenverkehr – die fast den gesamten
Frequenzbereich besetzen.
Zusammenfassung und Ausblick
Im Rahmen dieser Analyse haben wir verschiedene
Eigenschaften der urbanen akustischen Umgebung mit Hilfe
eines räumlich umfassenden und zeitlich hochaufgelösten
Datensatzes beschrieben. Es zeigte sich, dass tiefe
Frequenzen die Leistung im urbanen Raum dominieren und
dass eine hohe Varianz der Leistung bis ca. 4 kHz gefolgt von
niedrigerer Varianz bis 13 kHz für alle Flächennutzungstypen
zu beobachten ist. Darüber werden Frequenzbereiche nur sehr
selten und mit wenig Leistung besetzt.
Gleichzeitig sind zwischen den Orten klare Unterschiede in
der Leistung und der Varianz – vor allem im Bereich bis 9
kHz – erkennbar. Die Betrachtung der normalisierten
Frequenzleistung über die Zeit lässt klare saisonale
Dynamiken in allen Frequenzbereichen erkennen. Zusätzlich
konnten Frequenzgruppen mit ähnlicher zeitlicher Dynamik
identifiziert werden, die teilweise auf gleichzeitig auftretende
Geräusche zurückgeführt werden konnten. Diese Erkenntnis
wurde als Anlass genommen, die Frequenzleistung aller
Aufnahmen je Gerät zu korrelieren, um ortsspezifische
Frequenzzusammenhänge zu identifizieren. Dies ergab, dass
Orte charakteristische Frequenzgruppen aufweisen, die
künftig genutzt werden könnten, um die urbane akustische
Umgebung zu beschreiben.
Unsere Ergebnisse zeigen, dass Korrelationen zwischen
Frequenzleistungen ein vielversprechender Ansatz zur
Beschreibung der urbanen akustischen Umgebung sind, da sie
nicht nur das Frequenzspektrum abbilden, sondern
gleichzeitig die zeitliche Dimension berücksichtigen.
Literatur
[1] Sugai, L. S. M., Silva, T. S. F., Ribeiro Jr, J. W., &
Llusia, D.: Terrestrial passive acoustic monitoring
review and perspectives. BioScience, 69(1) (2019), 15-
25.
[2] Lavia, L., Witchel, H. J., Aletta, F., Steffens, J., Fiebig,
A., Kang, J., & Healey, P. G.: Non-participant
observation methods for soundscape design and urban
planning. In Handbook of research on perception-driven
approaches to urban assessment and design (pp. 73-99).
IGI Global, 2018.
[3] Moebus, S., Gruehn, D., Poppen, J., Sutcliffe, R.,
Haselhoff, T., & Lawrence, B.: Akustische Qualität und
Stadtgesundheit–Mehr als nur Lärm und Stille.
Bundesgesundheitsblatt-Gesundheitsforschung-
Gesundheitsschutz, 63(8) (2020), 997-1003.
[4] Union, E.: Richtlinie 2002/49/EG des Europäischen
Parlaments und des Rates vom 25. Juni 2002 über die
Bewertung und Bekämpfung von Umgebungslärm
(“Umgebungslärmrichtlinie”). Amtsblatt der
Europäischen Gemeinschaften vom 18.07. 2002.
L189/12-25, deutsche Fassung (DE).
[5] Engel, M. S., Fiebig, A., Pfaffenbach, C., & Fels, J.: A
Review of the Use of Psychoacoustic Indicators on
Soundscape Studies. Current Pollution Reports, 7(3)
(2021), 359-378.
[6] Sueur, J.: Sound analysis and synthesis with R. Cham:
Springer, 2018.
[7] Fairbrass, A. J., Rennert, P., Williams, C., Titheridge, H.,
& Jones, K. E.: Biases of acoustic indices measuring
biodiversity in urban areas. Ecological Indicators, 83
(2017), 169-177.
[8] Haselhoff, T., Lawrence, B., Hornberg, J., Ahmed, S.,
Sutcliffe, R., Gruehn, D., & Moebus, S.: The acoustic
quality and health in urban environments (SALVE)
project: Study design, rationale and methodology.
Applied Acoustics (2022), 188, 108538.
[9] Nussbaumer, H. J.: The fast Fourier transform. In Fast
Fourier Transform and Convolution Algorithms (pp. 80-
111). Springer, Berlin, Heidelberg, 1981.