Zeitreihe
Was ist eine Zeitreihe?
Eine Zeitreihe ist eine zeitlich geordnete Folge von Datenpunkten. Ein Datenpunkt steht hierbei repräsentativ für einen Beobachtungszeitpunkt oder -zeitraum. Eine Zeitreihe besitzt eine konstante Granularität, beispielsweise Monat, Woche, Tag. Zeitreihen dienen als Grundlage zur Analyse der Vergangenheitswerte aber auch für die Prognose der künftigen Entwicklung.
Eine Zeitreihe besitzt einen Startpunkt (erste Beobachtung) und einen Endpunkt (letzte Beobachtung).
Zeitreihen können aus verschiedensten Daten bestehen und beispielsweise die Messungen eines Sensors oder die Umsätze pro Monat eines Produktes abbilden. Sie dienen als Grundlage für Analysen in Bereichen, in denen auf Basis von historischen Werten versucht wird, Muster zu erkennen und aussagekräftige Informationen zu gewinnen. Beispielhaft zu nennen sind hier die Felder Statistik, Signalverarbeitung, Finanzmathematik oder Wettervorhersagen.
Eine Zeitreihenanalyse hat oftmals das Ziel, von gegebenen Daten auf zukünftige Entwicklungen schließen zu können. Die dabei einsetzbaren Methoden sind vielfältig und unterscheiden sich teilweise signifikant in ihrem Ansatz. Den meisten Methoden gemein ist die Annahme, dass zeitlich näher beisammen liegende Datenpunkte eine stärkere Beziehung zueinander haben als weiter auseinanderliegende.
Auch Zeitreihen können sich in ihrer Struktur stark voneinander unterscheiden und werden daher in bestimmte Klassen eingeteilt. Nicht jede Methode sollte/kann auf alle Zeitreihenklassen angewendet werden. Um eine möglichst hohe Vorhersagegüte gewährleisten zu können, ist die richtige Klassifikation der Zeitreihe und damit die richtige Auswahl der Vorhersagemethode essentiell.
Verschiedene Typen von Zeitreihen
Zeitreihen können qualitativ recht unterschiedlich sein und benötigen daher unterschiedliche Techniken, um sie zu modellieren. Eine einfache Klassifikation ist gegeben durch:
Glatte Zeitreihe:
Wenige bis keine Werte=0, kleiner Varianzkoeffizient.
Erratische Zeitreihe:
Wenige bis keine Werte=0, höherer Varianzkoeffizient.
Sporadische Zeitreihe:
Vielfach Werte=0, keine Häufung.
Geklumpte Zeitreihe:
Wenn Werte ungleich 0, dann gehäuft.
Triviale Zeitreihentypen
Darüber hinaus gibt es auch weitere Typen, z.B. diese "trivialen", bei denen i.d.R. keine Muster erkannt werden können:
- few observations: äußerst wenige von Null verschiedene Werte.
- (almost) constant: ein über die Zeit hinweg (fast) konstanter Wert.
- very short: sehr wenige Werte bzw. eine extrem kurze Datenhistorie.
Eigenschaften von Zeitreihen
Granularität
Die Granularität einer Zeitreihe bestimmt die zeitliche Frequenz, in der Beobachtungen über die Zeit hinweg gemessen werden. Monatliche Granularität liegt vor, wenn pro Monat eine Beobachtung erfasst wird. Von täglicher Granularität spricht man, wenn Beobachtungen pro Tag gemessen werden.
Saisonalität
Mit Saisonalität bezeichnet man eine für Zeitreihen typische Strukturkomponente: Saisonalität liegt vor, wenn sich in der Zeitreihe zyklische, wiederholende Figuren finden. Die Länge des Zeitraums, nachdem diese saisonalen Figuren wiederkehren, bezeichnet man als Saisonlänge. Monatsdaten weisen zum Beispiel oft eine Saisonalität mit einer Saisonlänge von 12 Monaten auf.
Trend
Neben der Saisonalität ist der Trend einer Zeitreihe eine weitere wichtige Struktureigenschaft: Ein Trend liegt vor, wenn in der Zeitreihe lokal eine eindeutige Entwicklungsrichtung erkennbar ist; entweder eine Entwicklung nach oben (positives Wachstum) oder eine Entwicklung nach unten (negatives Wachstum). Generell lassen sich unterschiedliche Trendtypen modellieren: linearer Trend, parabolischer Trend, exponentieller Trend, etc. In der Praxis beschränkt man sich häufig auf den linearen Trend und den linear gedämpften Trend. Während ein linearer Trend einen erkannten Trend linear in die Zukunft fortschreibt, kann mittels gedämpftem Trend eine Trendsättigung modelliert werden. Hier schwächt der Trend im Laufe der Zeit ab.
Ausreißer
Als Ausreißer werden außergewöhnliche Werte in der Zeitreihenhistorie bezeichnet, die die übliche Struktur der Zeitreihe durchbrechen. Ausreißer können z.B. eine Sondersituation aber auch durch einen Datenfehler zustande kommen. Solche Ausnahmewerte können die Modellschätzung und damit die Forecasts verfälschen. Ausreißer gilt es datenbasiert zu identifizieren und ggf. durch einen passenden Ersatzwert zu ersetzen.