Gütemaß

Wie ist eine ‚gute‘ Prognose? Die Antwort auf diese zentrale Frage hängt stark vom zugrunde liegenden Anwendungsfall ab. In der Statistik werden eine Vielzahl unterschiedlicher Gütemaße verwendet, um die Qualität einer Prognose zu evaluieren. Dies lässt bereits erahnen, dass das eine, für die Beurteilung von Prognosen optimale Gütemaß nicht existiert. Vielmehr müssen bei der Beurteilung von Gütemaßen das Wissen über die Datengrundlage und die Ansprüche an die Prognose mit abgewogen werden. Umso wichtiger ist es, die Prinzipien auf denen die Gütemaße aufbauen zu verstehen.

Im Folgenden schauen wir uns einige der am häufigsten vorkommenden Gütemaße an:

Gemeinsam ist diesen Gütemaßen, dass ihre Auswertung auf dem sogenannten Prognosefehler basiert.

Prognosefehler

Der Prognosefehler (engl. forecast error) ist die Differenz von tatsächlich eingetretenem Wert und der Prognose.

Im Detail ist der Prognosefehler für eine Prognose, die i Zeiteinheiten in die Zukunft blickt, gegeben durch:

e t = act t - fc t

Hierbei ist

fc t

der Vorhersagewert der Prognose nach i Zeiteinheiten und

act t

der tatsächlich eingetretene Wert zum entsprechenden Zeitpunkt.

Eigenschaften

Prognosen und Prognosefehler einer monatlichen Zeitreihe im Testzeitraum

Absoluter Fehler (AE)

Der Betrag der Abweichung von tatsächlichem zu vorhergesagtem Wert wird als absoluter Prognosefehler (engl. absolute forecast error, AE) bezeichnet. Er ermittelt sich via:

AE t = | e t | = | act t - fc t |

Eigenschaften

Prozentualer Fehler (PE)

Der prozentuale Prognosefehler (engl. percentage error, PE) misst den Prognosefehler relativ zum tatsächlich eingetretenen Wert. Es gilt:

PE t = e t act t = act t - fc t act t

Eigenschaften

Absoluter prozentualer Fehler (APE)

Der absolute prozentuale Prognosefehler (engl. absolute percentage error, APE) misst den Betrag der Prognosefehler relativ zum tatsächlich eingetretenen Wert. Es gilt:

APE t = | e t act t | = | act t - fc t act t |

Abgesehen von der Beschänkung auf nicht-negative Werte, teilt der APE die Eigenschaften des prozentualen Prognosefehlers.

Eigenschaften

Mittlerer Fehler (ME)

Der mittlere Fehler (engl. mean error, ME) gibt den durchschnittlichen Fehler an. Das Mittel wird hier für gewöhnlich über alle betrachteten Prognoseschritte von 1 bis h gebildet.

ME = 1 h t = 1 h e t = 1 h t = 1 h ( act t fc t )

Mit dem ME sind wir bei den aggregierten Gütemaßen angelangt.

Eigenschaften

Mittlerer Prognosefehler (Mean Error, ME) einer Zeitreihe im Testzeitraum

Mittlerer absoluter Fehler (MAE)

Der mittlere absolute Fehler (engl. mean absolute error) gibt den Durchschnitt aller absoluten Prognosefehler an. Das Mittel wird hier für gewöhnlich über alle betrachteten Prognoseschritte von 1 bis n gebildet.

MAE = 1 h t = 1 h AE t = 1 h t = 1 h e t = 1 h t = 1 h act t fc t

Abgesehen von der Tatsache, dass sich Prognosefehler aufgrund der Beschänkung auf nicht-negative Werte nicht mehr aufheben können, teilt der MAE die Eigenschaften des mittleren Fehlers.

Eigenschaften

Mittlerer absoluter Prognosefehler (Mean Absolute Error, MAE) einer Zeitreihe im Testzeitraum

Mittlerer absoluter prozentualer Fehler (MAPE)

Der mittlere absolute prozentuale Fehler (engl. mean absolute percentage error) beschreibt den Durchschnitt der absoluten prozentualen Prognosefehler relativ zu der Größenordnung der tatsächlichen Werte.

MAPE = 1 h t = 1 h APE t = 1 h t = 1 h e t act t = 1 h t = 1 h act t fc t act t

Da ansonsten durch Null geteilt werden würde, kann der MAPE nicht für Zeitreihen verwendet werden, in denen viele Werte Null entsprechen. Er liefert auch keine guten Ergebnisse für Zeitreihen mit vielen Werten nahe Null. Jedoch ist der MAPE, anders als der MAE oder MSE, einheitenlos und kann daher besser für Vergleiche der Güte von Prognosen unterschiedlicher Größen genutzt werden.

Eigenschaften

Mittlerer absoluter prozentualer Prognosefehler (MAPE) einer Zeitreihe im Testzeitraum

Mittlerer quadratischer Fehler (MSE)

Der mittlere quadratische Fehler (engl. mean squared error) entspricht dem Durchschnitt der quadrierten Prognosefehler.

MSE = 1 h t = 1 h e t 2 = 1 h t = 1 h ( act t fc t ) 2

Wie der MAE und MAPE berücksichtigt er nur die absolute Abweichung der Prognose vom tatsächlichen Wert und nicht deren Richtung. Im Vergleich zum MAE fallen durch die Quadrierung große Fehler stärker ins Gewicht. Dies hat u. a. zur Folge, dass der MSE anfälliger gegenüber Ausreißern ist. Der mittlere quadratische Fehler wird oft als Optimierungskriterium in der Modellbildung verwendet, etwa bei der klassischen linearen Regression.

Eigenschaften

Mittlerer quadratischer Prognosefehler (MSE) einer Zeitreihe im Testzeitraum

Mittlerer absoluter skalierter Fehler (MASE)

Der mittlere absolute skalierte Fehler (engl. mean absolute scaled error) entspricht dem MAE der betrachteten Prognose geteilt durch den MAE einer einstufigen naiven Prognose (in-sample) der tatsächlichen Werte 1 bis n.

MASE = 1 h t = 1 h act n+t fc n+t 1 n-1 t = 2 n act t act t-1

Demnach impliziert ein MASE größer als 1, dass die betrachtete Prognose schlechter ist als eine einstufige naive Prognose; ein MASE kleiner als 1, dass sie besser ist. Während eine gute einstufige Prognose einen MASE von 1 demnach klar unterschreiten sollte, bedeutet bei einer mehrstufigen Prognose ein MASE größer als 1 nicht notwendigerweise, dass diese nicht gut ist.

Wie der MAPE hat auch der MASE keine Einheit und eignet sich daher für Vergleiche. Verglichen mit dem MAPE kann der MASE besser mit (einzelnen) Nullwerten in Zeitreihen umgehen. Im Gegenzug ist der MASE nicht gut für annähernd konstante Zeitreihen geeignet, da in diesem Fall die Prognosefehler einer naiven Prognose häufig Null entsprechen und deren MAE somit sehr klein ist.

Eigenschaften

Symmetrischer MAPE (sMAPE)

Der symmetrische mittlere absolute prozentuale Fehler (engl. scaled mean absolute percentage error, sMAPE) mittelt über die absoluten Fehler geteilt durch den Mittelwert der Beträge von tatsächlichem und prognostiziertem Wert.

sMAPE = 1 h ( | e t | ( | act t | + | fc t | ) / 2 ) = 1 h ( | act t - fc t | ( | act t | + | fc t | ) / 2 )

Im Vergleich zum MAPE, bei dem die Gewichtung der Prognosefehler nur auf dem tatsächlichen Wert basiert, wird beim sMAPE also auch die Höhe des prognostizierten Wertes berücksichtigt. Wie der MAPE liefert auch der sMAPE keine guten Ergebnisse, wenn viele der tatsächlichen bzw. prognostizierten Werte nahe bei oder gleich Null sind.

Der sMAPE nimmt Werte zwischen 0% und 200% an.

Eigenschaften

MAPE vs. sMAPE

Die transformierten Fehler, die gemittelt den MAPE bzw. sMAPE ergeben, wirken ziemlich ähnlich; am besten wird der Unterschied zwischen beiden Gütemaßen in folgendem Beispiel deutlich. Der Einfachheit halber wird nur ein prognostizierter Zeitpunkt betrachtet.

Fall 1: Die Vorhersage liegt fixiert bei fc = 100. Die tatsächlichen Werte varieren um 100 +/- 10. Dies führt jeweils zu einem absoluten Prognosefehler von 10.

act = 90, fc = 100 act = 110, fc = 100
MAPE 10/90 10/110
sMAPE 10/95 10/105

Fall 2: Nun lassen wir die tatsächlichen Werte fixiert bei act = 100 und variieren die Vorhersage um 100 +/- 10. Wie im Fall 1, ergibt sich auch hier jeweils ein Prognosefehler von 10.

act = 100, fc = 90 act = 100, fc = 110
MAPE 10/100 10/100
sMAPE 10/95 10/105

Man erkennt:

Periods in Stock (PIS)

Periods in Stock ist ein Gütemaß, das aufsummiert, wie lange Prognosefehler als Bestand in einem fiktiven Lager bleiben bis sie durch entsprechende Prognosefehler in die andere Richtung ausgeglichen werden.

PIS = - t = 1 h j = 1 t e j = - t = 1 h j = 1 t ( act j - fc j )

Die Richtung der Prognosefehler ist bei diesem Gütemaß somit von Bedeutung. PIS bezieht des Weiteren anders als beispielsweise der MAE die Dauer des Mismatches zwischen Prognose und tatsächlichem Wert mit ein und kann daher gut zur Bewertung von Prognosen von sporadischen Zeitreihen, also Zeitreihen mit vielen Nullwerten, verwendet werden.

Zum Beispiel führt eine Prognose mehrere Tage zu früh (Prognose 1) zu einem höhen PIS, also einer schlechteren Prognosegüte, als eine nur um einen Tag verschobene Prognose (Prognose 2), während andere Gütemaße wie der MAE beide Fälle gleich bewerten.

Zeitpunkt tatsächlicher Wert Prognose 1 "Bestand" 1 Prognose 2 "Bestand" 2
1 0 1 1 0 0
2 0 0 1 0 0
3 0 0 1 1 1
4 1 0 0 0 0

PIS1 = 3,   PIS2 = 1,   MAE1 = MAE2 = 0.5

Eigenschaften

Sie sind dabei, unsere Webseite über einen externen Link zu verlassen. Bitte beachten Sie, dass der Inhalt der verlinkten Seite außerhalb unserer Kontrolle liegt.

Cookies und andere (Dritt-)Dienste

Diese Website speichert Cookies auf Ihrem Computer nur, wenn Sie dem ausdrücklich zustimmen. Bei Zustimmung werden insbesondere auch Dritt-Dienste eingebunden, die zusätzliche Funktionalitäten, wie beispielsweise die Buchung von Terminen, bereitstellen. Diese Cookies und Dienste werden verwendet, um Informationen darüber zu sammeln, wie Sie mit unserer Website interagieren, und um Ihre Browser-Erfahrung zu verbessern und anzupassen. Zudem nutzen wir diese Informationen für Analysen und Messungen zu unseren Besuchern auf dieser Website und anderen Medien. Weitere Informationen zu den von uns verwendeten Cookies und Dritt-Diensten finden Sie in unseren Datenschutzbestimmungen.