Monday 2 January 2017

Autoregressive Moving Durchschnitt Excel

ARMA Unplugged Dies ist der erste Eintrag in unserer Serie von Unplugged-Tutorials, in dem wir uns mit den Details der einzelnen Zeitreihenmodelle vertraut machen, die Sie bereits kennen und die zugrunde liegenden Annahmen hervorheben und die Intuitionen hinter sich heimführen. In dieser Ausgabe beschäftigen wir uns mit dem ARMA-Modell als Eckpfeiler der Zeitreihenmodellierung. Im Gegensatz zu früheren Analyse-Problemen werden wir hier mit der ARMA-Prozessdefinition beginnen, die Eingaben, Ausgänge, Parameter, Stabilitätsbeschränkungen, Annahmen und schließlich einige Richtlinien für den Modellierungsprozess angeben. Hintergrund Nach Definition ist der auto-regressive gleitende Durchschnitt (ARMA) ein stationärer stochastischer Prozess, der sich aus Summen autoregressiver Excel und gleitender durchschnittlicher Komponenten zusammensetzt. Alternativ, in einer einfachen Formulierung: Annahmen Lassen Sie uns näher auf die Formulierung. Der ARMA-Prozess ist einfach eine gewichtete Summe der bisherigen Output-Beobachtungen und Schocks mit wenigen Annahmen: Was bedeuten diese Annahmen? Ein stochastischer Prozess ist ein Gegenstück eines deterministischen Prozesses, der die Entwicklung einer Zufallsvariablen über die Zeit beschreibt. In unserem Fall ist die Zufallsvariable Das ARMA-Verfahren erfasst nur die serielle Korrelation (d. h. Autokorrelation) zwischen den Beobachtungen. In einfachen Worten fasst der ARMA-Prozess die Werte der vergangenen Beobachtungen zusammen, nicht ihre quadratischen Werte oder ihre Logarithmen usw. Die Abhängigkeitsordnung höherer Ordnung erfordert einen anderen Prozess (z. B. ARCHGARCH, nichtlineare Modelle usw.). Es gibt zahlreiche Beispiele für einen stochastischen Prozess, bei dem vergangene Werte aktuelle beeinflussen. Beispielsweise werden in einem Verkaufsbüro, das laufend Anfragen erhält, manche umsatzgewonnen, teils umsatzvermindert und ein paar in den nächsten Monat verschüttet. Als Ergebnis, in einem bestimmten Monat, einige der verkauften Fälle stammen als Anfragen oder sind Wiederholungen Verkäufe aus den vorherigen Monaten. Was sind die Schocks, Innovationen oder Fehlerbegriffe Das ist schwierige Frage, und die Antwort ist nicht weniger verwirrend. Dennoch können wir es versuchen: In einfachen Worten, ist der Fehler Begriff in einem gegebenen Modell ein catch-all Eimer für alle Variationen, die das Modell nicht erklärt. Noch verloren Nehmen wir ein Beispiel. Für einen Aktienkursprozess gibt es möglicherweise Hunderte von Faktoren, die das Preisniveau aktualisieren, einschließlich: Dividenden und Split-Ankündigungen Vierteljährliche Ergebnisberichte Fusion und Akquisition (MampA) Aktivitäten Gesetzliche Ereignisse, z. B. Die Drohung von Sammelklagen. Andere Ein Modell, durch Design, ist eine Vereinfachung einer komplexen Realität, so dass, was auch immer verlassen wir außerhalb des Modells automatisch in den Fehler Begriff gebündelt wird. Der ARMA-Prozess geht davon aus, dass der kollektive Effekt all dieser Faktoren mehr oder weniger wie das Gaußsche Rauschen wirkt. Warum kümmern wir uns um vergangene Schocks Anders als ein Regressionsmodell kann das Auftreten eines Stimulus (z. B. Schock) einen Einfluss auf das aktuelle Niveau und eventuell zukünftige Ebenen haben. Zum Beispiel wirkt sich ein Unternehmensereignis (z. B. MampA-Aktivität) auf den Aktienkurs der Underling-Gesellschaften aus, aber die Änderung kann eine gewisse Zeit dauern, bis die Marktteilnehmer die verfügbaren Informationen analysieren und entsprechend reagieren. Dies wirft die Frage auf: Dont die Vergangenheit Werte der Ausgabe haben bereits die Schocks Vergangenheit Informationen JA, die Schocks Geschichte ist bereits in den letzten Ausgangspegeln berücksichtigt. Ein ARMA-Modell kann nur als reines autoregressives (AR) Modell dargestellt werden, aber der Speicherbedarf eines solchen Systems in unendlich. Dies ist der einzige Grund, die MA-Komponente einzuschließen: um Speicherplatz zu sparen und die Formulierung zu vereinfachen. Auch hier muss das ARMA-Verfahren stationär sein, damit die marginale (unbedingte) Varianz existiert. Anmerkung: In meiner Diskussion unterscheide ich nicht zwischen der bloßen Abwesenheit einer Einheitswurzel in der charakteristischen Gleichung und der Stationarität des Prozesses. Sie sind verwandt, aber das Fehlen einer Einheitswurzel ist keine Garantie der Stationarität. Dennoch muss die Einheitswurzel innerhalb des Einheitskreises liegen, um genau zu sein. Fazit Lasst uns rekapitulieren, was wir bisher getan haben. Zuerst untersuchten wir einen stationären ARMA Prozess, zusammen mit seiner Formulierung, Eingaben, Annahmen und Speicheranforderungen. Als nächstes haben wir gezeigt, dass ein ARMA-Prozess seine Ausgangswerte (Autokorrelation) und Schocks enthält, die es früher in der aktuellen Ausgabe erfahren hat. Schließlich haben wir gezeigt, dass das stationäre ARMA-Verfahren eine Zeitreihe mit einem stabilen langfristigen Mittelwert und Varianz erzeugt. In unserer Datenanalyse sollten wir, bevor wir ein ARMA-Modell vorschlagen, die Stationaritätsannahme und den endlichen Speicherbedarf verifizieren. Für den Fall, dass die Datenreihe einen deterministischen Trend aufweist, müssen wir sie zuerst entfernen (de-Trend) und dann die Residuen für ARMA verwenden. Für den Fall, dass der Datensatz einen stochastischen Trend (z. B. zufällige Wanderung) oder Saisonalität aufweist, müssen wir ARIMASARIMA unterhalten. Schließlich kann das Korrelogramm (d. h. ACFPACF) verwendet werden, um den Speicherbedarf des Modells zu messen, von dem erwartet wird, daß entweder ACF oder PACF schnell nach einigen Verzögerungen abklingen. Wenn nicht, kann dies ein Zeichen für Nichtstationarität oder ein Langzeitmuster sein (z. B. ARFIMA). Ein RIMA steht für Autoregressive Integrated Moving Average-Modelle. Univariate (Einzelvektor) ARIMA ist eine Prognosemethode, die die zukünftigen Werte einer Serie, die vollständig auf ihrer eigenen Trägheit basiert, projiziert. Seine Hauptanwendung liegt im Bereich der kurzfristigen Prognose mit mindestens 40 historischen Datenpunkten. Es funktioniert am besten, wenn Ihre Daten eine stabile oder konsistente Muster im Laufe der Zeit mit einem Minimum an Ausreißern zeigt. Manchmal nennt man Box-Jenkins (nach den ursprünglichen Autoren), ARIMA ist in der Regel überlegen exponentielle Glättung Techniken, wenn die Daten relativ lange und die Korrelation zwischen vergangenen Beobachtungen ist stabil. Wenn die Daten kurz oder stark flüchtig sind, kann eine gewisse Glättungsmethode besser ablaufen. Wenn Sie nicht über mindestens 38 Datenpunkte verfügen, sollten Sie eine andere Methode als ARIMA betrachten. Der erste Schritt bei der Anwendung der ARIMA-Methodik ist die Überprüfung der Stationarität. Stationarität impliziert, dass die Reihe auf einem ziemlich konstanten Niveau über Zeit bleibt. Wenn ein Trend besteht, wie in den meisten wirtschaftlichen oder geschäftlichen Anwendungen, dann sind Ihre Daten nicht stationär. Die Daten sollten auch eine konstante Varianz in ihren Schwankungen im Laufe der Zeit zeigen. Dies ist leicht zu sehen mit einer Serie, die stark saisonal und wächst mit einer schnelleren Rate. In einem solchen Fall werden die Höhen und Tiefen der Saisonalität im Laufe der Zeit dramatischer. Ohne dass diese Stationaritätsbedingungen erfüllt sind, können viele der mit dem Prozess verbundenen Berechnungen nicht berechnet werden. Wenn eine grafische Darstellung der Daten Nichtstationarität anzeigt, dann sollten Sie die Serie unterscheiden. Die Differenzierung ist eine hervorragende Möglichkeit, eine nichtstationäre Serie in eine stationäre zu transformieren. Dies geschieht durch Subtrahieren der Beobachtung in der aktuellen Periode von der vorherigen. Wenn diese Transformation nur einmal zu einer Reihe erfolgt, sagen Sie, dass die Daten zuerst unterschieden wurden. Dieser Prozess im Wesentlichen eliminiert den Trend, wenn Ihre Serie wächst mit einer ziemlich konstanten Rate. Wenn es mit steigender Rate wächst, können Sie das gleiche Verfahren anwenden und die Daten erneut differenzieren. Ihre Daten würden dann zweite differenziert werden. Autokorrelationen sind Zahlenwerte, die angeben, wie sich eine Datenreihe mit der Zeit auf sich bezieht. Genauer gesagt misst es, wie stark Datenwerte bei einer bestimmten Anzahl von Perioden auseinander über die Zeit miteinander korreliert werden. Die Anzahl der Perioden wird in der Regel als Verzögerung bezeichnet. Zum Beispiel misst eine Autokorrelation bei Verzögerung 1, wie die Werte 1 Periode auseinander in der Reihe miteinander korreliert sind. Eine Autokorrelation bei Verzögerung 2 misst, wie die Daten, die zwei Perioden voneinander getrennt sind, über die gesamte Reihe miteinander korrelieren. Autokorrelationen können im Bereich von 1 bis -1 liegen. Ein Wert nahe 1 gibt eine hohe positive Korrelation an, während ein Wert nahe -1 impliziert eine hohe negative Korrelation. Diese Maßnahmen werden meist durch grafische Darstellungen, sogenannte Korrelagramme, ausgewertet. Ein Korrelationsdiagramm zeigt die Autokorrelationswerte für eine gegebene Reihe bei unterschiedlichen Verzögerungen. Dies wird als Autokorrelationsfunktion bezeichnet und ist bei der ARIMA-Methode sehr wichtig. Die ARIMA-Methodik versucht, die Bewegungen in einer stationären Zeitreihe als Funktion der so genannten autoregressiven und gleitenden Durchschnittsparameter zu beschreiben. Diese werden als AR-Parameter (autoregessiv) und MA-Parameter (gleitende Mittelwerte) bezeichnet. Ein AR-Modell mit nur einem Parameter kann als geschrieben werden. X (t) A (1) X (t-1) E (t) wobei X (t) Zeitreihen A (1) der autoregressive Parameter der Ordnung 1 X (t-1) (T) der Fehlerterm des Modells Dies bedeutet einfach, dass jeder gegebene Wert X (t) durch eine Funktion seines vorherigen Wertes X (t-1) plus einen unerklärlichen Zufallsfehler E (t) erklärt werden kann. Wenn der geschätzte Wert von A (1) 0,30 betrug, dann wäre der aktuelle Wert der Reihe mit 30 seines vorherigen Wertes 1 verknüpft. Natürlich könnte die Serie auf mehr als nur einen vergangenen Wert bezogen werden. Zum Beispiel ist X (t) A (1) X (t-1) A (2) X (t-2) E (t) Dies zeigt an, dass der aktuelle Wert der Reihe eine Kombination der beiden unmittelbar vorhergehenden Werte ist, X (t-1) und X (t-2) zuzüglich eines Zufallsfehlers E (t). Unser Modell ist nun ein autoregressives Modell der Ordnung 2. Moving Average Models: Eine zweite Art von Box-Jenkins-Modell wird als gleitendes Durchschnittsmodell bezeichnet. Obwohl diese Modelle dem AR-Modell sehr ähnlich sind, ist das Konzept dahinter ganz anders. Bewegliche Durchschnittsparameter beziehen sich auf das, was in der Periode t stattfindet, nur auf die zufälligen Fehler, die in vergangenen Zeitperioden aufgetreten sind, dh E (t-1), E (t-2) usw. anstatt auf X (t-1), X T-2), (Xt-3) wie in den autoregressiven Ansätzen. Ein gleitendes Durchschnittsmodell mit einem MA-Begriff kann wie folgt geschrieben werden. X (t) - B (1) E (t-1) E (t) Der Begriff B (1) wird als MA der Ordnung 1 bezeichnet. Das negative Vorzeichen vor dem Parameter wird nur für Konventionen verwendet und in der Regel ausgedruckt Automatisch von den meisten Computerprogrammen. Das obige Modell sagt einfach, dass jeder gegebene Wert von X (t) direkt nur mit dem Zufallsfehler in der vorherigen Periode E (t-1) und mit dem aktuellen Fehlerterm E (t) zusammenhängt. Wie im Fall von autoregressiven Modellen können die gleitenden Durchschnittsmodelle auf übergeordnete Strukturen mit unterschiedlichen Kombinationen und gleitenden mittleren Längen erweitert werden. Die ARIMA-Methodik erlaubt es auch, Modelle zu erstellen, die sowohl autoregressive als auch gleitende Durchschnittsparameter zusammenführen. Diese Modelle werden oft als gemischte Modelle bezeichnet. Obwohl dies für eine kompliziertere Prognose-Tool macht, kann die Struktur tatsächlich simulieren die Serie besser und produzieren eine genauere Prognose. Pure Modelle implizieren, dass die Struktur nur aus AR oder MA-Parameter besteht - nicht beides. Die Modelle, die von diesem Ansatz entwickelt werden, werden in der Regel als ARIMA-Modelle bezeichnet, da sie eine Kombination aus autoregressiver (AR), Integration (I) verwenden, die sich auf den umgekehrten Prozess der Differenzierung bezieht, um die Prognose zu erzeugen. Ein ARIMA-Modell wird üblicherweise als ARIMA (p, d, q) angegeben. Dies ist die Reihenfolge der autoregressiven Komponenten (p), der Anzahl der differenzierenden Operatoren (d) und der höchsten Ordnung des gleitenden Mittelwerts. Beispielsweise bedeutet ARIMA (2,1,1), dass Sie ein autoregressives Modell zweiter Ordnung mit einer ersten gleitenden Durchschnittskomponente haben, deren Serie einmal differenziert wurde, um die Stationarität zu induzieren. Auswahl der richtigen Spezifikation: Das Hauptproblem in der klassischen Box-Jenkins versucht zu entscheiden, welche ARIMA-Spezifikation zu verwenden - i. e. Wie viele AR - und / oder MA-Parameter einzuschließen sind. Dies ist, was viel von Box-Jenkings 1976 dem Identifikationsprozeß gewidmet wurde. Es hing von der graphischen und numerischen Auswertung der Stichprobenautokorrelation und der partiellen Autokorrelationsfunktionen ab. Nun, für Ihre grundlegenden Modelle, ist die Aufgabe nicht allzu schwierig. Jeder hat Autokorrelationsfunktionen, die eine bestimmte Weise aussehen. Allerdings, wenn Sie gehen in der Komplexität, die Muster sind nicht so leicht zu erkennen. Um es schwieriger zu machen, stellen Ihre Daten nur eine Probe des zugrundeliegenden Prozesses dar. Das bedeutet, dass Stichprobenfehler (Ausreißer, Messfehler etc.) den theoretischen Identifikationsprozess verzerren können. Deshalb ist die traditionelle ARIMA-Modellierung eher eine Kunst als eine Wissenschaft.


No comments:

Post a Comment