Saturday 1 April 2017

Acf Gleitender Durchschnitt


Identifizieren der Anzahl von AR - oder MA-Terme in einem ARIMA-Modell ACF - und PACF-Diagramme: Nachdem eine Zeitreihe durch Differenzieren stationarisiert worden ist, ist der nächste Schritt beim Anpassen eines ARIMA-Modells zu bestimmen, ob AR - oder MA-Terme benötigt werden, um eine Autokorrelation zu korrigieren Bleibt in der differenzierten Reihe. Natürlich, mit Software wie Statgraphics, könnten Sie nur versuchen, einige verschiedene Kombinationen von Begriffen und sehen, was am besten funktioniert. Aber es gibt einen systematischeren Weg, dies zu tun. Durch Betrachten der Autokorrelationsfunktion (ACF) und partiellen Autokorrelations - (PACF-) Plots der differenzierten Serien können Sie die Anzahl der benötigten AR - und MA-Terme vorläufig identifizieren. Sie sind bereits mit dem ACF-Diagramm vertraut: Es ist nur ein Balkendiagramm der Koeffizienten der Korrelation zwischen einer Zeitreihe und Verzögerungen von sich selbst. Das PACF-Diagramm ist ein Diagramm der partiellen Korrelationskoeffizienten zwischen der Reihe und den Verzögerungen von sich selbst. Im allgemeinen ist die Quotientquot-Korrelation zwischen zwei Variablen der Betrag der Korrelation zwischen ihnen, der nicht durch ihre gegenseitigen Korrelationen mit einem bestimmten Satz von anderen Variablen erklärt wird. Wenn wir z. B. eine Variable Y auf andere Variablen X1, X2 und X3 zurückrechnen, ist die partielle Korrelation zwischen Y und X3 der Betrag der Korrelation zwischen Y und X3, der nicht durch ihre gemeinsamen Korrelationen mit X1 und X2 erklärt wird. Diese partielle Korrelation kann als Quadratwurzel der Abweichung berechnet werden, die durch Addition von X3 an die Regression von Y auf X1 und X2 erreicht wird. Eine partielle Autokorrelation ist die Größe der Korrelation zwischen einer Variablen und einer Verzögerung von sich, die nicht durch Korrelationen bei allen niedrigeren Ordnungsschichten erklärt wird. Die Autokorrelation einer Zeitreihe Y bei der Verzögerung 1 ist der Koeffizient der Korrelation zwischen Y t und Y t - 1. Was vermutlich auch die Korrelation zwischen Y t -1 und Y t -2 ist. Aber wenn Y t mit Y t -1 korreliert. Und Y t -1 ist gleich mit Y t -2 korreliert. Dann sollten wir auch erwarten, Korrelation zwischen Y t und Y t-2 zu finden. Tatsächlich ist die Korrelationsmenge, die wir bei der Verzögerung 2 erwarten sollten, genau das Quadrat der Lag-1-Korrelation. Folglich propagiert die Korrelation bei Verzögerung 1 eine Verzögerung 2 und vermutlich zu Verzögerungen höherer Ordnung. Die partielle Autokorrelation bei Verzögerung 2 ist daher die Differenz zwischen der tatsächlichen Korrelation bei Verzögerung 2 und der erwarteten Korrelation aufgrund der Ausbreitung der Korrelation bei Verzögerung 1. Hier ist die Autokorrelationsfunktion (ACF) der UNITS-Reihe, bevor irgendeine Differenzierung durchgeführt wird: Die Autokorrelationen sind für eine große Anzahl von Verzögerungen signifikant, aber vielleicht sind die Autokorrelationen bei den Verzögerungen 2 und höher lediglich auf die Ausbreitung der Autokorrelation bei Verzögerung 1 zurückzuführen. Dies wird durch die PACF-Kurve bestätigt: Es ist zu beachten, daß die PACF-Kurve signifikant ist Spike nur bei Verzögerung 1, was bedeutet, dass alle Autokorrelationen höherer Ordnung effektiv durch die Lag-1-Autokorrelation erklärt werden. Die partiellen Autokorrelationen bei allen Verzögerungen können durch Anpassen einer Folge autoregressiver Modelle mit zunehmender Anzahl von Verzögerungen berechnet werden. Insbesondere ist die partielle Autokorrelation bei Verzögerung k gleich dem geschätzten AR (k) - Koeffizienten in einem autoregressiven Modell mit k Terme - d. e. Ein Multiregressionsmodell, bei dem Y auf LAG (Y, 1), LAG (Y, 2) usw. bis zu LAG (Y, k) zurückgerechnet wird. Somit können Sie durch bloße Inspektion der PACF bestimmen, wie viele AR-Begriffe Sie verwenden müssen, um das Autokorrelationsmuster in einer Zeitreihe zu erläutern: Wenn die partielle Autokorrelation bei einer Verzögerung k signifikant ist und bei einer höheren Ordnung nicht signifikant ist - d. h. Wenn die PACF-Abkürzung offquot bei Verzögerung k - dann schlägt dies vor, Sie sollten versuchen, Montage eines autoregressiven Modells der Ordnung k Die PACF der UNITS-Serie bietet ein extremes Beispiel für die Cut-off-Phänomen: es hat eine sehr große Spitze bei Verzögerung 1 Und keine anderen signifikanten Spitzen, was anzeigt, daß bei Abwesenheit der Differenzierung ein AR (1) - Modell verwendet werden sollte. Jedoch wird sich der AR (1) - Term in diesem Modell als äquivalent zu einer ersten Differenz erweisen, da der geschätzte AR (1) - Koeffizient (der die Höhe der PACF-Spitze bei der Verzögerung 1 ist) nahezu genau gleich 1 ist Die Prognose-Gleichung für ein AR (1) - Modell für eine Reihe Y ohne Abweichungsreihenfolge lautet: Ist der AR (1) - Koeffizient 981 1 in dieser Gleichung gleich 1, so ist dies gleichbedeutend mit der Vorhersage, daß die erste Differenz Von Y konstant ist Es ist gleichbedeutend mit der Gleichung des Zufalls-Wandermodells mit Wachstum: Die PACF der UNITS-Reihe sagt uns, dass, wenn wir es nicht unterscheiden, dann sollten wir ein AR (1) - Modell passen, das sich als äquivalent zum Nehmen eignet Eine erste Differenz. Mit anderen Worten, es sagt uns, dass UNITS wirklich eine Ordnung der Differenzierung benötigt, um stationär zu sein. AR - und MA-Signaturen: Wenn die PACF einen scharfen Cutoff zeigt, während der ACF langsamer abnimmt (dh signifikante Spikes bei höheren Lags), dann sagen wir, dass die stationäre Serie eine Zehnsignatur aufweist, was bedeutet, dass das Autokorrelationsmuster leichter erklärt werden kann Durch Hinzufügen von AR-Terme als durch Hinzufügen von MA-Terme. Sie werden wahrscheinlich feststellen, dass eine AR-Signatur gewöhnlich mit einer positiven Autokorrelation bei der Verzögerung 1 verbunden ist - d. h. Es neigt dazu, in Serie, die leicht unter differenziert auftreten. Der Grund dafür ist, dass ein AR-Term in der Prognosegleichung wie eine partielle Differentialquotierung wirken kann. Beispielsweise wirkt der AR-Term in einem AR (1) - Modell wie eine erste Differenz, wenn der autoregressive Koeffizient gleich 1 ist, er tut nichts, wenn der autoregressive Koeffizient null ist, und er wirkt wie eine partielle Differenz, wenn der Koeffizient dazwischen liegt 0 und 1. Also, wenn die Reihe etwas unterdifferenziert ist - dh Wenn das nichtstationäre Muster der positiven Autokorrelation nicht vollständig eliminiert worden ist, wird es eine Teilsumme für eine Teildifferenz durch Anzeige einer AR-Signatur zustellen. Folglich haben wir die folgende Faustregel, um festzustellen, wann man AR-Begriffe hinzufügen soll: Regel 6: Wenn die PACF der differenzierten Reihe einen scharfen Cutoff aufweist unddie Lag-1-Autokorrelation positiv ist - i. e. Wenn die Serie etwas quadratisch unterschieden wird, dann erwägen Sie, dem Modell einen AR-Term hinzuzufügen. Die Verzögerung, bei der die PACF abschaltet, ist die angegebene Anzahl von AR-Terme. Grundsätzlich kann jedes Autokorrelationsmuster aus einer stationären Reihe entfernt werden, indem genügend autoregressive Terme (Verzögerungen der stationären Reihe) zu der Vorhersagegleichung hinzugefügt werden, und die PACF teilt Ihnen mit, wie viele dieser Ausdrücke wahrscheinlich benötigt werden. Dies ist jedoch nicht immer der einfachste Weg, um ein gegebenes Muster der Autokorrelation zu erklären: Manchmal ist es effizienter, MA-Bedingungen (Verzögerungen der Prognosefehler) hinzuzufügen. Die Autokorrelationsfunktion (ACF) spielt dieselbe Rolle für MA-Terme, die die PACF für AR-Terme spielt - das heißt, der ACF teilt Ihnen mit, wie viele MA-Bedingungen benötigt werden, um die verbleibende Autokorrelation aus den differenzierten Serien zu entfernen. Wenn die Autokorrelation bei Verzögerung k aber nicht bei höheren Verzögerungen signifikant ist, d. h. Wenn die ACF-Abkürzungen offquot bei Verzögerung k - dies zeigt, dass genau k MA-Terme in der Prognosegleichung verwendet werden sollten. Im letzteren Fall sagen wir, daß die Stationarisierte Reihe eine Signatur von "Signatur" aufweist, was bedeutet, daß das Autokorrelationsmuster durch Hinzufügen von MA-Terme leichter erklärt werden kann als durch Hinzufügen von AR-Terme. Eine MA-Signatur ist gewöhnlich mit einer negativen Autokorrelation bei der Verzögerung 1 verbunden - d. h. Es neigt dazu, in Serie, die etwas über differenziert sind entstehen. Der Grund hierfür ist, dass ein MA-Begriff in der Prognosegleichung partiell eine Reihenfolge der Differenzierung aufheben kann. Um dies zu sehen, sei daran erinnert, dass ein ARIMA (0,1,1) Modell ohne Konstante einem Simple Exponential Smoothing Modell entspricht. Die Prognose-Gleichung für dieses Modell ist, wenn der MA (1) - Koeffizient 952 1 der Größe 1 - 945 im SES-Modell entspricht. Wenn 952 1 gleich 1 ist, entspricht dies einem SES-Modell mit 945 0, was nur ein CONSTANT-Modell ist, da die Prognose nie aktualisiert wird. Dies bedeutet, daß, wenn 952 1 gleich 1 ist, tatsächlich die Differenzierungsoperation aufgehoben wird, die gewöhnlich die SES-Prognose ermöglicht, sich bei der letzten Beobachtung wieder zu verankern. Wenn andererseits der gleitende mittlere Koeffizient gleich 0 ist, reduziert sich dieses Modell auf ein zufälliges Wandermodell, d. h. Es lässt den differencing Betrieb allein. Also, wenn 952 1 etwas größer als 0 ist, ist es, als ob wir teilweise eine Reihenfolge der Differenzierung aufheben. Ist die Reihe schon etwas überdifferenziert - d. h. Wenn eine negative Autokorrelation eingeführt wurde -, dann wird es für eine quadratische Abweichung durch eine MA-Signatur aufgehoben. (Im Folgenden finden Sie eine weitere Faustregel: Regel 7: Zeigt der ACF der differenzierten Serie a an Scharfen Cutoff und die Lag-1-Autokorrelation negativ ist Wenn die Reihe etwas quotoverdifferencedquot erscheint - dann erwäge, einen MA-Begriff dem Modell hinzuzufügen. Die Verzögerung, bei der der ACF abschaltet, ist die angegebene Anzahl von MA-Begriffen. Ein Modell für die UNITS-Serie - ARIMA (2,1,0): Bisher haben wir festgestellt, dass die UNITS-Serie (mindestens) eine Reihenfolge der nicht-saisonalen Differenzierung benötigt, um stationär zu sein. Nach der Einnahme eines nicht sonderbaren Unterschieds - d. h. (A) die Korrelation bei Verzögerung 1 ist signifikant und positiv, und (b) zeigt die PACF ein schärferes quadratisches Quadrat an Die ACF. Insbesondere hat die PACF nur zwei signifikante Spitzen, während die ACF vier hat. Somit zeigt die differenzierte Reihe gemäß Regel 7 eine AR (2) Signatur an. Wenn wir also die Ordnung des AR-Termes auf 2 einstellen - d. h. Passen wir ein ARIMA (2,1,0) - Modell an - erhalten wir die folgenden ACF - und PACF-Diagramme für die Residuen: Die Autokorrelation bei den entscheidenden Verzögerungen - nämlich den Verzögerungen 1 und 2 - wurde eliminiert und es gibt kein wahrnehmbares Muster In höherwertigen Verzögerungen. Der Zeitreihenplot der Residuen zeigt eine leicht besorgniserregende Tendenz, vom Mittel wegzuwandern: Der Analysezusammenfassungsbericht zeigt jedoch, dass das Modell im Validierungszeitraum trotzdem sehr gut abläuft, beide AR-Koeffizienten unterscheiden sich signifikant von Null und dem Standard Wurde die Abweichung der Residuen durch die Addition der AR-Terme von 1.54371 auf 1.4215 (nahezu 10) reduziert. Darüber hinaus gibt es keine Anzeichen für eine Quotierung Rootquot, weil die Summe der AR-Koeffizienten (0,2522540.195572) nicht in der Nähe von 1 liegt. (Einheitswurzeln werden unten ausführlicher diskutiert.) Insgesamt scheint dies ein gutes Modell zu sein . Die (untransformierten) Prognosen für das Modell zeigen einen linearen Aufwärtstrend, der in die Zukunft projiziert wird: Der Trend bei den langfristigen Prognosen ist darauf zurückzuführen, dass das Modell eine nicht sonderbare Differenz und einen konstanten Term enthält: Dieses Modell ist im Grunde ein Zufallswanderung Wachstum durch die Addition von zwei autoregressive Begriffe - d. H Zwei Verzögerungen der differenzierten Reihe. Die Steigung der Langzeitprognosen (d. h. der durchschnittliche Anstieg von einer Periode zu einer anderen) ist gleich dem mittleren Term in der Modellzusammenfassung (0,467566). Die Vorhersagegleichung lautet: wobei 956 der konstante Term in der Modellzusammenfassung (0,258178), 981 1 der AR (1) - Koeffizient (0,25224) und 981 2 der AR (2) - Koeffizient (0,1995572) ist. Mittelwert gegen Konstante: Im allgemeinen bezieht sich der Quotientterm in der Ausgabe eines ARIMA-Modells auf den Mittelwert der differenzierten Reihe (dh der mittlere Trend, wenn die Reihenfolge der Differenzierung gleich 1 ist), während der Konstantantquot der konstante Ausdruck ist Auf der rechten Seite der Prognose-Gleichung. Die mittleren und konstanten Terme sind durch die Gleichung: CONSTANT MEAN (1 minus der Summe der AR-Koeffizienten) verknüpft. In diesem Fall haben wir 0.258178 0.467566 (1 - 0.25224 - 0.195572) Alternatives Modell für die UNITS - Serie - ARIMA (0,2,1): Denken Sie daran, dass wir bei der Analyse der UNITS - Serie nicht ganz sicher waren Richtige Reihenfolge der Differenzierung zu verwenden. Eine Reihenfolge der Nichtsaisondifferenzierung ergab die niedrigste Standardabweichung (und ein Muster der leichten positiven Autokorrelation), während zwei Ordnungen von nicht seasonaler Differenzierung ein eher stationäreres Zeitreihenplot (aber mit ziemlich starker negativer Autokorrelation) ergaben. Hier sind sowohl die ACF und PACF der Serie mit zwei nicht sonderbaren Differenzen: Der einzelne negative Spike bei Lag 1 in der ACF ist eine MA (1) Signatur, gemäß Regel 8 oben. Wenn wir also zwei nicht-seasonale Differenzen verwenden würden, müßten wir auch einen MA (1) - Term enthalten, was ein ARIMA (0,2,1) - Modell ergibt. Gemäß Regel 5 würden wir auch den konstanten Begriff unterdrücken wollen. Hier sind die Ergebnisse der Anpassung eines ARIMA (0,2,1) - Modells ohne Konstante: Beachten Sie, dass die geschätzte Weißabstand-Standardabweichung (RMSE) für dieses Modell nur sehr geringfügig höher ist als die vorherige (1.46301 hier gegenüber 1.45215 vorher). Die Prognose-Gleichung für dieses Modell ist: wobei theta-1 der MA (1) - Koeffizient ist. Es sei daran erinnert, dass dies einem linearen exponentiellen Glättungsmodell ähnlich ist, wobei der MA (1) - Koeffizient der Größe 2 (1-alpha) im LES-Modell entspricht. Der MA (1) - Koeffizient von 0,76 in diesem Modell legt nahe, dass ein LES-Modell mit alpha in der Nähe von 0,72 gleich gut passen würde. Wenn ein LES-Modell an dieselben Daten angepasst wird, erweist sich der optimale Wert von & agr; als ungefähr 0,61, was nicht zu weit weg ist. Hier ist ein Modellvergleichsbericht, der die Ergebnisse der Anpassung des ARIMA (2,1,0) Modells mit Konstante, das ARIMA (0,2,1) Modell ohne Konstante und das LES Modell zeigt: Die drei Modelle sind nahezu identisch Der Schätzzeitraum und das ARIMA-Modell (2,1,0) mit Konstanten etwas besser als die beiden anderen in der Validierungsperiode. Auf der Grundlage dieser statistischen Ergebnisse allein wäre es schwer, zwischen den drei Modellen zu wählen. Wenn wir jedoch die langfristigen Prognosen des ARIMA-Modells (0,2,1) ohne Konstante (die im Wesentlichen dieselben wie die des LES-Modells sind) darstellen, sehen wir einen signifikanten Unterschied zu denen des früheren Modells: Die Prognosen haben einen etwas geringeren Aufwärtstrend als jene des früheren Modells - weil der lokale Trend nahe dem Ende der Serie etwas geringer ist als der durchschnittliche Trend über die gesamte Serie -, aber die Konfidenzintervalle weiten sich viel schneller. Das Modell mit zwei Ordnungen der Differenzierung geht davon aus, dass der Trend in der Serie zeitlich variabel ist, daher hält er die ferne Zukunft viel unsicherer als das Modell mit nur einer Ordnung der Differenzierung. Welches Modell wir wählen sollten Das hängt von den Annahmen ab, die wir in Bezug auf die Konstanz des Trendes in den Daten komfortabel machen. Das Modell mit nur einer Ordnung der Differenzierung nimmt einen konstanten durchschnittlichen Trend - es handelt sich im Wesentlichen um ein fein abgestimmtes Zufallsmodell mit Wachstum - und macht daher relativ konservative Trendprojektionen. Es ist auch ziemlich optimistisch über die Genauigkeit, mit der es mehr als eine Periode vorhersagen kann. Das Modell mit zwei Differenzierungsaufträgen nimmt einen zeitlich variierenden lokalen Trend an - es handelt sich im Wesentlichen um ein lineares exponentielles Glättungsmodell - und seine Trendprojektionen sind etwas unbeständiger. Als eine allgemeine Regel in dieser Art von Situation, würde ich empfehlen, die Wahl des Modells mit der niedrigeren Reihenfolge der Differenzierung, andere Dinge sind etwa gleich. In der Praxis scheinen random-walk oder einfach-exponentielle Glättungsmodelle oft besser zu funktionieren als lineare exponentielle Glättungsmodelle. Mixed-Modelle: In den meisten Fällen stellt das beste Modell ein Modell dar, das entweder nur AR-Begriffe oder nur MA-Begriffe verwendet, obwohl in einigen Fällen ein quotiertes Mixedquot-Modell sowohl mit AR - als auch mit MA-Bedingungen die beste Anpassung an die Daten liefern kann. Bei der Montage von gemischten Modellen ist jedoch Vorsicht geboten. Es ist möglich, dass ein AR-Begriff und ein MA-Begriff alle anderen Effekte abbrechen. Obwohl beide in dem Modell signifikant erscheinen können (wie durch die t-Statistik ihrer Koeffizienten beurteilt). Man nehme zum Beispiel an, dass das Modell für eine Zeitreihe ein ARIMA (0,1,1) - Modell ist, sondern ein ARIMA (1,1,2) - Modell - d. h. Sie enthalten einen zusätzlichen AR-Begriff und einen zusätzlichen MA-Begriff. Dann können die zusätzlichen Begriffe am Ende erscheinen erheblich in das Modell, aber im Inneren können sie nur gegeneinander arbeiten. Die resultierenden Parameterschätzungen können zweideutig sein, und der Parameterschätzprozeß kann sehr viele (z. B. mehr als 10) Iterationen zum Konvergieren annehmen. Folglich: Regel 8: Es ist möglich, dass ein AR-Begriff und ein MA-Begriff alle anderen Effekte abbrechen, so dass, wenn ein gemischtes AR-MA-Modell den Daten zu entsprechen scheint, auch ein Modell mit einem weniger AR-Term und einem weniger MA-Begriff versuchen - besonders wenn die Parameterschätzungen im Originalmodell mehr als 10 Iterationen konvergieren müssen. Aus diesem Grund können die ARIMA-Modelle nicht durch einen schrittweisen Ansatz, der sowohl AR - als auch MA-Begriffe umfasst, identifiziert werden. Mit anderen Worten, Sie können nicht beginnen, indem Sie mehrere Begriffe jeder Art und dann werfen die diejenigen, deren geschätzten Koeffizienten sind nicht signifikant. Stattdessen folgen Sie normalerweise einem anfänglichen stepwisequot-Ansatz, indem Sie Begriffe der einen oder anderen Art hinzufügen, wie durch das Auftreten der ACF - und PACF-Diagramme angezeigt wird. Einheitswurzeln: Wenn eine Serie grob unter - oder überdifferenziert ist, d. h. Wenn eine ganze Reihenfolge der Differenzierung hinzugefügt oder annulliert werden muss, wird dies oft durch einen Quototrootquot in den geschätzten AR - oder MA-Koeffizienten des Modells signalisiert. Ein AR (1) - Modell soll eine Einheitswurzel haben, wenn der geschätzte AR (1) - Koeffizient nahezu exakt gleich 1 ist. (Durch quotexaktuelles Gleichheitszeichen I bedeutet wirklich nicht signifikant anders als in den Koeffizienten eigenen Standardfehler. ) Wenn dies geschieht, bedeutet dies, dass der AR (1) Term genau imitiert eine erste Differenz, in diesem Fall sollten Sie den AR (1) Begriff entfernen und fügen Sie eine Reihenfolge der differencing statt. (Dies ist genau das, was passieren würde, wenn Sie ein AR (1) - Modell an die undifferenzierte UNITS-Serie montiert haben, wie bereits erwähnt.) In einem AR-Modell höherer Ordnung existiert ein Einheitswurzel im AR-Teil des Modells, wenn die Summe von Sind die AR-Koeffizienten genau gleich 1. In diesem Fall sollten Sie die Reihenfolge des AR-Terms um 1 reduzieren und eine Reihenfolge der Differenzierung hinzufügen. Eine Zeitreihe mit einer Einheitswurzel in den AR-Koeffizienten ist nichtstationär - i. e. Es braucht eine höhere Reihenfolge der Differenzierung. Regel 9: Wenn es eine Einheit Wurzel in der AR-Teil des Modells - d. H. Wenn die Summe der AR-Koeffizienten fast genau 1 ist, sollten Sie die Anzahl der AR-Terme um eins reduzieren und die Reihenfolge der Differenzierung um eins erhöhen. In ähnlicher Weise bedeutet ein MA (1) - Modell eine Einheitswurzel, wenn der geschätzte MA (1) - Koeffizient genau gleich 1 ist. Wenn dies geschieht, bedeutet dies, daß der MA (1) - Term eine erste Differenz exakt annulliert In diesem Fall sollten Sie den Begriff MA (1) entfernen und auch die Reihenfolge der Differenzierung um eins reduzieren. In einem MA-Modell höherer Ordnung existiert eine Einheitswurzel, wenn die Summe der MA-Koeffizienten exakt gleich 1 ist. Regel 10: Wenn im MA-Teil des Modells ein Einheitswurzel vorhanden ist, d. h. Wenn die Summe der MA-Koeffizienten fast genau 1 ist - sollten Sie die Anzahl der MA-Terme um eins reduzieren und die Reihenfolge der Differenzierung um eins reduzieren. Wenn Sie beispielsweise ein lineares exponentielles Glättungsmodell (ein ARIMA (0,2,2) - Modell) platzieren, wenn ein einfaches exponentielles Glättungsmodell (ein ARIMA (0,1,1) - Modell) ausreichend wäre, können Sie das finden Ist die Summe der beiden MA-Koeffizienten sehr nahezu gleich 1. Durch Verringerung der MA-Ordnung und der Reihenfolge der Differenzierung um eins erhält man das geeignetere SES-Modell. Ein Prognosemodell mit einer Einheitswurzel in den geschätzten MA-Koeffizienten wird als nicht-invertierbar bezeichnet. Was bedeutet, dass die Residuen des Modells nicht als Schätzwerte des quottruequot zufälligen Rauschens betrachtet werden können, das die Zeitreihen erzeugt hat. Ein weiteres Symptom einer Einheit Wurzel ist, dass die Prognosen des Modells kann aufblinken upquot oder anders verhalten bizarr. Wenn das Zeitreihenplot der längerfristigen Prognosen des Modells seltsam aussieht, sollten Sie die geschätzten Koeffizienten Ihres Modells auf das Vorhandensein eines Einheitswurzels überprüfen. Regel 11: Wenn die Langzeitprognosen unregelmäßig oder unbeständig erscheinen, kann es einen Einheitswurzel in den AR - oder MA-Koeffizienten geben. Keines dieser Probleme entstand bei den beiden Modellen, die hier angebracht wurden, weil wir sorgfältig mit plausiblen Ordnungen von Differenzierung und entsprechender Anzahl von AR - und MA-Koeffizienten beginnen, indem wir die ACF - und PACF-Modelle studierten. Detailliertere Diskussionen über Einheitswurzeln und Annullierungseffekte zwischen AR - und MA-Bedingungen finden Sie in der mathematischen Struktur von ARIMA-Modellen handout. ARMA, ARMA Acf-Pacf-Visualisierungen Wie in der vorigen Ausgabe erwähnt. Ich habe mit Autoregressive und Moving Average Simulationen gearbeitet. Um die Korrektheit von Schätzungen durch unsere Simulationen zu testen, verwenden wir für unsere Anwendung acf (Autokorrelation) und pacf (partielle Autokorrelation). Für verschiedene Reihenfolge von AR und MA, erhalten wir die unterschiedlichen Visualisierungen mit ihnen, wie: Exponentielle abnehmende Kurven. Dämpfte Sinuswellen. Positive und negative Spikes, etc. Während der Analyse und Schreiben von Tests für die gleiche, habe ich auch einige Zeit, um zu visualisieren, dass die Daten auf ilne und Balkendiagramme, um ein klareres Bild: AR (1) Prozess AR (1) Prozess ist die autoregressive Simulation mit Ordnung p 1, dh mit einem Wert von phi. Ideal AR (p) Prozess wird dargestellt durch: Um dies zu simulieren, installieren Sie statsample-timeseries von hier aus. Für AR (p) muss acf eine Dämpfungs-Sinuswelle geben. Das Muster ist stark vom Wert und Vorzeichen der phi-Parameter abhängig. Wenn der positive Gehalt in den Phi-Koeffizienten größer ist, erhalten Sie von der positiven Seite eine Sinuswelle, sonst beginnt die Sinuswelle von der negativen Seite. Beachten Sie, die Dämpfung Sinuswelle von positiven Seite hier: und negative Seite hier. Pacf gibt spike at lag 0 (Wert 1,0, default) und von lag 1 bis lag k. Das oben genannte Beispiel weist AR (2) - Prozess auf, dafür müssen wir Spikes bei lag 1 - 2 wie: MA (1) - Verfahren MA (1) - Prozess die gleitende Durchschnittssimulation mit Auftrag q 1, dh mit einem Wert, erhalten Von Theta. ARMA (p, q) Prozess ARMA (p, q) ist eine Kombination aus autoregressiven und gleitenden mittleren Simulationen. Wenn q 0 ist, wird der Prozess als reiner autoregressiver Prozess bezeichnet, wenn p 0. der Prozeß rein gleitender Durchschnitt ist. Der Simulator von ARMA kann als armasim in Statsample :: ARIMA :: ARIMA gefunden werden. Für ARMA (1, 1) Prozess, hier sind die Vergleiche der Visualisierungen aus R und diesem Code, die gerade meinen Tag gemacht :) Cheers, - Ankur Goel Geschrieben von Ankur Goel Jul 20th. 2013 Aktuelle Beiträge GitHub Repos2.1 Verschieben von Durchschnittsmodellen (MA-Modelle) Zeitreihenmodelle, die als ARIMA-Modelle bekannt sind, können autoregressive Begriffe und gleitende Durchschnittsterme enthalten. In Woche 1 erlernten wir einen autoregressiven Term in einem Zeitreihenmodell für die Variable x t ist ein verzögerter Wert von x t. Beispielsweise ist ein autoregressiver Term der Verzögerung 1 x t-1 (multipliziert mit einem Koeffizienten). Diese Lektion definiert gleitende Durchschnittsterme. Ein gleitender Durchschnittsterm in einem Zeitreihenmodell ist ein vergangener Fehler (multipliziert mit einem Koeffizienten). Es sei n (0, sigma2w) überschritten, was bedeutet, daß die wt identisch unabhängig voneinander verteilt sind, jeweils mit einer Normalverteilung mit dem Mittelwert 0 und der gleichen Varianz. Das durch MA (1) bezeichnete gleitende Durchschnittsmodell der 1. Ordnung ist (xt mu wt theta1w) Das durch MA (2) bezeichnete gleitende Durchschnittsmodell der zweiten Ordnung ist (xt mu wt theta1w theta2w) Das gleitende Mittelmodell der q-ten Ordnung , Mit MA (q) bezeichnet, ist (xt mu wt theta1w theta2w dots thetaqw) Hinweis. Viele Lehrbücher und Softwareprogramme definieren das Modell mit negativen Vorzeichen vor den Begriffen. Dies ändert nicht die allgemeinen theoretischen Eigenschaften des Modells, obwohl es die algebraischen Zeichen der geschätzten Koeffizientenwerte und (nicht quadrierten) Ausdrücke in Formeln für ACFs und Abweichungen umwandelt. Sie müssen Ihre Software überprüfen, um zu überprüfen, ob negative oder positive Vorzeichen verwendet worden sind, um das geschätzte Modell korrekt zu schreiben. R verwendet positive Vorzeichen in seinem zugrunde liegenden Modell, wie wir hier tun. Theoretische Eigenschaften einer Zeitreihe mit einem MA (1) Modell Beachten Sie, dass der einzige Wert ungleich Null im theoretischen ACF für Verzögerung 1 ist. Alle anderen Autokorrelationen sind 0. Somit ist ein Proben-ACF mit einer signifikanten Autokorrelation nur bei Verzögerung 1 ein Indikator für ein mögliches MA (1) - Modell. Für interessierte Studierende, Beweise dieser Eigenschaften sind ein Anhang zu diesem Handout. Beispiel 1 Angenommen, dass ein MA (1) - Modell x t 10 w t .7 w t-1 ist. Wobei (wt überstehendes N (0,1)). Somit ist der Koeffizient 1 0,7. Die theoretische ACF wird durch eine Plot dieser ACF folgt folgt. Die graphische Darstellung ist die theoretische ACF für eine MA (1) mit 1 0,7. In der Praxis liefert eine Probe gewöhnlich ein solches klares Muster. Unter Verwendung von R simulierten wir n 100 Abtastwerte unter Verwendung des Modells x t 10 w t .7 w t-1, wobei w t iid N (0,1) war. Für diese Simulation folgt ein Zeitreihen-Diagramm der Probendaten. Wir können nicht viel von dieser Handlung erzählen. Die Proben-ACF für die simulierten Daten folgt. Wir sehen eine Spitze bei Verzögerung 1, gefolgt von im Allgemeinen nicht signifikanten Werten für Verzögerungen nach 1. Es ist zu beachten, dass das Beispiel-ACF nicht mit dem theoretischen Muster des zugrunde liegenden MA (1) übereinstimmt, was bedeutet, dass alle Autokorrelationen für Verzögerungen nach 1 0 sein werden Eine andere Probe hätte eine geringfügig unterschiedliche Probe ACF wie unten gezeigt, hätte aber wahrscheinlich die gleichen breiten Merkmale. Theroretische Eigenschaften einer Zeitreihe mit einem MA (2) - Modell Für das MA (2) - Modell sind die theoretischen Eigenschaften die folgenden: Die einzigen Werte ungleich Null im theoretischen ACF sind für die Lags 1 und 2. Autokorrelationen für höhere Lags sind 0 , So zeigt ein Beispiel-ACF mit signifikanten Autokorrelationen bei Lags 1 und 2, aber nicht signifikante Autokorrelationen für höhere Lags ein mögliches MA (2) - Modell. Iid N (0,1). Die Koeffizienten betragen 1 0,5 und 2 0,3. Da es sich hierbei um ein MA (2) handelt, wird der theoretische ACF nur bei den Verzögerungen 1 und 2 Werte ungleich Null aufweisen. Werte der beiden Nicht-Autokorrelationen sind A-Kurve des theoretischen ACF. Wie fast immer der Fall ist, verhalten sich Musterdaten nicht ganz so perfekt wie die Theorie. Wir simulierten n 150 Beispielwerte für das Modell x t 10 w t .5 w t-1 .3 w t-2. Wobei wt iid N (0,1) ist. Die Zeitreihenfolge der Daten folgt. Wie bei dem Zeitreihenplot für die MA (1) Beispieldaten können Sie nicht viel davon erzählen. Die Proben-ACF für die simulierten Daten folgt. Das Muster ist typisch für Situationen, in denen ein MA (2) - Modell nützlich sein kann. Es gibt zwei statistisch signifikante Spikes bei Lags 1 und 2, gefolgt von nicht signifikanten Werten für andere Lags. Beachten Sie, dass aufgrund des Stichprobenfehlers das Muster ACF nicht genau dem theoretischen Muster entsprach. ACF für allgemeine MA (q) - Modelle Eine Eigenschaft von MA (q) - Modellen besteht im Allgemeinen darin, dass Autokorrelationen ungleich Null für die ersten q-Verzögerungen und Autokorrelationen 0 für alle Verzögerungen gt q existieren. Nicht-Eindeutigkeit der Verbindung zwischen Werten von 1 und (rho1) in MA (1) Modell. Im MA (1) - Modell für einen Wert von 1. Die reziproke 1 1 gibt den gleichen Wert für Als Beispiel, verwenden Sie 0.5 für 1. Und dann 1 (0,5) 2 für 1 verwenden. Youll erhalten (rho1) 0,4 in beiden Fällen. Um eine theoretische Einschränkung als Invertibilität zu befriedigen. Wir beschränken MA (1) - Modelle auf Werte mit einem Absolutwert von weniger als 1. In dem gerade angegebenen Beispiel ist 1 0,5 ein zulässiger Parameterwert, während 1 10,5 2 nicht. Invertibilität von MA-Modellen Ein MA-Modell soll invertierbar sein, wenn es algebraisch äquivalent zu einem konvergierenden unendlichen Ordnungs-AR-Modell ist. Durch Konvergenz meinen wir, dass die AR-Koeffizienten auf 0 sinken, wenn wir in der Zeit zurückgehen. Invertibilität ist eine Einschränkung, die in Zeitreihensoftware programmiert ist, die verwendet wird, um die Koeffizienten von Modellen mit MA-Begriffen abzuschätzen. Sein nicht etwas, das wir in der Datenanalyse überprüfen. Zusätzliche Informationen über die Invertibilitätsbeschränkung für MA (1) - Modelle finden Sie im Anhang. Fortgeschrittene Theorie Anmerkung. Für ein MA (q) - Modell mit einem angegebenen ACF gibt es nur ein invertierbares Modell. Die notwendige Bedingung für die Invertierbarkeit ist, daß die Koeffizienten solche Werte haben, daß die Gleichung 1- 1 y-. - q y q 0 hat Lösungen für y, die außerhalb des Einheitskreises liegen. R-Code für die Beispiele In Beispiel 1 wurde der theoretische ACF des Modells x t 10 w t aufgetragen. 7w t-1. Und dann n 150 Werte aus diesem Modell simuliert und die Abtastzeitreihen und die Abtast-ACF für die simulierten Daten aufgetragen. Die R-Befehle, die verwendet wurden, um den theoretischen ACF aufzuzeichnen, waren: acfma1ARMAacf (mac (0,7), lag. max10) 10 Verzögerungen von ACF für MA (1) mit theta1 0,7 lags0: 10 erzeugt eine Variable namens lags, die im Bereich von 0 bis 10 liegt (H0) fügt dem Diagramm eine horizontale Achse hinzu Der erste Befehl bestimmt den ACF und speichert ihn in einem Objekt Genannt acfma1 (unsere Wahl des Namens). Der Plotbefehl (der dritte Befehl) verläuft gegen die ACF-Werte für die Verzögerungen 1 bis 10. Der ylab-Parameter bezeichnet die y-Achse und der Hauptparameter einen Titel auf dem Plot. Um die Zahlenwerte der ACF zu sehen, benutzen Sie einfach den Befehl acfma1. Die Simulation und Diagramme wurden mit den folgenden Befehlen durchgeführt. (N150, list (mac (0.7))) Simuliert n 150 Werte aus MA (1) xxc10 addiert 10 zum Mittelwert 10. Simulationsvorgaben bedeuten 0. plot (x, typeb, mainSimulated MA (1) data) Acf (x, xlimc (1,10), mainACF für simulierte Probendaten) In Beispiel 2 wurde der theoretische ACF des Modells xt 10 wt. 5 w t-1 .3 w t-2 aufgetragen. Und dann n 150 Werte aus diesem Modell simuliert und die Abtastzeitreihen und die Abtast-ACF für die simulierten Daten aufgetragen. Die verwendeten R-Befehle waren acfma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 Plot (lags, acfma2, xlimc (1,10), ylabr, typh, main ACF für MA (2) mit theta1 0,5, (X, x) (x, x) (x, x, x, y) (1) Für interessierte Studierende sind hier Beweise für die theoretischen Eigenschaften des MA (1) - Modells. Abweichung: (Text (xt) Text (mu wt theta1 w) 0 Text (wt) Text (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Wenn h 1 der vorhergehende Ausdruck1 w 2. Für irgendeinen h 2 ist der vorhergehende Ausdruck 0. Der Grund dafür ist, dass durch Definition der Unabhängigkeit der wt. E (w k w j) 0 für beliebige k j. Da w w die Mittelwerte 0, E (w j w j) E (w j 2) w 2 haben. Für eine Zeitreihe, Wenden Sie dieses Ergebnis an, um den oben angegebenen ACF zu erhalten. Ein invertierbares MA-Modell ist eines, das als unendliches Ordnungs-AR-Modell geschrieben werden kann, das konvergiert, so daß die AR-Koeffizienten gegen 0 konvergieren, wenn wir unendlich zurück in der Zeit bewegen. Gut zeigen Invertibilität für die MA (1) - Modell. Dann setzen wir die Beziehung (2) für wt-1 in Gleichung (1) (3) ein (zt wt theta1 (z-therma1w) wt theta1z - theta2w) Zum Zeitpunkt t-2. Gleichung (2) wird dann in Gleichung (3) die Gleichung (4) für wt-2 ersetzen (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z - theta12z theta31w) Unendlich), erhalten wir das unendliche Ordnungsmodell (zt wt theta1 z - theta21z theta31z - theta41z Punkte) Beachten Sie jedoch, dass bei 1 1 die Koeffizienten, die die Verzögerungen von z vervielfachen (unendlich) in der Größe zunehmen, Zeit. Um dies zu verhindern, benötigen wir 1 lt1. Dies ist die Bedingung für ein invertierbares MA (1) - Modell. Unendlich Ordnung MA Modell In Woche 3, gut sehen, dass ein AR (1) Modell in ein unendliches order MA Modell umgewandelt werden kann: (xt - mu wt phi1w phi21w Punkte phik1 w Punkte Summe phij1w) Diese Summation von vergangenen weißen Rauschbegriffen ist bekannt Als die kausale Darstellung eines AR (1). Mit anderen Worten, x t ist eine spezielle Art von MA mit einer unendlichen Anzahl von Begriffen, die in der Zeit zurückgehen. Dies wird als unendliche Ordnung MA oder MA () bezeichnet. Eine endliche Ordnung MA ist eine unendliche Ordnung AR und jede endliche Ordnung AR ist eine unendliche Ordnung MA. Rückruf in Woche 1, stellten wir fest, dass eine Anforderung für eine stationäre AR (1) ist, dass 1 lt1. Berechnen Sie die Var (x t) mit der kausalen Darstellung. Dieser letzte Schritt verwendet eine Grundtatsache über geometrische Reihen, die (phi1lt1) erforderlich sind, ansonsten divergiert die Reihe. Navigation

No comments:

Post a Comment