Autoregressiv Integrert Bevegelse Gjennomsnittet Modeller


Autoregressive Integrert Moving Gjennomsnitt - ARIMA DEFINITION av Autoregressive Integrert Moving Average - ARIMA En statistisk analysemodell som bruker tidsseriedata for å forutsi fremtidige trender. Det er en form for regresjonsanalyse som søker å forutsi fremtidige bevegelser langs den tilsynelatende tilfeldige spasertur tatt av aksjer og finansmarkedet ved å undersøke forskjellene mellom verdier i serien i stedet for å bruke de faktiske dataverdiene. Lags av differenced serien er referert til som autoregressive og lags innenfor prognosen data refereres til som glidende gjennomsnitt. BREAKER NED Autoregressive Integrert Flytende Gjennomsnitt - ARIMA Denne modelltypen kalles generelt ARIMA (p, d, q), med heltallene som refererer til autoregressive. integrert og bevegelige gjennomsnittlige deler av datasettet, henholdsvis. ARIMA modellering kan ta hensyn til trender, sesongmessighet. sykluser, feil og ikke-stasjonære aspekter ved et datasett når du lager prognoser. Autoregressiv Integrert Moving Gjennomsnitt ARIMA (p, d, q) Modeller for Time Series Analysis I det forrige settet av artikler (Deler 1. 2 og 3) gikk vi inn betydelig detaljering av AR (p), MA (q) og ARMA (p, q) lineære tidsseriemodeller. Vi brukte disse modellene til å generere simulerte datasett, tilpassede modeller for å gjenopprette parametere og deretter anvende disse modellene på finansielle aksjer data. I denne artikkelen skal vi diskutere en utvidelse av ARMA-modellen, nemlig den autoregressive Integrated Moving Average-modellen, eller ARIMA (p, d, q) - modellen. Vi vil se at det er nødvendig å vurdere ARIMA-modellen når vi har ikke-stationære serier. Slike serier forekommer i nærvær av stokastiske trender. Rask oppskrift og neste trinn Til dags dato har vi vurdert følgende modeller (linkene tar deg til de aktuelle artiklene): Vi har stadig bygget opp vår forståelse av tidsserier med begreper som seriell korrelasjon, stasjonaritet, linearitet, residualer, korrelogrammer, simulering, montering, sesongmessighet, betinget heteroscedasticitet og hypotesetesting. Fra og med har vi ikke utført noen prognoser eller prognoser fra våre modeller og har derfor ikke hatt noen mekanisme for å produsere et handelssystem eller egenkapitalkurve. Når vi har studert ARIMA (i denne artikkelen), ARCH og GARCH (i de neste artiklene), vil vi være i stand til å bygge en grunnleggende langsiktig handelsstrategi basert på prognose for børsindeksavkastning. Til tross for det faktum at jeg har gått i detalj på modeller som vi vet, vil det i siste instans ikke ha stor ytelse (AR, MA, ARMA), er vi nå godt bevandret i prosessen med tidsseriemodellering. Dette betyr at når vi kommer til å studere nyere modeller (og selv de som nå er i forskningslitteraturen), vil vi ha en betydelig kunnskapsbase om å tegne, for å kunne evaluere disse modellene effektivt, i stedet for å behandle dem som en nøkkel resept eller svart boks. Enda viktigere vil det gi oss tillit til å utvide og endre dem på egen hånd og forstå hva vi gjør når vi gjør det. Id takk for at du har vært tålmodig så langt som det kan virke som at disse artiklene er langt borte fra den virkelige handlingen av faktisk handel. Imidlertid er sann kvantitativ handelsforskning forsiktig, målt og tar betydelig tid å komme seg til rette. Det er ingen hurtig løsning eller få rik ordning i kvant handel. Var veldig nær klar til å vurdere vår første handelsmodell, som vil være en blanding av ARIMA og GARCH, så det er viktig at vi bruker litt tid på å forstå ARIMA-modellen godt. Når vi har bygget vår første handelsmodell, skal vi vurdere mer avanserte modeller som langminneprosesser, state-space-modeller (dvs. Kalman Filter) og Vector Autoregressive (VAR) - modeller, som vil lede oss til andre, mer sofistikerte, handelsstrategier. Autoregressive Integrated Moving Average (ARIMA) Modeller av rekkefølge p, d, q ARIMA-modeller brukes fordi de kan redusere en ikke-stationær serie til en stasjonær serie ved hjelp av en sekvens av differenseringstrinn. Vi kan huske fra artikkelen om hvit støy og tilfeldige turer. Hvis vi bruker forskjelloperatøren til en tilfeldig walk-serie (en ikke-stationær serie), står vi igjen med hvit støy (en stasjonær serie): begynn nabla xt xt - x wt slutten ARIMA utfører i hovedsak denne funksjonen, men gjør det gjentatte ganger, d ganger, for å redusere en ikke-stationær serie til en stasjonær en. For å håndtere andre former for ikke-stasjonærhet utover stokastiske trender, kan flere modeller benyttes. Sesongmessige effekter (som de som oppstår i råvarepriser) kan løses med sesongbaserte ARIMA-modellen (SARIMA), men vi vil ikke diskutere SARIMA mye i denne serien. Betingede heteroscedastiske effekter (som med volatilitetsklynging i aksjeindekser) kan håndteres med ARCHGARCH. I denne artikkelen vurderer vi ikke-stationære serier med stokastiske trender og passer ARIMA-modeller til disse serien. Vi vil også endelig produsere prognoser for vår finansielle serie. Definisjoner Før vi definerer ARIMA-prosesser, må vi diskutere konseptet med en integrert serie: Integrerte rekkefølgen d En tidsserie er integrert i ordre d. I (d), hvis: begynn nablad xt wt end Det er, hvis vi skiller seriens d ganger, mottar vi en diskret hvit støyserie. Alternativt, ved å bruke Backward Shift Operator er en liknende betingelse: Nå som vi har definert en integrert serie, kan vi definere ARIMA-prosessen selv: Autoregressiv Integrert Moving Average Modell av rekkefølge p, d, q En tidsserie er en autoregressiv integrert glidende gjennomsnittlig modell av rekkefølgen p, d, q. ARIMA (p, d, q). hvis nablad xt er et autoregressivt glidende gjennomsnitt av orden p, q, ARMA (p, q). Det vil si at hvis serien er differenced d ganger, og det følger en ARMA (p, q) prosess, så er det en ARIMA (p, d, q) serie. Hvis vi bruker den polynomiske notasjonen fra del 1 og del 2 i ARMA-serien, kan en ARIMA (p, d, q) prosess skrives i forhold til bakoverskiftoperatøren. : Hvor wt er en diskret hvit støyserie. Det er noen poeng å merke seg om disse definisjonene. Siden tilfeldig gange er gitt med xt x wt kan det ses at jeg (1) er en annen representasjon, siden nabla1 xt wt. Hvis vi mistenker en ikke-lineær trend, kan vi muligens bruke gjentatte differensier (dvs. gt 1) for å redusere en serie til stasjonær hvit støy. I R kan vi bruke diff-kommandoen med flere parametre, f. eks. diff (x, d3) for å utføre gjentatte forskjeller. Simulering, korrelogram og modellmontering Siden vi allerede har benyttet arima. sim-kommandoen for å simulere en ARMA (p, q) prosess, vil følgende prosedyre være lik den som ble utført i del 3 av ARMA-serien. Den største forskjellen er at vi nå skal sette d1, det vil si, vi vil produsere en ikke-stationær tidsserie med en stokastisk trending komponent. Som før vil vi passe en ARIMA-modell til våre simulerte data, forsøke å gjenopprette parametrene, opprette konfidensintervaller for disse parametrene, produsere et korrelogram av rester av den monterte modellen og til slutt utføre en Ljung-Box-test for å fastslå om vi har en god passform. Vi skal simulere en ARIMA (1,1,1) modell, med den autoregressive koeffisienten alpha0.6 og den bevegelige gjennomsnittlige koeffisienten beta-0.5. Her er R-koden for å simulere og plotte en slik serie: Nå som vi har vår simulerte serie, skal vi prøve å passe en ARIMA (1,1,1) modell til den. Siden vi kjenner ordren, vil vi bare angi den i passformen: Forventningsintervallene beregnes som: Begge parameterestimatene faller innenfor konfidensintervallene og ligger nær de sanne parameterverdiene for den simulerte ARIMA-serien. Derfor bør vi ikke bli overrasket over at residuene ser ut som en realisering av diskret hvit støy. Til slutt kan vi kjøre en Ljung-Box-test for å gi statistisk bevis på en god form: Vi kan se at p-verdien er betydelig større enn 0,05 og som sådan kan vi si at det er sterke bevis for at diskret hvit støy er en god passform til resterne. Derfor er modellen ARIMA (1,1,1) en god passform, som forventet. Finansdata og prognoser I denne delen skal vi passe ARIMA-modeller til Amazon, Inc. (AMZN) og SampP500 US Equity Index (GPSC, i Yahoo Finance). Vi vil ta i bruk prognosebiblioteket, skrevet av Rob J Hyndman. Lar oss gå videre og installere biblioteket i R: Nå kan vi bruke quantmod til å laste ned Amazonas daglige prisserie fra begynnelsen av 2013. Siden vi allerede har tatt de første rekkefølgeforskjellene i serien, har ARIMA passet utført snart vilje ikke krever d gt 0 for den integrerte komponenten: Som i del 3 av ARMA-serien, går vi nå gjennom en kombinasjon av p, d og q for å finne den optimale modellen ARIMA (p, d, q). Med optimal mener vi ordrekombinasjonen som minimerer Akaike Information Criterion (AIC): Vi ser at en rekkefølge av p4, d0, q4 ble valgt. Spesielt d0, da vi allerede har tatt førstegangsforskjeller over: Hvis vi plotter korrelogrammet av residualene, kan vi se om vi har bevis for en diskret hvit støyserie: Det er to betydelige topper, nemlig på k15 og k21, selv om vi burde Forvente å se statistisk signifikante topper bare på grunn av prøvetrykkvariasjon 5 av tiden. Kan utføre en Ljung-Box-test (se forrige artikkel) og se om vi har bevis for god passform: Som vi ser, er p-verdien større enn 0,05 og så har vi bevis for en god passform på 95-nivået. Vi kan nå bruke prognose-kommandoen fra prognosebiblioteket for å forutsi 25 dager fremover for returserien til Amazon: Vi kan se poengprognosene for de neste 25 dagene med 95 (mørkeblå) og 99 (lyseblå) feilbånd . Vi vil bruke disse prognosene i vår første gangs handelsstrategi når vi kommer til å kombinere ARIMA og GARCH. Lar utføre samme prosedyre for SampP500. For det første henter vi dataene fra quantmod og konverterer den til en daglig logg returneringsstrøm: Vi passer på en ARIMA-modell ved å løse over verdiene p, d og q: AIC forteller oss at den beste modellen er ARIMA (2,0, 1) modell. Merk igjen at d0, da vi allerede har tatt første rekkefølgeforskjeller i serien: Vi kan plotte resterne av den monterte modellen for å se om vi har bevis på diskret hvit støy: Korrelogrammet ser lovende ut, så neste skritt er å løpe Ljung-Box-testen og bekreft at vi har en god modellpasning: Siden p-verdien er større enn 0,05, har vi bevis på en god modellpassform. Hvorfor er det at i den forrige artikkelen viste vår Ljung-Box-test for SampP500 at ARMA (3,3) var dårlig egnet for den daglige loggen returnerer Legg merke til at jeg bevisst trunker SampP500 dataene for å starte fra 2013 og fremover i denne artikkelen , som praktisk utelukker de volatile perioder rundt 2007-2008. Derfor har vi utelukket en stor del av SampP500 hvor vi hadde for stor volatilitetsklynging. Dette påvirker seriell korrelasjon av serien og har følgelig effekten av at serien ser ut til å være mer stasjonær enn den har vært i det siste. Dette er et veldig viktig punkt. Når vi analyserer tidsserier, må vi være svært forsiktige med betinget heteroscedastiske serier, som aksjemarkedsindekser. I kvantitativ finans er det ofte kjent som regimeringsdetektering å prøve å bestemme perioder med ulik volatilitet. Det er en av de vanskeligere oppgavene å oppnå. Nå drøft dette punktet i lengden i neste artikkel når vi kommer til å vurdere ARCH og GARCH-modellene. La oss nå plotte en prognose for de neste 25 dagene av SampP500 daglige logg returnerer: Nå som vi har muligheten til å passe og prognose modeller som ARIMA, var svært nær å kunne opprette strategiske indikatorer for handel. Neste trinn I neste artikkel skal vi se på Generalized Autoregressive Conditional Heteroscedasticity (GARCH) - modellen og bruke den til å forklare mer av seriell korrelasjon i enkelte aksjer og aksjeindeksserier. Når vi har diskutert GARCH, vil vi være i stand til å kombinere det med ARIMA-modellen og skape signalindikatorer og dermed en grunnleggende kvantitativ handelsstrategi. Bare å komme i gang med kvantitativ handelA RIMA står for autoregressive integrerte flytende gjennomsnittlige modeller. Univariate (single vector) ARIMA er en prognose teknikk som projiserer fremtidens verdier av en serie basert helt på egen treghet. Hovedapplikasjonen er i området for kortsiktig prognose som krever minst 40 historiske datapunkter. Det fungerer best når dataene dine viser et stabilt eller konsistent mønster over tid med et minimum av utelukker. Noen ganger kalt Box-Jenkins (etter de opprinnelige forfatterne), er ARIMA vanligvis overlegen mot eksponensiell utjevningsteknikker når dataene er rimelig lange og korrelasjonen mellom tidligere observasjoner er stabil. Hvis dataene er korte eller svært volatile, kan noen utjevningsmetode virke bedre. Hvis du ikke har minst 38 datapunkter, bør du vurdere en annen metode enn ARIMA. Det første trinnet i å anvende ARIMA-metoden er å sjekke for stasjonar. Stasjonaritet innebærer at serien forblir på et relativt konstant nivå over tid. Hvis det finnes en trend, som i de fleste økonomiske eller forretningsmessige applikasjoner, er dataene dine ikke stasjonære. Dataene skal også vise en konstant variasjon i sine svingninger over tid. Dette er lett å se med en serie som er tungt sesongmessig og vokser i raskere takt. I et slikt tilfelle vil oppturer og nedturer i sesongmessigheten bli mer dramatisk over tid. Uten disse stasjonarforholdene blir oppfylt, kan mange av beregningene som er knyttet til prosessen ikke beregnes. Hvis en grafisk oversikt over dataene indikerer ikke-stationaritet, bør du forskjellere serien. Differensiering er en utmerket måte å transformere en ikke-stationær serie til en stasjonær en. Dette gjøres ved å trekke observasjonen i den nåværende perioden fra den forrige. Hvis denne transformasjonen bare er gjort en gang til en serie, sier du at dataene først er forskjellig. Denne prosessen eliminerer i hovedsak trenden hvis serien din vokser til en forholdsvis konstant hastighet. Hvis den vokser i økende grad, kan du bruke samme prosedyre og forskjell dataene igjen. Dine data vil da bli annerledes forskjellig. Autokorrelasjoner er numeriske verdier som angir hvordan en dataserie er relatert til seg selv over tid. Nærmere bestemt måler det hvor sterkt dataverdier på et spesifisert antall perioder fra hverandre er korrelert til hverandre over tid. Antallet perioder fra hverandre kalles vanligvis laget. For eksempel måler en autokorrelasjon ved lag 1 hvordan verdier 1 periode fra hverandre er korrelert til hverandre gjennom serien. En autokorrelasjon ved lag 2 måler hvordan dataene to perioder fra hverandre er korrelert gjennom hele serien. Autokorrelasjoner kan variere fra 1 til -1. En verdi nær 1 indikerer en høy positiv korrelasjon, mens en verdi nær -1 innebærer en høy negativ korrelasjon. Disse tiltakene blir oftest vurdert gjennom grafiske tomter kalt correlagrams. Et korrelagram plotter automatisk korrelasjonsverdiene for en gitt serie på forskjellige lag. Dette kalles autokorrelasjonsfunksjonen og er svært viktig i ARIMA-metoden. ARIMA-metodikken forsøker å beskrive bevegelsene i en stasjonær tidsserie som en funksjon av det som kalles autoregressive og bevegelige gjennomsnittsparametere. Disse refereres til som AR parametere (autoregessive) og MA parametere (glidende gjennomsnitt). En AR-modell med bare 1 parameter kan skrives som. X (t) A (1) X (t-1) E (t) hvor X (t) tidsserier under undersøkelse A (1) den autoregressive parameteren i rekkefølge 1 X (t-1) tidsseriene forsinket 1 periode E (t) feilmodellen til modellen Dette betyr ganske enkelt at en gitt verdi X (t) kan forklares med en funksjon av sin tidligere verdi, X (t-1), pluss noe uforklarlig tilfeldig feil, E (t). Hvis den estimerte verdien av A (1) var .30, ville dagens verdi av serien være relatert til 30 av verdien 1 periode siden. Selvfølgelig kan serien være relatert til mer enn bare en fortid verdi. For eksempel, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Dette indikerer at dagens verdi av serien er en kombinasjon av de to umiddelbart foregående verdiene, X (t-1) og X (t-2), pluss noen tilfeldig feil E (t). Vår modell er nå en autoregressiv modell av rekkefølge 2. Flytende gjennomsnittsmodeller: En annen type Box-Jenkins-modell kalles en bevegelig gjennomsnittsmodell. Selv om disse modellene ser veldig ut som AR-modellen, er konseptet bak dem ganske annerledes. Flytte gjennomsnittlige parametere relaterer til hva som skjer i periode t bare til de tilfeldige feilene som oppstod i tidligere tidsperioder, dvs. E (t-1), E (t-2) osv. Heller enn til X (t-1), X t-2), (Xt-3) som i de autoregressive tilnærmingene. En glidende gjennomsnittsmodell med en MA-term kan skrives som følger. X (t) - B (1) E (t-1) E (t) Betegnelsen B (1) kalles en MA i rekkefølge 1. Det negative tegnet foran parameteren brukes kun til konvensjon og skrives vanligvis ut ut automatisk ved de fleste dataprogrammer. Ovennevnte modell sier bare at en gitt verdi av X (t) er direkte relatert til den tilfeldige feilen i den forrige perioden, E (t-1) og til dagens feilperiode, E (t). Som i tilfelle av autoregressive modeller, kan de bevegelige gjennomsnittlige modellene utvides til høyere ordningsstrukturer som dekker forskjellige kombinasjoner og bevegelige gjennomsnittslengder. ARIMA-metoden lar også modeller bygges som inneholder både autoregressive og bevegelige gjennomsnittsparametre sammen. Disse modellene kalles ofte blandede modeller. Selv om dette gir et mer komplisert prognoseverktøy, kan strukturen faktisk simulere serien bedre og gi en mer nøyaktig prognose. Rene modeller innebærer at strukturen kun består av AR eller MA parametere - ikke begge deler. Modeller utviklet av denne tilnærmingen kalles vanligvis ARIMA-modeller fordi de bruker en kombinasjon av autoregressiv (AR), integrasjon (I) - refererer til omvendt prosess av differensiering for å produsere prognosen og flytte gjennomsnittlige (MA) operasjoner. En ARIMA-modell er vanligvis oppgitt som ARIMA (p, d, q). Dette representerer rekkefølgen på de autoregressive komponentene (p), antall differensieringsoperatører (d) og den høyeste rekkefølgen av den bevegelige gjennomsnittlige termen. For eksempel betyr ARIMA (2,1,1) at du har en andre ordre autoregressiv modell med en første rekkefølge som beveger gjennomsnittlig komponent hvis serie har blitt forskjellig en gang for å indusere stasjonar. Plukker riktig spesifikasjon: Hovedproblemet i klassiske Box-Jenkins prøver å bestemme hvilken ARIMA-spesifikasjon som skal brukes - i. e. hvor mange AR og eller MA parametere som skal inkluderes. Dette er hvor mye Box-Jenkings 1976 var viet til identifikasjonsprosessen. Det var avhengig av grafisk og numerisk vurdering av prøveautokorrelasjonen og delvise autokorrelasjonsfunksjoner. Vel, for dine grunnleggende modeller, er oppgaven ikke for vanskelig. Hver har autokorrelasjonsfunksjoner som ser på en bestemt måte. Men når du går opp i kompleksitet, er mønstrene ikke så lett oppdaget. For å gjøre saken vanskeligere representerer dataene bare en prøve av den underliggende prosessen. Dette betyr at prøvetakingsfeil (utjevningsmidler, målefeil, etc.) kan forvride den teoretiske identifikasjonsprosessen. Derfor er tradisjonell ARIMA-modellering en kunst heller enn en science. ARIMA står for autoregressive Integrated Moving Average-modeller. Univariate (single vector) ARIMA er en prognose teknikk som projiserer fremtidens verdier av en serie basert helt på egen treghet. Hovedapplikasjonen er i området for kortsiktig prognose som krever minst 40 historiske datapunkter. Det fungerer best når dataene dine viser et stabilt eller konsistent mønster over tid med et minimum av utelukker. Noen ganger kalt Box-Jenkins (etter de opprinnelige forfatterne), er ARIMA vanligvis overlegen mot eksponensiell utjevningsteknikker når dataene er rimelig lange og korrelasjonen mellom tidligere observasjoner er stabil. Det første trinnet i å anvende ARIMA-metoden er å sjekke for stasjonar. quotStationarityquot innebærer at serien forblir på et ganske konstant nivå over tid. Hvis det finnes en trend, som i de fleste økonomiske eller forretningsmessige applikasjoner, er dataene dine ikke stasjonære. Dataene skal også vise en konstant variasjon i sine svingninger over tid. Dette er lett å se med en serie som er tungt sesongmessig og vokser i raskere takt. I et slikt tilfelle vil oppturer og nedturer i sesongmessigheten bli mer dramatisk over tid. Uten disse stasjonarforholdene blir oppfylt, kan mange av beregningene som er knyttet til prosessen ikke beregnes. Hvis en grafisk oversikt over dataene indikerer ikke-stationaritet, bør du angitte varianten i serien. Differensiering er en utmerket måte å transformere en ikke-stationær serie til en stasjonær en. Dette gjøres ved å trekke observasjonen i den nåværende perioden fra den forrige. Hvis denne transformasjonen bare er gjort en gang til en serie, sier du at dataene har vært den første forskjellen. Denne prosessen eliminerer i hovedsak trenden hvis serien din vokser til en forholdsvis konstant hastighet. Hvis den vokser i økende grad, kan du bruke samme prosedyre og forskjell dataene igjen. Dine data vil da være quotsecond differencedquot. quotAutocorrelationsquot er numeriske verdier som angir hvordan en dataserie er relatert til seg selv over tid. Nærmere bestemt måler det hvor sterkt dataverdier på et spesifisert antall perioder fra hverandre er korrelert til hverandre over tid. Antall perioder fra hverandre kalles vanligvis kvoteringskvoten. For eksempel måler en autokorrelasjon ved lag 1 hvordan verdier 1 periode fra hverandre er korrelert til hverandre gjennom serien. En autokorrelasjon ved lag 2 måler hvordan dataene to perioder fra hverandre er korrelert gjennom hele serien. Autokorrelasjoner kan variere fra 1 til -1. En verdi nær 1 indikerer en høy positiv korrelasjon, mens en verdi nær -1 innebærer en høy negativ korrelasjon. Disse tiltakene evalueres oftest gjennom grafiske tomter kalt quotcorrelagramsquot. Et korrelagram plotter automatisk korrelasjonsverdiene for en gitt serie på forskjellige lag. Dette refereres til som quotautocorrelation functionquot og er svært viktig i ARIMA-metoden. ARIMA-metodikken forsøker å beskrive bevegelsene i en stasjonær tidsserie som en funksjon av det som kalles kvotoregressive og bevegelige averagequot parametere. Disse refereres til som AR parametere (autoregessive) og MA parametere (glidende gjennomsnitt). En AR-modell med bare 1 parameter kan skrives som. X (t) A (1) X (t-1) E (t) hvor X (t) tidsserier under undersøkelse A (1) den autoregressive parameteren i rekkefølge 1 X (t-1) tidsseriene forsinket 1 periode E (t) feilmodellen til modellen Dette betyr ganske enkelt at en gitt verdi X (t) kan forklares med en funksjon av sin tidligere verdi, X (t-1), pluss noe uforklarlig tilfeldig feil, E (t). Hvis den estimerte verdien av A (1) var .30, ville dagens verdi av serien være relatert til 30 av verdien 1 periode siden. Selvfølgelig kan serien være relatert til mer enn bare en fortid verdi. For eksempel, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Dette indikerer at dagens verdi av serien er en kombinasjon av de to umiddelbart foregående verdiene, X (t-1) og X (t-2), pluss noen tilfeldig feil E (t). Vår modell er nå en autoregressiv bestillingsmodell. 2. Flytende gjennomsnittsmodeller: En annen type Box-Jenkins-modell kalles en quotmoving averagequot-modell. Selv om disse modellene ser veldig ut som AR-modellen, er konseptet bak dem ganske annerledes. Flytte gjennomsnittlige parametere relaterer til hva som skjer i periode t bare til de tilfeldige feilene som oppstod i tidligere tidsperioder, dvs. E (t-1), E (t-2) osv. Heller enn til X (t-1), X t-2), (Xt-3) som i de autoregressive tilnærmingene. En glidende gjennomsnittsmodell med en MA-term kan skrives som følger. X (t) - B (1) E (t-1) E (t) Betegnelsen B (1) kalles en MA i rekkefølge 1. Det negative tegnet foran parameteren brukes kun til konvensjon og skrives vanligvis ut ut automatisk ved de fleste dataprogrammer. Ovennevnte modell sier bare at en gitt verdi av X (t) er direkte relatert til den tilfeldige feilen i den forrige perioden, E (t-1) og til dagens feilperiode, E (t). Som i tilfelle av autoregressive modeller, kan de bevegelige gjennomsnittlige modellene utvides til høyere ordningsstrukturer som dekker forskjellige kombinasjoner og bevegelige gjennomsnittslengder. ARIMA-metoden lar også modeller bygges som inneholder både autoregressive og bevegelige gjennomsnittsparametre sammen. Disse modellene blir ofte referert til som citerte modellerquot. Selv om dette gir et mer komplisert prognoseverktøy, kan strukturen faktisk simulere serien bedre og gi en mer nøyaktig prognose. Rene modeller innebærer at strukturen kun består av AR eller MA parametere - ikke begge deler. Modeller utviklet av denne tilnærmingen kalles vanligvis ARIMA-modeller fordi de bruker en kombinasjon av autoregressiv (AR), integrasjon (I) - refererer til omvendt prosess av differensiering for å produsere prognosen og flytte gjennomsnittlige (MA) operasjoner. En ARIMA-modell er vanligvis oppgitt som ARIMA (p, d, q). Dette representerer rekkefølgen på de autoregressive komponentene (p), antall differensieringsoperatører (d) og den høyeste rekkefølgen av den bevegelige gjennomsnittlige termen. For eksempel betyr ARIMA (2,1,1) at du har en andre ordre autoregressiv modell med en første rekkefølge som beveger gjennomsnittlig komponent hvis serie har blitt forskjellig en gang for å indusere stasjonar. Plukker riktig spesifikasjon: Hovedproblemet i klassiske Box-Jenkins prøver å bestemme hvilken ARIMA-spesifikasjon som skal brukes - i. e. hvor mange AR og eller MA parametere som skal inkluderes. Dette er hvor mye Box-Jenkings 1976 var viet til kvotifiseringsprosessen. Det var avhengig av grafisk og numerisk vurdering av prøveautokorrelasjonen og delvise autokorrelasjonsfunksjoner. 275 Visninger middot View Oppvoter middot Ikke for Reproduksjon

Comments

Popular Posts