Friday 27 October 2017

Autoregressiv Bevegelig Gjennomsnitt Serie


Det finnes en rekke tilnærminger til modellering av tidsserier. Vi skisserer noen av de vanligste tilnærmingene nedenfor. Trend, Seasonal, Residual Decompositions En tilnærming er å dekomponere tidsserien til en trend, sesongmessig og gjenværende komponent. Tredobbelt eksponensiell utjevning er et eksempel på denne tilnærmingen. Et annet eksempel, kalt sesongbasert loess, er basert på lokalt vektede minste kvadrater og diskuteres av Cleveland (1993). Vi diskuterer ikke sesongløser i denne håndboken. Frekvensbaserte metoder En annen tilnærming, som ofte brukes i vitenskapelige og tekniske applikasjoner, er å analysere serien i frekvensdomenet. Et eksempel på denne tilnærmingen ved modellering av et sinusformet datasett er vist i strålebøyningsstudiet. Spektralplottet er det primære verktøyet for frekvensanalysen av tidsserier. Autoregressive (AR) Modeller En felles tilnærming for modellering av univariate tidsserier er den autoregressive (AR) modellen: Xt delta phi1 X phi2 X cdots phip X At, hvor (Xt) er tidsseriene, (At) er hvit støy og delta venstre (1 - sum p phi høyre) mu. med (mu) betegner prosessmiddelet. En autoregressiv modell er rett og slett en lineær regresjon av dagens verdi av serien mot en eller flere tidligere verdier av serien. Verdien av (p) kalles rekkefølgen til AR-modellen. AR-modeller kan analyseres med en av ulike metoder, inkludert standard lineære minste kvadratteknikker. De har også en enkel tolkning. Moving Average (MA) Modeller En annen vanlig tilnærming for modellering av univariate tidsseriemodeller er den bevegelige gjennomsnittlige (MA) modellen: Xt mu At - theta1 A - theta2 A - cdots - thetaq A, hvor (Xt) er tidsseriene, ) er middelverdien av serien, (A) er hvite lydvilkår, og (theta1, ldots, thetaq) er parametrene til modellen. Verdien av (q) kalles rekkefølgen av MA-modellen. Det vil si at en bevegelig gjennomsnittsmodell er konseptuelt en lineær regresjon av dagens verdi av serien mot den hvite støyen eller tilfeldige støt av en eller flere tidligere verdier av serien. De tilfeldige støtene ved hvert punkt antas å komme fra samme fordeling, typisk en normal fordeling, med plassering ved null og konstant skala. Sondringen i denne modellen er at disse tilfeldige sjokkene er propogated til fremtidige verdier av tidsseriene. Tilpasning av MA-estimatene er mer komplisert enn med AR-modeller fordi feilvilkårene ikke er observerbare. Dette betyr at iterative ikke-lineære monteringsprosedyrer må brukes i stedet for lineære minstefirkanter. MA-modeller har også en mindre åpenbar tolkning enn AR-modeller. Noen ganger vil ACF og PACF foreslå at en MA-modell ville være et bedre modellvalg, og noen ganger bør både AR og MA-termer brukes i samme modell (se avsnitt 6.4.4.5). Vær imidlertid oppmerksom på at feilvilkårene etter modellen passer, skal være uavhengige og følge standardforutsetningene for en univariate prosess. Box og Jenkins populariserte en tilnærming som kombinerer det bevegelige gjennomsnittet og de autoregressive tilnærmingene i boken Tidsserieanalyse: Forecasting and Control (Box, Jenkins og Reinsel, 1994). Selv om både autoregressive og bevegelige gjennomsnittlige tilnærminger allerede var kjent (og ble opprinnelig undersøkt av Yule), var Boxes og Jenkins bidrag i å utvikle en systematisk metode for å identifisere og estimere modeller som kunne inkludere begge tilnærminger. Dette gjør Box-Jenkins-modeller til en kraftig klasse av modeller. De neste flere seksjonene vil diskutere disse modellene i detalj. Utviklingsregistrerende, flytende gjennomsnittlig ARMA (p, q) Modeller for tidsserieanalyse - Del 3 Dette er det tredje og siste innlegget i miniserien på AROR-modeller (Autoregressive Moving Average) for tid serieanalyse. Weve introduserte autoregressive modeller og Moving Average-modeller i de to tidligere artiklene. Nå er det på tide å kombinere dem for å produsere en mer sofistikert modell. Til slutt vil dette lede oss til ARIMA - og GARCH-modellene som gjør at vi kan forutsi avkastning og prognosevolatilitet. Disse modellene vil danne grunnlag for handelssignaler og risikostyringsteknikker. Hvis du har lest del 1 og del 2, vil du ha sett at vi pleier å følge et mønster for vår analyse av en tidsseriemodell. Jeg gjentar det kort her: Begrunnelse - Hvorfor er vi interessert i denne spesifikke modellen Definisjon - En matematisk definisjon for å redusere tvetydighet. Korrelogram - Plotting a sample correlogram for å visualisere en modellens oppførsel. Simulering og montering - Tilpasning av modellen til simuleringer, for å sikre at vi har forstått modellen riktig. Real Financial Data - Bruk modellen til ekte historiske eiendomspriser. Prediksjon - Varsle etterfølgende verdier for å bygge handelssignaler eller filtre. For å følge denne artikkelen er det tilrådelig å ta en titt på tidligere artikler om tidsserier. De kan alle bli funnet her. Bayesian Information Criterion I del 1 av denne artikkelserien så vi på Akaike Information Criterion (AIC) som et middel til å hjelpe oss å velge mellom separate beste tidsseriemodeller. Et nært beslektet verktøy er Bayesian Information Criterion (BIC). I hovedsak har den lignende oppførsel til AIC ved at den straffer modeller for å ha for mange parametere. Dette kan føre til overfitting. Forskjellen mellom BIC og AIC er at BIC er strengere med straffen for ytterligere parametere. Bayesian Information Criterion Hvis vi tar sannsynligheten for en statistisk modell, som har k parametere, og L maksimerer sannsynligheten. da er Bayesian Information Criterion gitt av: Hvor n er antall datapunkter i tidsseriene. Vi bruker AIC og BIC nedenfor når du velger passende ARMA (p, q) modeller. Ljung-Box Test I del 1 av denne artikkelen ser serien Rajan nevnt i Disqus på at Ljung-Box-testen var mer hensiktsmessig enn å bruke Akaike-informasjonskriteriet for Bayesian Information Criterion ved å avgjøre om en ARMA-modell var en god passform til en tid serie. Ljung-Box-testen er en klassisk hypotesetest som er laget for å teste om et sett av autokorrelasjoner av en tilpasset tidsseriemodell er vesentlig forskjellig fra null. Testen tester ikke hvert enkelt lag for tilfeldighet, men tester tilfeldigvis over en gruppe lags. Ljung-Box Test Vi definerer nullhypotesen som: Tidsseriedataene ved hvert lag er i. i.d .. det vil si at korrelasjonene mellom populasjonsserieverdiene er null. Vi definerer den alternative hypotesen som: Tidsseriedataene er ikke i. i.d. og har seriell korrelasjon. Vi beregner følgende teststatistikk. Q: Hvor n er lengden på tidsserieprøven, er h k eksamensautokorrelasjonen ved lag k og h er antall lags under testen. Beslutningsregelen om å nullstille nullhypotesen er å sjekke om Q gt chi2, for en chi-kvadrert fordeling med h grader av frihet ved 100 (1-alfa) prosentilen. Selv om detaljene i testen kan virke litt komplekse, kan vi faktisk bruke R for å beregne testen for oss, forenkle prosedyren noe. Autogressive Moving Average (ARMA) Modeller av rekkefølge p, q Nå som vi diskuterte BIC og Ljung-Box testen, var klare til å diskutere vår første blandede modell, nemlig det autoregressive Moving Average av ordre p, q eller ARMA (p, q). Hittil har vi vurdert autoregressive prosesser og bevegelige gjennomsnittsprosesser. Den tidligere modellen vurderer sin egen tidligere oppførsel som innganger for modellen og som et slikt forsøk på å fange markedsdeltagende effekter, som for eksempel momentum og gjennombrudd i aksjehandel. Sistnevnte modell brukes til å karakterisere sjokkinformasjon til en serie, for eksempel en overraskende inntektsmeddelelse eller uventet hendelse (for eksempel BP Deepwater Horizon oljeutslipp). Derfor forsøker en ARMA-modell å fange begge disse aspektene når man modellerer økonomiske tidsserier. Merk at en ARMA-modell ikke tar hensyn til volatilitetsklynging, et sentralt empirisk fenomen i mange økonomiske tidsserier. Det er ikke en betinget heteroscedastisk modell. For det må vi vente på ARCH og GARCH-modellene. Definisjon ARMA (p, q) - modellen er en lineær kombinasjon av to lineære modeller, og er dermed i seg selv likevel lineær: Autoregressiv Flytende Gjennomsnitt Modell av rekkefølge p, q En tidsseriemodell, er en autoregressiv glidende gjennomsnittsmodell av rekkefølge p, q . ARMA (p, q), hvis: start xt alfa1 x alfa2 x ldots wt beta1 w beta2 w ldots betaq w ende Hvor er hvit støy med E (wt) 0 og varians sigma2. Hvis vi vurderer Backward Shift Operator. (se en tidligere artikkel) kan vi omskrive ovenstående som en funksjon theta og phi av: Vi kan rett og slett se det ved å sette p neq 0 og q0 vi gjenoppretter AR (p) modellen. På samme måte hvis vi setter p 0 og q neq 0 gjenoppretter vi MA (q) modellen. En av hovedtrekkene til ARMA-modellen er at den er parsimonisk og overflødig i sine parametere. Det vil si at en ARMA-modell ofte krever færre parametere enn en AR (p) eller MA (q) - modell alene. I tillegg om vi skriver om ligningen i form av BSO, kan theta og phi-polynomene noen ganger dele en felles faktor, og dermed føre til en enklere modell. Simuleringer og korrelogrammer Som med de autoregressive og bevegelige gjennomsnittsmodellene vil vi nå simulere ulike ARMA-serier og deretter prøve å passe ARMA-modeller til disse realisasjonene. Vi bærer dette ut fordi vi vil sikre at vi forstår monteringsprosedyren, inkludert hvordan du beregner konfidensintervaller for modellene, samt sørge for at prosedyren faktisk gjenoppretter rimelige estimater for de opprinnelige ARMA parametrene. I del 1 og del 2 konstruerte vi manuelt AR - og MA-serien ved å tegne N-prøver fra en normalfordeling og deretter lage den spesifikke tidsseriemodellen ved hjelp av lags av disse prøvene. Det er imidlertid en enklere måte å simulere AR, MA, ARMA og til og med ARIMA-data, ganske enkelt ved å bruke arima. sim-metoden i R. Lets starte med den enkleste mulige ikke-trivielle ARMA-modellen, nemlig ARMA (1,1 ) modell. Det vil si en autoregressiv bestillingsmodell kombinert med en bevegelig gjennomsnittsmodell av ordre en. En slik modell har bare to koeffisienter, alfa og beta, som representerer de første lagene av tidsseriene selv og de støt hvite lydbetingelsene. En slik modell er gitt av: Vi må spesifisere koeffisientene før simulering. La oss ta alfa 0,5 og beta -0,5: Utgangen er som følger: Lar vi også plotte korrelogrammet: Vi kan se at det ikke er noen signifikant autokorrelasjon, som kan forventes fra en ARMA (1,1) modell. Endelig kan vi prøve å bestemme koeffisientene og deres standardfeil ved hjelp av arima-funksjonen: Vi kan beregne konfidensintervallene for hver parameter ved hjelp av standardfeilene: Forvissingsintervallene inneholder de sanne parameterverdiene i begge tilfeller, men vi bør merke at 95 konfidensintervaller er svært brede (en konsekvens av de rimelig store standardfeilene). La oss nå prøve en ARMA (2,2) modell. Det er en AR (2) modell kombinert med en MA (2) modell. Vi må spesifisere fire parametre for denne modellen: alpha1, alpha2, beta1 og beta2. Lar oss ta alpha1 0.5, alpha2-0.25 beta10.5 og beta2-0.3: Utgangen av vår ARMA (2,2) modell er som følger: Og den tilsvarende autokorrelasjonen: Vi kan nå prøve å montere en ARMA (2,2) modell til dataene: Vi kan også beregne konfidensintervaller for hver parameter: Legg merke til at konfidensintervallene for koeffisientene for den bevegelige gjennomsnittskomponent (beta1 og beta2) ikke faktisk inneholder den opprinnelige parameterverdien. Dette skisserer faren for å forsøke å passe modeller til data, selv når vi kjenner de sanne parameterverdiene. For handelsformål trenger vi bare å ha en prediktiv kraft som overskrider sjansen og gir nok overskudd over transaksjonskostnadene for å være lønnsomt i på lang sikt. Nå som vi har sett noen eksempler på simulerte ARMA-modeller, trenger vi mekanisme for å velge verdiene p og q når de passer til modellene til ekte økonomiske data. Velge den beste ARMA-modellen (p, q) For å bestemme hvilken rekkefølge p, q av ARMA-modellen passer for en serie, må vi bruke AIC (eller BIC) på tvers av en undergruppe av verdier for p, q og Bruk deretter Ljung-Box-testen for å finne ut om en god passform har blitt oppnådd, for spesielle verdier av p, q. For å vise denne metoden skal vi for det første simulere en bestemt ARMA (p, q) prosess. Vi vil da gå over alle parvisverdier av p i og q inn og beregne AIC. Vi velger modellen med lavest AIC og kjører en Ljung-Box-test på residualene for å avgjøre om vi har oppnådd en god passform. La oss begynne med å simulere en ARMA (3,2) - serie: Vi skal nå opprette et objekt som er endelig for å lagre den beste modellen passer og laveste AIC verdi. Vi går over de forskjellige p, q-kombinasjonene og bruker det nåværende objektet til å lagre passformen til en ARMA (i, j) modell, for loopingvariablene i og j. Hvis den nåværende AIC er mindre enn noen tidligere beregnet AIC, setter vi den endelige AIC til denne nåværende verdien og velger den rekkefølgen. Ved avslutning av sløyfen har vi rekkefølgen på ARMA-modellen lagret i final. order og ARIMA (p, d, q) passer seg (med integrert d-komponenten satt til 0) lagret som final. arma: Lets utføre AIC , ordre og ARIMA-koeffisienter: Vi ser at den opprinnelige rekkefølgen på den simulerte ARMA-modellen ble gjenopprettet, nemlig med p3 og q2. Vi kan plotte corelogrammet av resterne av modellen for å se om de ser ut som en realisering av diskret hvit støy (DWN): Korelogrammet ser faktisk ut som en realisering av DWN. Endelig utfører vi Ljung-Box-testen for 20 lags for å bekrefte dette: Legg merke til at p-verdien er større enn 0,05, som sier at residualene er uavhengige på 95-nivået og dermed gir en ARMA (3,2) modell en God modell passform. Klart dette burde være tilfelle siden weve simulerte dataene selv. Dette er nettopp prosedyren vi skal bruke når vi kommer til å passe ARMA (p, q) modeller til SampP500-indeksen i følgende avsnitt. Finansdata Nå som vi har skissert prosedyren for å velge den optimale tidsseriemodellen for en simulert serie, er det ganske greit å bruke det til økonomiske data. For dette eksempelet skal vi igjen velge SampP500 US Equity Index. Lar deg laste ned de daglige sluttkursene ved hjelp av quantmod, og opprett deretter logg returneringsstrømmen: La oss utføre den samme monteringsprosedyren som for den simulerte ARMA-serien (3,2) ovenfor på loggen returnerer serien til SampP500 ved hjelp av AIC: Den beste monteringsmodellen har rekkefølge ARMA (3,3): Lar plotte gjenstander av den monterte modellen til SampP500 logg daglig returstrøm: Legg merke til at det er noen signifikante topper, spesielt ved høyere lag. Dette er tegn på dårlig form. Kan utføre en Ljung-Box-test for å se om vi har statistisk bevis for dette: Som vi mistenkte er p-verdien mindre enn 0,05, og som sådan kan vi ikke si at residualene er en realisering av diskret hvit støy. Derfor er det ytterligere autokorrelasjon i residualene som ikke forklares av den monterte ARMA-modellen (3,3). Neste trinn Som vi har diskutert hele tiden i denne artikkelserien, har vi sett bevis på betinget heteroscedasticitet (volatilitetsklynging) i SampP500-serien, spesielt i perioder rundt 2007-2008. Når vi bruker en GARCH-modell senere i artikkelserien, ser vi hvordan du eliminerer disse autokorrelasjonene. I praksis er ARMA-modeller vanligvis ikke gode tilpasninger for logg-aksjer returnerer. Vi må ta hensyn til betinget heteroscedasticitet og bruke en kombinasjon av ARIMA og GARCH. Den neste artikkelen vil vurdere ARIMA og vise hvordan den integrerte komponenten adskiller seg fra den ARMA-modellen vi har vurdert i denne artikkelen. Bare Komme i gang med kvantitativ Trading8.3 Autoregressive modeller I en multiple-regresjonsmodell forutsier vi variabelen av interesse ved hjelp av en lineær kombinasjon av prediktorer. I en autoregresjonsmodell forutsier vi variabelen av interesse ved å bruke en lineær kombinasjon av tidligere verdier av variabelen. Begrepet auto-regresjon indikerer at det er en regresjon av variabelen mot seg selv. Dermed kan en autoregressiv modell av orden p skrives som hvor c er en konstant og et er hvit støy. Dette er som en multiple regresjon, men med forsinkede verdier av yt som prediktorer. Vi refererer til dette som en AR (p) modell. Autoregressive modeller er bemerkelsesverdig fleksible ved å håndtere et bredt spekter av forskjellige tidsseriemønstre. De to seriene i figur 8.5 viser serier fra en AR (1) modell og en AR (2) modell. Endring av parametrene phi1, prikker, phip resulterer i forskjellige tidsseriemønstre. Variasjonen av feilbegrepet et vil bare endre omfanget av serien, ikke mønstrene. Figur 8.5: To eksempler på data fra autoregressive modeller med forskjellige parametere. Venstre: AR (1) med yt 18 -0.8y et. Høyre: AR (2) med yt 8 ​​1.3y -0.7y et. I begge tilfeller er et normalt distribuert hvit støy med gjennomsnittlig null og varians en. For en AR (1) modell: Når phi10, yt er ekvivalent med hvit støy. Når phi11 og c0, yt er ekvivalent med en tilfeldig spasertur. Når phi11 og cne0, yt er ekvivalent med en tilfeldig gang med drift Når phi1tt0, yt har en tendens til å svinge mellom positive og negative verdier. Vi begrenser normalt autoregressive modeller til stasjonære data, og noen begrensninger på parameterverdiene er derfor nødvendig. For en AR (1) modell: -1 lt phi1 lt 1. For en AR (2) modell: -1 lt phi2 lt 1, phi1phi2 lt 1, phi2-phi1 lt 1. Når pge3 er restriksjonene mye mer kompliserte. R tar seg av disse restriksjonene når du estimerer en modell.2.1 Flytte gjennomsnittlige modeller (MA modeller) Tidsseriemodeller kjent som ARIMA-modeller kan inneholde autoregressive vilkår og eller flytte gjennomsnittlige vilkår. I uke 1 lærte vi et autoregressivt uttrykk i en tidsseriemodell for variabelen x t er en forsinket verdi på x t. For eksempel er et lag 1 autoregressivt uttrykk x t-1 (multiplisert med en koeffisient). Denne leksjonen definerer glidende gjennomsnittlige vilkår. En glidende gjennomsnittlig term i en tidsseriemodell er en tidligere feil (multiplisert med en koeffisient). La (wt overset N (0, sigma2w)), noe som betyr at w t er identisk, uavhengig distribuert, hver med en normalfordeling med gjennomsnittlig 0 og samme varians. Den første ordre-flytende gjennomsnittsmodellen, betegnet med MA (1), er (xt mu wt theta1w) Den andre ordens bevegelige gjennomsnittsmodellen, betegnet med MA (2), er (xt mu wt theta1w theta2w) , betegnet med MA (q) er (xt mu wt theta1w theta2w punkter thetaqw) Merknad. Mange lærebøker og programvare definerer modellen med negative tegn før betingelsene. Dette endrer ikke de generelle teoretiske egenskapene til modellen, selv om den ikke flipper de algebraiske tegnene på estimerte koeffisientverdier og (unsquared) termer i formler for ACFer og avvik. Du må sjekke programvaren for å verifisere om negative eller positive tegn har blitt brukt for å skrive riktig estimert modell. R bruker positive tegn i sin underliggende modell, som vi gjør her. Teoretiske egenskaper av en tidsrekkefølge med en MA (1) modell Merk at den eneste ikke-nullverdien i teoretisk ACF er for lag 1. Alle andre autokorrelasjoner er 0. Således er en prøve-ACF med en signifikant autokorrelasjon bare ved lag 1 en indikator på en mulig MA (1) modell. For interesserte studenter er bevis på disse egenskapene et vedlegg til denne utdelingen. Eksempel 1 Anta at en MA (1) modell er x t 10 w t .7 w t-1. hvor (wt overset N (0,1)). Dermed er koeffisienten 1 0,7. Den teoretiske ACF er gitt av Et plott av denne ACF følger. Plottet som nettopp er vist er den teoretiske ACF for en MA (1) med 1 0,7. I praksis vil en prøve vanligvis ikke gi et slikt klart mønster. Ved hjelp av R simulerte vi n 100 prøveverdier ved hjelp av modellen x t 10 w t .7 w t-1 hvor w t iid N (0,1). For denne simuleringen følger en tidsserie-plott av prøvedataene. Vi kan ikke fortelle mye fra denne plottet. Prøven ACF for de simulerte dataene følger. Vi ser en spike i lag 1 etterfulgt av generelt ikke signifikante verdier for lags forbi 1. Merk at prøven ACF ikke samsvarer med det teoretiske mønsteret til den underliggende MA (1), som er at alle autokorrelasjoner for lags forbi 1 vil være 0 . En annen prøve ville ha en litt annen prøve-ACF vist nedenfor, men vil trolig ha de samme brede funksjonene. Terapeutiske egenskaper av en tidsserie med en MA (2) modell For MA (2) modellen er teoretiske egenskaper følgende: Merk at de eneste ikke-nullverdiene i teoretisk ACF er for lags 1 og 2. Autokorrelasjoner for høyere lags er 0 . En ACF med signifikant autokorrelasjoner på lags 1 og 2, men ikke-signifikante autokorrelasjoner for høyere lags indikerer en mulig MA (2) modell. iid N (0,1). Koeffisientene er 1 0,5 og 2 0,3. Fordi dette er en MA (2), vil den teoretiske ACF bare ha null nullverdier ved lags 1 og 2. Verdier av de to ikke-null-autokorrelasjonene er Et plot av teoretisk ACF følger. Som nesten alltid er tilfellet, vil prøvedataene ikke oppføre seg så perfekt som teori. Vi simulerte n 150 utvalgsverdier for modellen x t 10 w t .5 w t-1 .3 w t-2. hvor det er N (0,1). Tidsserien av dataene følger. Som med tidsserien for MA (1) eksempeldata, kan du ikke fortelle mye om det. Prøven ACF for de simulerte dataene følger. Mønsteret er typisk for situasjoner der en MA (2) modell kan være nyttig. Det er to statistisk signifikante pigger på lags 1 og 2 etterfulgt av ikke-signifikante verdier for andre lags. Merk at på grunn av prøvetakingsfeil, samsvarte ACF ikke nøyaktig det teoretiske mønsteret. ACF for General MA (q) Modeller En egenskap av MA (q) - modeller generelt er at det finnes ikke-null autokorrelasjoner for de første q lagene og autokorrelasjonene 0 for alle lagene gt q. Ikke-entydighet av sammenhengen mellom verdier av 1 og (rho1) i MA (1) Modell. I MA (1) - modellen, for en verdi på 1. Den gjensidige 1 1 gir samme verdi. For eksempel, bruk 0,5 for 1. og bruk deretter 1 (0,5) 2 for 1. Du får (rho1) 0,4 i begge tilfeller. For å tilfredsstille en teoretisk begrensning kalt invertibility. vi begrenser MA (1) - modeller for å ha verdier med absolutt verdi mindre enn 1. I eksemplet som er gitt, vil 1 0,5 være en tillatelig parameterverdi, mens 1 10,5 2 ikke vil. Invertibility av MA modeller En MA-modell sies å være invertibel hvis den er algebraisk tilsvarer en konvergerende uendelig rekkefølge AR-modell. Ved konvergering mener vi at AR-koeffisientene reduseres til 0 da vi beveger oss tilbake i tid. Invertibility er en begrensning programmert i tidsserier programvare som brukes til å estimere koeffisientene av modeller med MA termer. Det er ikke noe vi ser etter i dataanalysen. Ytterligere opplysninger om inverterbarhetsbegrensningen for MA (1) - modeller er gitt i vedlegget. Avansert teorienotat. For en MA (q) modell med en spesifisert ACF, er det bare en inverterbar modell. Den nødvendige betingelsen for invertibilitet er at koeffisientene har verdier slik at ligningen 1- 1 y-. - q y q 0 har løsninger for y som faller utenfor enhetens sirkel. R-kode for eksemplene I eksempel 1, plotte vi den teoretiske ACF av modellen x t10 w t. 7w t-1. og deretter simulert n 150 verdier fra denne modellen og plottet prøve tidsseriene og prøven ACF for de simulerte dataene. R-kommandoene som ble brukt til å plotte den teoretiske ACF var: acfma1ARMAacf (mac (0,7), lag. max10) 10 lag av ACF for MA (1) med theta1 0,7 lags0: 10 skaper en variabel som heter lags som varierer fra 0 til 10. plot (lags, acfma1, xlimc (1,10), ylabr, typh, main ACF for MA (1) med theta1 0,7) abline (h0) legger til en horisontal akse på plottet. Den første kommandoen bestemmer ACF og lagrer den i en gjenstand kalt acfma1 (vårt valg av navn). Plot-kommandoen (den tredje kommandoen) plots lags versus ACF-verdiene for lags 1 til 10. ylab-parameteren merker y-aksen og hovedparameteren setter en tittel på plottet. For å se de numeriske verdiene til ACF, bruk bare kommandoen acfma1. Simuleringen og tomtene ble gjort med følgende kommandoer. xcarima. sim (n150, liste (mac (0.7))) Simulerer n 150 verdier fra MA (1) xxc10 legger til 10 for å gjøre gjennomsnitt 10. Simuleringsstandarder betyr 0. Plot (x, typeb, mainSimulated MA (1) data) acf (x, xlimc (1,10), mainACF for simulerte prøvedata) I eksempel 2 skisserte vi den teoretiske ACF av modellen xt 10 wt .5 w t-1 .3 w t-2. og deretter simulert n 150 verdier fra denne modellen og plottet prøve tidsseriene og prøven ACF for de simulerte dataene. R-kommandoene som ble brukt var acfma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 plot (lags, acfma2, xlimc (1,10), ylabr, typh, hoved ACF for MA (2) med theta1 0,5, theta20.3) abline (h0) xcarima. sim (n150, liste (mac (0,5, 0,3)) xxc10 plot (x, typeb, hoved Simulert MA (2) Serie) acf (x, xlimc (1,10) mainACF for simulert MA (2) Data) Vedlegg: Bevis på egenskaper av MA (1) For interesserte studenter, her er bevis for teoretiske egenskaper av MA (1) modellen. Varians: (tekst (xt) tekst (mu wt theta1 w) 0 tekst (wt) tekst (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Når h 1, er det forrige uttrykket 1 w 2. For ethvert h 2, . Årsaken er at ved definisjon av uavhengighet av wt. E (w k w j) 0 for noen k j. Videre, fordi w t har middelverdien 0, E (w jw j) E (w j 2) w 2. For en tidsserie, Bruk dette resultatet for å få ACF gitt ovenfor. En inverterbar MA-modell er en som kan skrives som en uendelig rekkefølge AR-modell som konvergerer slik at AR-koeffisientene konvergerer til 0 mens vi beveger oss uendelig tilbake i tiden. Vel demonstrere invertibility for MA (1) modellen. Vi erstatter deretter forholdet (2) for w t-1 i ligning (1) (3) (zt wt theta1 (z-theta1w) wt theta1z-tet2w) Ved tid t-2. (2) blir vi da erstatter forholdet (4) for w t-2 i ligning (3) (zt wt theta1z-teteta21wt theta1z-teteta21 (z-theta1w) wt theta1z-theta12z theta31w) Hvis vi skulle fortsette uendelig), ville vi få den uendelige rekkefølgen AR-modellen (zt wt theta1z - theta21z theta31z - theta41z prikker) Merk imidlertid at hvis 1 1, vil koeffisientene som multipliserer lagene av z, øke (uendelig) i størrelse når vi beveger oss tilbake i tid. For å forhindre dette, trenger vi 1 lt1. Dette er betingelsen for en inverterbar MA (1) modell. Uendelig Order MA-modell I uke 3 ser du at en AR (1) - modell kan konverteres til en uendelig rekkefølge MA-modell: (xt - mu wt phi1w phi21w prikker phik1 w dots sum phij1w) Denne summeringen av tidligere hvite støybetingelser er kjent som årsakssammenheng av en AR (1). Med andre ord, x t er en spesiell type MA med et uendelig antall vilkår som går tilbake i tid. Dette kalles en uendelig ordre MA eller MA (). En endelig ordre MA er en uendelig orden AR og en hvilken som helst endelig rekkefølge AR er en uendelig rekkefølge MA. Tilbakekall i uke 1, bemerket vi at et krav til en stasjonær AR (1) er at 1 lt1. Lar beregne Var (x t) ved hjelp av årsakssammensetningen. Dette siste trinnet bruker et grunnfakta om geometrisk serie som krever (phi1lt1) ellers ser serien ut. Navigasjon

No comments:

Post a Comment