Autoregressiva glidande medelvärde simulering


Autoregressiva rörliga medelfelprocesser (ARMA-fel) och andra modeller som innefattar felaktigheter kan beräknas med hjälp av FIT-satser och simuleras eller prognoseras med hjälp av SOLVE-satser. ARMA-modeller för felprocessen används ofta för modeller med autokorrelerade rester. AR-makro kan användas för att specificera modeller med autoregressiva felprocesser. MA-makro kan användas för att specificera modeller med felaktiga felprocesser. Autoregressiva fel En modell med första ordningens autoregressiva fel, AR (1), har formen medan en AR (2) felprocess har formen och så vidare för högre orderprocesser. Observera att s är oberoende och identiskt fördelade och har ett förväntat värde på 0. Ett exempel på en modell med en AR (2) - komponent är och så vidare för processer med högre order. Till exempel kan du skriva en enkel linjär regressionsmodell med MA (2) glidande medelfel som MA1 och MA2 är de rörliga genomsnittsparametrarna. Observera att RESID. Y definieras automatiskt av PROC MODEL, eftersom ZLAG-funktionen måste användas för MA-modeller för att styra rekursionen av lagren. Detta säkerställer att de fördröjda felen startar vid noll i lagfasningsfasen och sprider inte saknade värden när fördröjningsperiodens variabler saknas och det säkerställer att framtida fel är noll snarare än att missa under simulering eller prognos. För detaljer om lagfunktionerna, se avsnittet Laglogik. Denna modell som skrivs med MA-makroen är som följer: Allmän form för ARMA-modeller Den allmänna ARMA-processen (p, q) har följande formulär En ARMA (p, q) modell kan specificeras enligt följande: där AR i och MA j representerar De autoregressiva och rörliga genomsnittsparametrarna för de olika lagren. Du kan använda namnen du vill ha för dessa variabler, och det finns många likvärdiga sätt att specifikationen kan skrivas. Vector ARMA-processer kan också beräknas med PROC MODEL. Exempelvis kan en tvåvariabel AR (1) - process för fel av de två endogena variablerna Y1 och Y2 specificeras enligt följande: Konvergensproblem med ARMA-modellerna ARMA-modeller kan vara svåra att uppskatta. Om parametrisuppskattningarna inte ligger inom det rätta intervallet, ökar de återstående termerna för rörliga genomsnittsmodeller exponentiellt. De beräknade resterna för senare observationer kan vara mycket stora eller kan överflöda. Detta kan hända antingen för att felaktiga startvärden användes eller för att iterationerna flyttade bort från rimliga värden. Vård bör användas vid val av startvärden för ARMA-parametrar. Startvärden på 0,001 för ARMA-parametrar fungerar vanligtvis om modellen passar data väl och problemet är välkonditionerat. Observera att en MA-modell ofta kan approximeras med en AR-modell med hög ordning och vice versa. Detta kan resultera i hög kollinearitet i blandade ARMA-modeller, vilket i sin tur kan orsaka allvarliga felkänslor vid beräkningarna och instabiliteten hos parametrisuppskattningarna. Om du har konvergensproblem när du beräknar en modell med ARMA-felprocesser, försök att uppskatta i steg. Använd först ett FIT-uttalande för att bara beräkna strukturparametrarna med ARMA-parametrarna som hålls noll (eller till rimliga tidigare uppskattningar om det finns tillgängligt). Använd sedan ett annat FIT-uttalande för att bara uppskatta ARMA-parametrarna, med hjälp av strukturparametervärdena från den första loppet. Eftersom värdena för de strukturella parametrarna sannolikt kommer att ligga nära sina slutliga uppskattningar, kan ARMA-parameterns uppskattningar nu konvergeras. Slutligen, använd ett annat FIT-uttalande för att producera simultana uppskattningar av alla parametrar. Eftersom parameterns initialvärden sannolikt kommer att ligga ganska nära sina slutliga gemensamma uppskattningar, bör uppskattningarna konvergeras snabbt om modellen är lämplig för data. AR Initiala villkor De första lagren av felvillkoren för AR (p) - modeller kan modelleras på olika sätt. De autoregressiva felstartsmetoderna som stöds av SASETS-procedurer är följande: villkorliga minsta kvadrater (ARIMA och MODEL-procedurer) ovillkorliga minsta kvadrater (AUTOREG, ARIMA och MODEL-procedurer) högsta sannolikhet (AUTOREG, ARIMA och MODEL-procedurer) Yule-Walker (AUTOREG Endast proceduren) Hildreth-Lu, som tar bort de första p-observationerna (endast MODEL-proceduren) Se kapitel 8, AUTOREG-proceduren, för en förklaring och diskussion om fördelarna med olika AR (p) startmetoder. CLS, ULS, ML och HL initialiseringar kan utföras av PROC MODEL. För AR (1) fel kan dessa initialiseringar framställas som visas i tabell 18.2. Dessa metoder är ekvivalenta i stora prover. Tabell 18.2 Initialiseringar utförs av PROC MODEL: AR (1) FEL De inledande tecknen på felvillkoren för MA (q) modeller kan också modelleras på olika sätt. Följande felaktiga startparametrar för glidande medel stöds av ARIMA - och MODEL-procedurerna: villkorliga minsta kvadrater villkorliga minsta kvadrater Den villkorliga minsta kvadreringsmetoden för att uppskatta glidvillkor för glidande medel är inte optimal eftersom den ignorerar startproblemet. Detta minskar effektiviteten av uppskattningarna, även om de förbli objektiva. De initiala fördröjda resterna, som sträcker sig före datas början, antas vara 0, deras ovillkorliga förväntade värde. Detta introducerar en skillnad mellan dessa residualer och de generaliserade minsta kvadratresidanserna för den rörliga genomsnittliga kovariansen, som, till skillnad från den autogegrativa modellen, fortsätter genom datasatsen. Vanligtvis konvergerar denna skillnad snabbt till 0, men för nästan oföränderliga rörliga medelprocesser är konvergensen ganska långsam. För att minimera detta problem borde du ha mycket data, och de rörliga genomsnittliga parametervärdena borde ligga inom det inverterbara intervallet. Detta problem kan korrigeras på bekostnad av att skriva ett mer komplext program. Otillräckliga minsta kvadrater uppskattningar för MA (1) processen kan produceras genom att ange modellen enligt följande: Flyttande medelfel kan vara svår att uppskatta. Du bör överväga att använda en AR (p) approximation till den rörliga genomsnittliga processen. En rörlig genomsnittsprocess kan vanligtvis vara väl approximerad av en autoregressiv process om data inte har blivit utjämnade eller avvikit. AR Macro SAS-makro AR genererar programmeringsanvisningar för PROC MODEL för autoregressiva modeller. AR-makroen är en del av SASETS-programvaran, och inga speciella alternativ behöver ställas in för att använda makroen. Den autoregressiva processen kan appliceras på strukturella ekvationsfel eller själva endogena serierna. AR-makro kan användas för följande typer av autoregression: obegränsad vektorautoregression begränsad vektorautoregression Univariate Autoregression För att modellera felet i en ekvation som en autogegressiv process, använd följande uttalande efter ekvationen: Anta exempelvis att Y är en linjär funktion av X1, X2 och ett AR (2) fel. Du skulle skriva denna modell enligt följande: Samtalen till AR måste komma efter alla ekvationer som processen gäller. Den föregående makrouppkallingen, AR (y, 2), ger de uttalanden som visas i LIST-utgången i Figur 18.58. Figur 18.58 LIST Alternativutgång för en AR (2) - modell PRED-prefixade variabler är temporära programvariabler som används så att resterna av resterna är de korrekta resterna och inte de som omdefinieras av denna ekvation. Observera att detta motsvarar de uttalanden som uttryckligen skrivits i avsnittet Allmän Form för ARMA-modeller. Du kan också begränsa de autoregressiva parametrarna till noll vid valda lags. Om du till exempel vill ha autregressiva parametrar på lag 1, 12 och 13 kan du använda följande påståenden: Dessa uttalanden genererar utgången som visas i Figur 18.59. Figur 18.59 LIST Alternativutgång för en AR-modell med Lags på 1, 12 och 13 MODEL-procedurlistan för kompilerad programkodsförklaring som analyserad PRED. yab x1 c x2 RESID. y PRED. y - FAKTIV. J. ERROR. y PRED. y-y OLDPRED. y PRED. y yl1 ZLAG1 (y-perdy) yl12 ZLAG12 (y-perdy) yl13 ZLAG13 (y-perdy) RESID. y PRED. y - AKTUELL. JUL ERROR. y PRED. y - y Det finns variationer på den villkorliga minsta kvadratmetoden, beroende på om observationer i början av serien används för att värma upp AR-processen. Som standard använder AR-villkoret minst kvadratmetoden alla observationer och antar nollor för de första lagren av autoregressiva termer. Genom att använda M-alternativet kan du begära att AR använder istället den ovillkorliga minsta kvadraten (ULS) eller maximal sannolikhet (ML) - metoden. Exempelvis ges diskussioner om dessa metoder i avsnittet AR Initial Conditions. Genom att använda MCLS n-alternativet kan du begära att de första n-observationerna används för att beräkna uppskattningar av de initiala autoregressiva lagren. I det här fallet börjar analysen med observation n 1. Till exempel: Du kan använda AR-makroet att tillämpa en autoregressiv modell på den endogena variablen, istället för att felfunktionen, genom att använda TYPEV-alternativet. Om du till exempel vill lägga till de fem övergångarna av Y till ekvationen i föregående exempel kan du använda AR för att generera parametrarna och lags genom att använda följande påståenden: De föregående stegen genererar utgången som visas i Figur 18.60. Figur 18.60 LIST Alternativutgång för en AR-modell av Y Denna modell förutsäger Y som en linjär kombination av X1, X2, en avlyssning och Y-värdena under de senaste fem perioderna. Obegränsad vektorautoregression För att modellera felvillkoren för en uppsättning ekvationer som en vektorautoregressiv process, använd följande form av AR-makroet efter ekvationerna: Processnamnvärdet är ett namn som du tillhandahåller för AR att använda för att skapa namn för den autoregressiva parametrar. Du kan använda AR-makroet för att modellera flera olika AR-processer för olika uppsättningar av ekvationer genom att använda olika processnamn för varje uppsättning. Processnamnet ser till att de använda variabla namnen är unika. Använd ett kort processnamnvärde för processen om parametervärden ska skrivas till en utdatasats. AR-makroen försöker konstruera parameternamn mindre än eller lika med åtta tecken, men detta är begränsat av längden på processnamnet. som används som prefix för AR-parameterns namn. Variabellistans värde är listan över endogena variabler för ekvationerna. Antag exempelvis att fel för ekvationerna Y1, Y2 och Y3 genereras av en andra ordningsvektor-autoregressiv process. Du kan använda följande påståenden: som genererar följande för Y1 och liknande kod för Y2 och Y3: Endast metoden med villkorlig minsta kvadrat (MCLS eller MCLS n) kan användas för vektorprocesser. Du kan också använda samma blankett med begränsningar att koefficientmatrisen är 0 vid valda lags. Till exempel tillämpar följande påståenden en tredje ordningens vektorprocess till ekvationsfel med alla koefficienterna vid lag 2 begränsad till 0 och med koefficienterna i lag 1 och 3 obegränsad: Du kan modellera de tre serierna Y1Y3 som en vektorautoregressiv process i variablerna istället för i fel genom att använda alternativet TYPEV. Om du vill modellera Y1Y3 som en funktion av tidigare värden av Y1Y3 och vissa exogena variabler eller konstanter, kan du använda AR för att generera uttalandena för lagtermerna. Skriv en ekvation för varje variabel för den ickeautoregressiva delen av modellen och ring sedan AR med alternativet TYPEV. Till exempel kan den ickeautoregressiva delen av modellen vara en funktion av exogena variabler, eller det kan vara avlyssna parametrar. Om det inte finns några exogena komponenter i vektorgrafikstyrningsmodellen, inklusive inga avlyssningar, tilldela noll till var och en av variablerna. Det måste finnas en uppgift till var och en av variablerna innan AR heter. Detta exempel modellerar vektorn Y (Y1 Y2 Y3) som en linjär funktion endast av dess värde under de föregående två perioderna och en vit brusfelvektor. Modellen har 18 parametrar (3 3 3 3). Syntax av AR-makro Det finns två fall av syntakten i AR-makroen. När restriktioner för en AR-vektor inte behövs, har syntakten i AR-makro den allmänna formen specificerar ett prefix för AR att använda för att konstruera namn på variabler som behövs för att definiera AR-processen. Om endolisten inte anges anges den endogena listan som namn. vilket måste vara namnet på ekvationen som AR-felprocessen ska tillämpas på. Namnvärdet får inte överstiga 32 tecken. är ordningen för AR-processen. specificerar listan över ekvationer som AR-processen ska tillämpas på. Om mer än ett namn ges, skapas en obegränsad vektorprocess med strukturella rester av alla ekvationer som ingår som regressorer i var och en av ekvationerna. Om inte specificerat, standardiseras endolist för att namnge. specificerar listan över lags där AR-termerna ska läggas till. Koefficienterna för termen vid listor som inte är listade är satt till 0. Alla listade lags måste vara mindre än eller lika med nlag. och det får inte finnas några duplikat. Om inte specificerat laglar laglistan till alla lag 1 till nlag. specificerar beräkningsmetoden som ska genomföras. Giltiga värden för M är CLS (beräknade minsta kvadrater), ULS (ovillkorliga minsta kvadrater uppskattningar) och ML (maximala sannolikhetsvärderingar). MCLS är standard. Endast MCLS tillåts när mer än en ekvation är angiven. ULS - och ML-metoderna stöds inte för vektor AR-modeller av AR. specificerar att AR-processen ska appliceras på de endogena variablerna istället för att de strukturella resterna av ekvationerna. Begränsad Vector Autoregression Du kan styra vilka parametrar som ingår i processen, vilket begränsar till 0 de parametrar som du inte inkluderar. Först använd AR med alternativet DEFER att deklarera variabelistan och definiera processens dimension. Använd sedan ytterligare AR-samtal för att generera termer för valda ekvationer med valda variabler i valda lags. De felaktigheter som produceras är till exempel följande: Den här modellen anger att felen för Y1 beror på felet i både Y1 och Y2 (men inte Y3) i båda lagren 1 och 2 och att felen för Y2 och Y3 beror på De tidigare felen för alla tre variablerna men endast i lag 1. AR Macro Syntax för begränsad vektor AR En alternativ användning av AR tillåts att införa restriktioner på en AR-vektorprocess genom att ringa AR flera gånger för att ange olika AR-termer och låter för olika ekvationer. Det första samtalet har den allmänna formen anger ett prefix för att AR ska kunna använda vid konstruktion av namn på variabler som behövs för att definiera vektor AR-processen. specificerar ordningen för AR-processen. specificerar listan över ekvationer som AR-processen ska tillämpas på. specificerar att AR inte ska generera AR-processen utan att vänta på ytterligare information som anges i senare AR-samtal för samma namnvärde. De efterföljande samtalen har den allmänna formen är densamma som i det första samtalet. specificerar listan över ekvationer som specifikationerna i detta AR-samtal ska tillämpas på. Endast namn som anges i endolistvärdet för det första samtalet för namnsvärdet kan visas i listan över ekvationer i eqlist. specificerar listan över ekvationer vars fördröjda konstruktionsrester ska inkluderas som regressorer i ekvationerna i eqlist. Endast namn i endolisten för det första samtalet för namnvärdet kan visas i varlist. Om inte specificerat, varla standardinställningar till endolist. specificerar listan över lags där AR-termerna ska läggas till. Koefficienterna för termen vid listor som inte är listade är satt till 0. Alla listade lags måste vara mindre än eller lika med värdet av nlag. och det får inte finnas några duplikat. Om inte specificerat, laglista standardvärdena till alla lag 1 till nlag. MA Macro SAS makro MA genererar programmeringsanvisningar för PROC MODEL för rörliga genomsnittsmodeller. MA-makroen är en del av SASETS-programvaran, och inga speciella alternativ behövs för att använda makroen. Felprocessen för glidande medel kan appliceras på strukturella ekvationsfel. Syntaxen för MA-makroen är densamma som AR-makroet, förutom att det inte finns något TYP-argument. När du använder MA och AR-makronen, måste MA-makroet följa AR-makro. Följande SASIML-satser ger en ARMA (1, (3)) felprocess och sparar den i datamängden MADAT2. Följande PROC MODEL-satser används för att uppskatta parametrarna för denna modell med hjälp av största sannolikhetsfelstruktur: Uppskattningarna av parametrarna som produceras av denna körning visas i Figur 18.61. Figur 18.61 Uppskattningar från en ARMA (1, (3)) Process Det finns två fall av syntaxen för MA-makro. När restriktioner på en vektor MA-process inte behövs har syntaxen i MA-makroen den allmänna formen specificerar ett prefix för MA att använda vid konstruktion av namn på variabler som behövs för att definiera MA-processen och är standardendolisten. är ordningen för MA-processen. specificerar ekvationerna som MA-processen ska tillämpas på. Om mer än ett namn ges, används CLS-estimering för vektorns process. specificerar lagren där MA-termerna ska läggas till. Alla listade lags måste vara mindre än eller lika med nlag. och det får inte finnas några duplikat. Om inte specificerat laglar laglistan till alla lag 1 till nlag. specificerar beräkningsmetoden som ska genomföras. Giltiga värden för M är CLS (beräknade minsta kvadrater), ULS (ovillkorliga minsta kvadrater uppskattningar) och ML (maximala sannolikhetsvärderingar). MCLS är standard. Endast MCLS tillåts när mer än en ekvation är specificerad i endolisten. MA Macro-syntax för begränsad vektor Flytta-medelvärde En alternativ användning av MA tillåts att införa restriktioner på en vektor MA-process genom att ringa MA flera gånger för att ange olika MA-termer och lags för olika ekvationer. Det första samtalet har den allmänna formen specificerar ett prefix för MA att använda vid konstruktion av namn på variabler som behövs för att definiera vektorn MA-processen. specificerar ordningen för MA-processen. specificerar listan över ekvationer som MA-processen ska tillämpas på. specificerar att MA inte ska generera MA-processen utan att vänta på ytterligare information som anges i senare MA-samtal för samma namnvärde. De efterföljande samtalen har den allmänna formen är densamma som i det första samtalet. specificerar listan över ekvationer som specifikationerna i detta MA-samtal ska tillämpas på. specificerar listan över ekvationer vars fördröjda konstruktionsrester ska inkluderas som regressorer i ekvationerna i eqlist. specificerar listan över lags där MA-termerna ska läggas till. Utöverskridande Moving-Average Simulation (First Order) Demonstrationen är inställd så att samma slumpmässiga serie punkter används oavsett hur konstanterna är och varieras. När kvoten kvotknappsknappen trycks in kommer en ny slumpmässig serie att genereras och användas. Genom att hålla slumpmässiga serien identiska kan användaren se exakt effekterna på ARMA-serien av förändringar i de två konstanterna. Konstanten är begränsad till (-1,1) eftersom divergensen av ARMA-serien resulterar när. Demonstrationen är endast för en första orderprocess. Ytterligare AR-villkor skulle möjliggöra att mer komplexa serier genereras, medan ytterligare MA-termer skulle öka utjämningen. För en detaljerad beskrivning av ARMA-processer, se exempelvis G. Box, G. M. Jenkins och G. Reinsel, tidsserieanalys: prognos och kontroll. Tredje ed. Englewood Cliffs, NJ: Prentice-Hall, 1994. RELATERADE LINKSAutoregressive Moving Average ARMA (p, q) Modeller för Time Series Analysis - Del 3 Detta är det tredje och sista inlägget i miniserien på AROR - tidsserieanalys. Weve introducerade autoregressiva modeller och rörande genomsnittsmodeller i de två tidigare artiklarna. Nu är det dags att kombinera dem för att producera en mer sofistikerad modell. I slutändan leder detta oss till ARIMA - och GARCH-modellerna som gör det möjligt för oss att förutsäga avkastning och prognosvolatilitet. Dessa modeller kommer att ligga till grund för handelssignaler och riskhanteringstekniker. Om du har läst del 1 och del 2 har du sett att vi tenderar att följa ett mönster för vår analys av en tidsseriemodell. Jag upprepar det kortfattat här: Rationale - Varför är vi intresserade av denna speciella modell Definition - En matematisk definition för att minska tvetydigheten. Korrelogram - Plottar ett provkorrelogram för att visualisera ett modells beteende. Simulering och montering - Montera modellen för simuleringar, för att säkerställa att vi har förstått modellen korrekt. Verkliga finansiella data - Använd modellen till reala historiska tillgångspriser. Prediction - Prognos efterföljande värden för att bygga handelssignaler eller filter. För att följa denna artikel är det lämpligt att ta en titt på de tidigare artiklarna om tidsserieanalys. De kan alla hittas här. Bayesian Information Criterion I del 1 i denna artikel ser vi på Akaike Information Criterion (AIC) som ett sätt att hjälpa oss att välja mellan separata bästa tidsseriemodeller. Ett nära relaterat verktyg är Bayesian Information Criterion (BIC). I huvudsak har det liknande beteende för AIC genom att det straffar modeller för att ha för många parametrar. Detta kan leda till överfitting. Skillnaden mellan BIC och AIC är att BIC är strängare med dess bestraffning av ytterligare parametrar. Bayesian Information Criterion Om vi ​​tar sannolikhetsfunktionen för en statistisk modell, som har k parametrar, och L maximerar sannolikheten. då anges Bayesian Information Criterion av: där n är antalet datapunkter i tidsserierna. Vi använder AIC och BIC nedan när du väljer lämpliga ARMA (p, q) modeller. Ljung-Box Test I del 1 i denna artikel berättar serien Rajan som nämns i Disqus att Ljung-Box-testet var mer lämpligt än att använda Akaike Informationskriterium för Bayesian Information Criterion för att avgöra om en ARMA-modell var en bra passform till en tid serier. Ljung-Box-testet är ett klassiskt hypotesprov som är utformat för att testa om en uppsättning autokorrelationer av en anpassad tidsseriemodell skiljer sig avsevärt från noll. Testet testar inte varje enskild lag för slumpmässighet, utan testar slumpmässigt över en grupp lags. Ljung-Box Test Vi definierar nollhypotesen som: Tidsseriedata vid varje lag är i. i.d .. det vill säga korrelationerna mellan befolkningsserievärdena är noll. Vi definierar den alternativa hypotesen som: Tidsseriedata är inte i. i.d. och har seriekorrelation. Vi beräknar följande teststatistik. Q: Där n är längden på tidsserieprovet, är h k samplingsautokorrelationen vid lag k och h är antalet lags under testet. Beslutsregeln om huruvida nollhypotesen skall avvisas är att kontrollera om Q gt chi2, för en chi-kvadrerade fördelning med h grader av frihet vid 100 (1-alfa) procenten. Medan detaljerna i testet kan verka lite komplexa, kan vi faktiskt använda R för att beräkna testet för oss, förenkla förfarandet något. Autogressive Moving Average (ARMA) Modeller av order p, q Nu när vi diskuterade BIC och Ljung-Box-testet var vi redo att diskutera vår första blandade modell, nämligen det autoregressiva rörliga genomsnittet av order p, q eller ARMA (p, q). Hittills har vi övervägt autentegressiva processer och rörliga genomsnittliga processer. Den tidigare modellen betraktar sitt eget tidigare beteende som ingångar för modellen och som sådan försöker fånga marknadsaktörseffekter, såsom momentum och medelåtervändning i aktiehandel. Den sistnämnda modellen används för att karakterisera chockinformation till en serie, till exempel ett meddelande om överraskning eller en oväntad händelse (till exempel BP Deepwater Horizon oljeutsläpp). Därför försöker en ARMA-modell att fånga båda dessa aspekter vid modellering av finansiella tidsserier. Observera att en ARMA-modell inte tar hänsyn till volatilitetsklypning, ett viktigt empiriskt fenomen i många finansiella tidsserier. Det är inte en villkorligt heteroscedastisk modell. För det behöver vi vänta på ARCH och GARCH-modellerna. Definition ARMA (p, q) modellen är en linjär kombination av två linjära modeller och är sålunda fortfarande linjär: Autoregressiv Moving Average Modell av order p, q En tidsseriemodell,, är en autoregressiv rörlig genomsnittsmodell av order p, q . ARMA (p, q), om: börjar xt alfa1 x alfa2 x ldot wt beta1 w beta2 w ldots betaq w slut Var är vitt brus med E (wt) 0 och varians sigma2. Om vi ​​betraktar Backward Shift Operator. (se en tidigare artikel) då kan vi skriva om ovanstående som en funktion theta och phi: Vi kan enkelt se det genom att ställa p neq 0 och q0 vi återställer AR (p) modellen. På samma sätt om vi ställer p 0 och q neq 0 återställer vi MA (q) modellen. En av huvudfunktionerna i ARMA-modellen är att den är parsimonisk och redundant i sina parametrar. Det innebär att en ARMA-modell ofta kräver färre parametrar än en AR (p) eller MA (q) modell ensam. Dessutom om vi skriver om ekvationen i form av BSO, kan theta och phi-polynomerna ibland dela en gemensam faktor, vilket leder till en enklare modell. Simuleringar och korrelogram Som med de autoregressiva och rörliga genomsnittsmodellerna simulerar vi nu olika ARMA-serier och försöker sedan anpassa ARMA-modellerna till dessa realisationer. Vi utför det här eftersom vi vill se till att vi förstår anpassningsförfarandet, inklusive hur man beräknar konfidensintervaller för modellerna, samt se till att förfarandet faktiskt återhämtar rimliga uppskattningar för de ursprungliga ARMA-parametrarna. I del 1 och del 2 konstruerade vi manuellt AR - och MA-serien genom att dra N-prov från en normal fördelning och sedan skapa den specifika tidsseriemodellen med hjälp av lager av dessa prover. Det finns emellertid ett enklare sätt att simulera AR, MA, ARMA och till och med ARIMA-data, helt enkelt genom att använda arima. sim-metoden i R. Lets börja med den enklaste möjliga icke-triviala ARMA-modellen, nämligen ARMA (1,1 ) modell. Det vill säga en autoregressiv modell av order en kombinerad med en rörlig genomsnittsmodell av order en. En sådan modell har bara två koefficienter, alfa och beta, vilka representerar de första lagren i tidsserierna själv och de chocka vita ljudvillkoren. En sådan modell ges av: Vi måste ange koefficienterna före simulering. Låt oss ta alfa 0,5 och beta -0,5: Utmatningen är enligt följande: Låt oss även plotta korrelogrammet: Vi kan se att det inte finns någon signifikant autokorrelation, vilket kan förväntas från en ARMA (1,1) modell. Slutligen kan vi försöka bestämma koefficienterna och deras standardfel med hjälp av arima-funktionen: Vi kan beräkna konfidensintervallen för varje parameter med hjälp av standardfel: konfidensintervallen innehåller de sanna parametervärdena för båda fallen, men vi bör notera att 95 konfidensintervaller är mycket brett (en följd av de rimligt stora standardfel). Låt oss nu prova en ARMA (2,2) modell. Det vill säga en AR (2) modell kombinerad med en MA (2) modell. Vi måste ange fyra parametrar för denna modell: alpha1, alpha2, beta1 och beta2. Låt oss ta alpha1 0.5, alpha2-0.25 beta10.5 och beta2-0.3: Utgången från vår ARMA (2,2) modell är enligt följande: Och motsvarande autokorelering: Vi kan nu försöka montera en ARMA (2,2) modell för att data: Vi kan också beräkna konfidensintervallerna för varje parameter: Observera att konfidensintervallet för koefficienterna för den rörliga genomsnittskomponenten (beta1 och beta2) inte innehåller det ursprungliga parametervärdet. Detta beskriver risken att försöka anpassa modeller till data även när vi känner till de sanna parametervärdena. För handelsändamål behöver vi bara ha en prediktiv kraft som överstiger chansen och ger tillräckligt med vinst över transaktionskostnaderna för att vara lönsamt i på lång sikt. Nu när vi har sett några exempel på simulerade ARMA-modeller behöver vi mekanism för att välja värdena på p och q när de anpassas till modellerna till verkliga ekonomiska data. Välja den bästa ARMA-modellen (p, q) För att bestämma vilken ordning p, q av ARMA-modellen är lämplig för en serie, måste vi använda AIC (eller BIC) över en delmängd av värden för p, q och använd sedan Ljung-Box testet för att bestämma om en bra passform har uppnåtts, för speciella värden p, q. För att visa denna metod ska vi för det första simulera en särskild ARMA (p, q) - process. Vi släpper sedan över alla parvisvärden av p i och q in och beräknar AIC. Vi väljer modellen med lägsta AIC och kör sedan ett Ljung-Box-test på rester för att avgöra om vi har uppnått en bra passform. Låt oss börja med att simulera en ARMA-serie (3,2): Vi ska nu skapa ett objekt som är slutligt för att lagra den bästa modellens passform och lägsta AIC-värde. Vi slår över de olika kombinationerna p, q och använder det aktuella objektet för att lagra passformen för en ARMA (i, j) modell för loopingvariablerna i och j. Om den aktuella AIC är mindre än någon tidigare beräknad AIC ställer vi den slutliga AIC till det aktuella värdet och väljer den ordningen. Vid avslutning av slingan har vi ARMA-modellen som lagras i final. order och ARIMA (p, d, q) passar sig (med den integrerade d-komponenten som är inställd på 0) lagrad som final. arma: Låt utmatning AIC , ordning och ARIMA-koefficienter: Vi kan se att den ursprungliga ordningen för den simulerade ARMA-modellen återhämtades, nämligen med p3 och q2. Vi kan plotta korelogrammet av resterna av modellen för att se om de ser ut som en realisering av diskret vitt brus (DWN): Korelogrammet ser verkligen ut som en realisering av DWN. Slutligen utför vi Ljung-Box-testet för 20 lags för att bekräfta detta: Observera att p-värdet är större än 0,05, vilket säger att residualerna är oberoende på 95-nivå och sålunda ger en ARMA (3,2) modell en bra modell passform. Det är klart att detta borde vara fallet eftersom vi har simulerat data själva. Men det här är just det förfarande vi ska använda när vi kommer att passa ARMA (p, q) modeller till SampP500-indexet i följande avsnitt. Finansiella data Nu när vi har beskrivit förfarandet för att välja den optimala tidsseriemodellen för en simulerad serie är det ganska enkelt att tillämpa det på finansiella data. För det här exemplet kommer vi återigen att välja SampP500 US Equity Index. Låter ladda ner de dagliga stängningskurserna med hjälp av quantmod och skapa sedan loggen returnerar strömmen: Låt oss utföra samma passande procedur som för den simulerade ARMA-serien (3,2) ovan på loggen returnerar serien av SampP500 med hjälp av AIC: den bästa passande modellen har ordning ARMA (3,3): Låt plottar resterna av den monterade modellen till SampP500-loggdagens returflöde: Observera att det finns några betydande toppar, särskilt vid högre lags. Detta indikerar en dålig passform. Låt oss utföra ett Ljung-Box-test för att se om vi har statistiska bevis för detta: Som vi misstänkt är p-värdet mindre än 0,05 och som sådan kan vi inte säga att återstoden är en realisering av diskret vitt brus. Därför finns ytterligare autokorrelation i rester som inte förklaras av den monterade ARMA-modellen (3,3). Nästa steg Som vi har diskuterat hela tiden i den här artikelserien har vi sett bevis på betingad heteroscedasticitet (volatilitetsklypning) i SampP500-serien, särskilt under perioderna 2007-2008. När vi använder en GARCH-modell senare i artikelserien ser vi hur man eliminerar dessa autokorrelationer. I praktiken är ARMA-modellerna i allmänhet aldrig bra passar för återgången till loggarna. Vi måste ta hänsyn till den betingade heteroscedasticiteten och använda en kombination av ARIMA och GARCH. Nästa artikel kommer att överväga ARIMA och visa hur den integrerade komponenten skiljer sig från den ARMA-modell som vi har övervägt i den här artikeln. Bara Komma igång med kvantitativ handel

Comments

Popular posts from this blog

24option handels video