Friday, January 6, 2017

Définition Du Modèle De Moyenne Mobile Autorégressive

Moyenne mobile autorégressive Modèles ARMA (p, q) pour l'analyse des séries chronologiques - Partie 3 Voici le troisième et dernier post de la mini-série sur les modèles ARMA (Autoregressive Moving Average) pour l'analyse des séries chronologiques. Nous avons introduit les modèles autorégressifs et les modèles Moyenne mobile dans les deux articles précédents. Maintenant, il est temps de les combiner pour produire un modèle plus sophistiqué. En fin de compte, cela nous amènera aux modèles ARIMA et GARCH qui nous permettront de prévoir les rendements des actifs et de prévoir la volatilité. Ces modèles constitueront la base des signaux commerciaux et des techniques de gestion des risques. Si vous avez lu la partie 1 et la partie 2, vous aurez vu que nous avons tendance à suivre un modèle pour notre analyse d'un modèle de série chronologique. Ill répéter brièvement ici: Justification - Pourquoi sommes-nous intéressés à ce modèle particulier Définition - Une définition mathématique pour réduire l'ambiguïté. Correlogramme - Tracer un échantillon de corrélogramme pour visualiser le comportement d'un modèle. Simulation et montage - Adapter le modèle à des simulations, afin de s'assurer que nous avons bien compris le modèle. Données financières réelles - Appliquer le modèle aux prix historiques réels des actifs. Prédiction - Prévoir les valeurs suivantes pour générer des signaux commerciaux ou des filtres. Pour suivre cet article, il est conseillé de jeter un coup d'oeil aux articles précédents sur l'analyse des séries chronologiques. Ils peuvent tous être trouvés ici. Critère d'information bayésienne Dans la partie 1 de cette série d'articles, nous avons examiné le critère d'information d'Akaike (AIC) comme moyen de nous aider à choisir entre les meilleurs modèles de séries temporelles. Un outil étroitement lié est le critère bayésien d'information (BIC). Essentiellement, il a un comportement similaire à l'AIC dans la mesure où il pénalise les modèles pour avoir trop de paramètres. Cela peut conduire à une surfaçon. La différence entre le BIC et l'AIC est que le BIC est plus sévère avec sa pénalisation de paramètres supplémentaires. Critère d'information bayésienne Si nous prenons la fonction de vraisemblance pour un modèle statistique, qui a k ​​paramètres, et L maximise la probabilité. Alors le critère d'information bayésien est donné par: où n est le nombre de points de données dans la série temporelle. Nous utiliserons l'AIC et le BIC ci-dessous pour choisir les modèles ARMA (p, q) appropriés. Ljung-Box Test Dans la partie 1 de cet article, Rajan mentionné dans les commentaires Disqus que le test de Ljung-Box était plus approprié que d'utiliser le Critère d'information Akaike du Critère d'information bayésienne pour décider si un modèle ARMA était un bon ajustement à un moment séries. Le test de Ljung-Box est un test d'hypothèse classique qui est conçu pour tester si un ensemble d'autocorrélations d'un modèle de séries chronologiques adaptées diffèrent significativement de zéro. Le test ne teste pas chaque lag individuel pour le hasard, mais teste plutôt le hasard sur un groupe de décalages. Ljung-Box Test Nous définissons l'hypothèse nulle comme: Les données de séries chronologiques à chaque décalage sont i. i.d .. c'est-à-dire que les corrélations entre les valeurs de série de population sont nulles. Nous définissons l'hypothèse alternative comme: Les données de séries chronologiques ne sont pas i. i.d. Et possèdent une corrélation en série. Nous calculons la statistique de test suivante. Q: Où n est la longueur de l'échantillon de séries temporelles, chapeau k est l'autocorrélation de l'échantillon au décalage k et h le nombre de décalages dans le test. La règle de décision pour rejeter l'hypothèse nulle est de vérifier si Q gt chi2, pour une distribution chi-carré avec h degrés de liberté au 100 (1-alpha) percentile. Alors que les détails du test peuvent sembler un peu complexes, nous pouvons en fait utiliser R pour calculer le test pour nous, simplifiant un peu la procédure. Maintenant que nous avons discuté du BIC et du test de Ljung-Box, nous étions prêts à discuter de notre premier modèle mixte, à savoir la moyenne mobile autorégressive d'ordre p, q ou ARMA (p, Q). À ce jour, nous avons considéré les processus autorégressifs et les processus de moyenne mobile. L'ancien modèle considère son propre comportement passé comme des intrants pour le modèle et, en tant que tel, tente de capter les effets des participants sur le marché, tels que l'élan et la réversion moyenne dans le négoce boursier. Ce dernier modèle est utilisé pour caractériser l'information sur les chocs dans une série, comme une annonce de surprise ou un événement imprévu (comme le déversement d'hydrocarbures BP Deepwater Horizon). Par conséquent, un modèle ARMA tente de saisir ces deux aspects lors de la modélisation des séries chronologiques financières. Il est à noter qu'un modèle ARMA ne prend pas en compte le regroupement de la volatilité, un phénomène empirique clé de nombreuses séries chronologiques financières. Ce n'est pas un modèle conditionnellement hétéroscédastique. Pour cela, nous devrons attendre les modèles ARCH et GARCH. Le modèle ARMA (p, q) est une combinaison linéaire de deux modèles linéaires et est donc lui-même linéaire: Moyenne mobile auto-régressive Modèle d'ordre p, q Un modèle de série temporelle, est un modèle de moyenne mobile autorégressif d'ordre p, q . Où est le bruit blanc avec E (wt) 0 et la variance sigma2. Si nous considérons l'opérateur de décalage vers l'arrière. (Voir un article précédent), alors nous pouvons réécrire ce qui précède en tant que fonction theta et phi de: On peut voir directement que, en posant p neq 0 et q0, on récupère le modèle AR (p). De même, si on pose p 0 et q neq 0 on récupère le modèle MA (q). L'une des principales caractéristiques du modèle ARMA est qu'elle est parcimonieuse et redondante dans ses paramètres. Autrement dit, un modèle ARMA nécessitera souvent moins de paramètres qu'un modèle AR (p) ou MA (q) seul. En outre, si nous réécrivons l'équation en termes de BSO, alors les polynômes theta et phi peuvent parfois partager un facteur commun, ce qui conduit à un modèle plus simple. Simulations et corrélogrammes Comme pour les modèles autorégressifs et de moyenne mobile, nous allons maintenant simuler diverses séries ARMA et tenter ensuite d'adapter les modèles ARMA à ces réalisations. Nous le faisons parce que nous voulons nous assurer que nous comprenons la procédure d'ajustement, y compris la façon de calculer les intervalles de confiance pour les modèles, ainsi que de s'assurer que la procédure réellement récupérer des estimations raisonnables pour les paramètres ARMA d'origine. Dans la partie 1 et la partie 2, nous avons construit manuellement les séries AR et MA en dessinant N échantillons à partir d'une distribution normale puis en élaborant le modèle de série temporelle en utilisant des décalages de ces échantillons. Cependant, il existe un moyen plus simple de simuler les données AR, MA, ARMA et ARIMA, simplement en utilisant la méthode arima. sim dans R. Commençons par le modèle ARMA non trivial le plus simple possible, à savoir ARMA (1,1 ) Modèle. C'est-à-dire, un modèle autorégressif d'ordre un combiné avec un modèle de moyenne mobile d'ordre un. Un tel modèle n'a que deux coefficients, alpha et bêta, qui représentent les premiers décalages de la série temporelle elle-même et les termes de bruit blanc de choc. Un tel modèle est donné par: Il faut préciser les coefficients avant la simulation. Prenons alpha 0.5 et beta -0.5: La sortie est la suivante: Laisse aussi tracer le corrélogramme: On voit qu'il n'y a pas d'autocorrélation significative, ce qui est à prévoir d'un modèle ARMA (1,1). Enfin, nous allons essayer de déterminer les coefficients et leurs erreurs standard en utilisant la fonction arima: Nous pouvons calculer les intervalles de confiance pour chaque paramètre à l'aide des erreurs standard: Les intervalles de confiance contiennent les vraies valeurs des paramètres pour les deux cas. 95 intervalles de confiance sont très larges (une conséquence des erreurs standard raisonnablement grandes). Essayons maintenant un modèle ARMA (2,2). C'est-à-dire un modèle AR (2) combiné à un modèle MA (2). Nous avons besoin de spécifier quatre paramètres pour ce modèle: alpha1, alpha2, beta1 et beta2. Prenons alpha1 0.5, alpha2-0.25 beta10.5 et beta2-0.3: La sortie de notre modèle ARMA (2,2) est la suivante: Et l'autocorelation correspondante: Nous pouvons maintenant essayer d'adapter un modèle ARMA (2,2) à Les données: On peut aussi calculer les intervalles de confiance pour chaque paramètre: Noter que les intervalles de confiance pour les coefficients de la composante moyenne mobile (beta1 et beta2) ne contiennent pas réellement la valeur du paramètre d'origine. Cependant, à des fins commerciales, nous avons juste besoin d'avoir un pouvoir prédictif qui dépasse le hasard et produit suffisamment de bénéfice au-dessus des coûts de transaction, afin d'être rentable dans les données. le long terme. Maintenant que nous avons vu quelques exemples de modèles ARMA simulés, nous avons besoin d'un mécanisme pour choisir les valeurs de p et q lors de l'ajustement des modèles aux données financières réelles. Choisir le meilleur modèle ARMA (p, q) Pour déterminer quel ordre p, q du modèle ARMA est approprié pour une série, il faut utiliser l'AIC (ou BIC) sur un sous-ensemble de valeurs pour p, q, et Puis appliquez l'essai de Ljung-Box pour déterminer si un bon ajustement a été obtenu, pour des valeurs particulières de p, q. Pour montrer cette méthode, nous allons d'abord simuler un processus ARMA (p, q) particulier. Nous ferons ensuite une boucle sur toutes les valeurs par paires de p dans et q dans et calculons l'AIC. Nous allons sélectionner le modèle avec l'AIC le plus bas et ensuite exécuter un test Ljung-Box sur les résidus pour déterminer si nous avons atteint un bon ajustement. Commençons par simuler une série ARMA (3,2): Nous allons maintenant créer un objet final pour stocker le meilleur ajustement du modèle et la valeur AIC la plus faible. Nous faisons une boucle sur les différentes combinaisons p, q et utilisons l'objet courant pour stocker l'ajustement d'un modèle ARMA (i, j) pour les variables de boucle i et j. Si l'AIC actuel est inférieur à tout AIC calculé précédemment, nous avons défini l'AIC final à cette valeur courante et sélectionnez cet ordre. A la fin de la boucle, nous avons l'ordre du modèle ARMA stocké dans final. order et l'ARIMA (p, d, q) s'ajustent lui-même (avec le composant d intégré à 0) stocké comme final. arma: , De l'ordre et des coefficients ARIMA: on voit que l'ordre initial du modèle ARMA simulé a été récupéré, à savoir avec p3 et q2. Nous pouvons tracer le corelogramme des résidus du modèle pour voir s'ils ressemblent à une réalisation de bruit blanc discret (DWN): Le corelogramme ressemble en effet à une réalisation de DWN. Enfin, nous effectuons l'essai de Ljung-Box pour 20 lags pour confirmer ceci: Notez que la valeur p est supérieure à 0,05, ce qui indique que les résidus sont indépendants au niveau 95 et donc un modèle ARMA (3,2) fournit un Bonne tenue modèle. Il est clair que cela devrait être le cas puisque nous avons simulé les données nous-mêmes. Cependant, c'est précisément la procédure que nous utiliserons lorsque nous allons adapter des modèles ARMA (p, q) à l'index SampP500 dans la section suivante. Données financières Maintenant que nous avons décrit la procédure pour choisir le modèle de série temporelle optimal pour une série simulée, il est assez simple de l'appliquer aux données financières. Pour cet exemple, nous allons de nouveau choisir l'indice SampP500 US Equity. Permet de télécharger les prix quotidiens de clôture à l'aide de quantmod et de créer ensuite le flux de retours de logs: Lets la même procédure d'ajustement que pour la série ARMA (3,2) simulée ci-dessus sur la série logs retour du SampP500 en utilisant l'AIC: A l'ordre ARMA (3,3): Permet de tracer les résidus du modèle ajusté dans le journal logique SampP500 journalier flux: Notez qu'il ya quelques pics significatifs, surtout à des décalages plus élevés. Ceci est indicatif d'un mauvais ajustement. Nous allons effectuer un test de Ljung-Box pour voir si nous avons des preuves statistiques pour cela: Comme nous le soupçonnons, la valeur p est inférieure à 0,05 et en tant que tel nous ne pouvons pas dire que les résidus sont une réalisation de bruit blanc discret. Il existe donc une autocorrélation supplémentaire dans les résidus qui n'est pas expliquée par le modèle ARMA (3, 3). Prochaines étapes Comme nous l'avons vu tout au long dans cette série d'articles, nous avons vu des preuves d'hétéroscédasticité conditionnelle (regroupement de volatilité) dans la série SampP500, en particulier dans les périodes autour de 2007-2008. Lorsque nous utiliserons un modèle GARCH plus tard dans la série d'articles, nous verrons comment éliminer ces autocorrélations. En pratique, les modèles ARMA ne sont jamais en règle générale bons pour les rendements des actions log. Nous devons prendre en compte l'hétéroscédasticité conditionnelle et utiliser une combinaison d'ARIMA et de GARCH. L'article suivant considérera ARIMA et montrera comment le composant intégré diffère du modèle ARMA que nous avons envisagé dans cet article. Cliquez ci-dessous pour en savoir plus. L'information contenue sur ce site web est l'opinion des auteurs individuels basée sur leur observation personnelle, leur recherche et leurs années d'expérience. L'éditeur et ses auteurs ne sont pas des conseillers en placement, des avocats, des CPA ou d'autres professionnels des services financiers enregistrés et ne rendent pas de conseils juridiques, fiscaux, comptables, de placement ou autres services professionnels. L'information offerte par ce site Web est seulement l'éducation générale. Parce que chaque situation factuelle des individus est différente, le lecteur devrait chercher son conseiller personnel. Ni l'auteur ni l'éditeur n'assument aucune responsabilité ou responsabilité pour des erreurs ou omissions et n'a aucune responsabilité ni responsabilité envers une personne ou une entité à l'égard des dommages causés ou prétendument causés directement ou indirectement par les informations contenues sur ce site. À utiliser à vos risques et périls. En outre, ce site Web peut recevoir une compensation financière des sociétés mentionnées par la publicité, les programmes d'affiliation ou autrement. Les tarifs et offres des annonceurs affichés sur ce site Web changent fréquemment, parfois sans préavis. Alors que nous nous efforçons de maintenir des informations exactes et en temps opportun, les détails de l'offre peuvent être périmés. Les visiteurs doivent donc vérifier les modalités de ces offres avant de participer à ces offres. L'auteur et son éditeur déclinent toute responsabilité quant à la mise à jour de l'information et déclinent toute responsabilité concernant le contenu, les produits et les services de tiers, y compris lorsqu'ils sont accessibles par l'entremise d'hyperliens et / ou d'annonces sur ce site. La documentation est le moyen inconditionnel du processus et x03C8 (L) Rationnel, polynôme opérateur de retard à degré infini, (1 x03C8 1 L x0C2 2 L 2 x 2026). Remarque: La propriété Constant d'un objet modèle arima correspond à c. Et non la moyenne inconditionnelle 956. Par décomposition de Wolds 1. L'équation 5-12 correspond à un processus stochastique stationnaire pourvu que les coefficients x03C8 i soient absolument sommables. C'est le cas lorsque le polynôme AR, x03D5 (L). Est stable. Ce qui signifie que toutes ses racines se situent en dehors du cercle unité. De plus, le processus est causal à condition que le polynôme MA soit inversible. Ce qui signifie que toutes ses racines se situent en dehors du cercle unité. Econometrics Toolbox applique la stabilité et l'inversibilité des processus ARMA. Lorsque vous spécifiez un modèle ARMA en utilisant arima. Vous obtenez une erreur si vous entrez des coefficients qui ne correspondent pas à un polynôme AR stable ou à un polynôme MA inversible. De même, l'estimation impose des contraintes de stationnarité et d'inversibilité pendant l'estimation. Références 1 Wold, H. Une étude dans l'analyse des séries chronologiques stationnaires. (P, q) Modèles pour l'analyse des séries chronologiques - partie 1 Dans le dernier article, nous avons examiné les marches aléatoires et le bruit blanc comme des modèles de série chronologique de base pour certains instruments financiers , Tels que les cours quotidiens des actions et des indices boursiers. Nous avons constaté que dans certains cas un modèle de marche aléatoire était insuffisant pour capturer le comportement d'autocorrélation complet de l'instrument, ce qui motive des modèles plus sophistiqués. Dans les deux prochains articles, nous allons discuter de trois types de modèle, à savoir le modèle autorégressif (AR) d'ordre p, le modèle de moyenne mobile (MO) d'ordre q et le modèle de la moyenne mobile déplacée (ARMA) mixte de l'ordre p , Q. Ces modèles nous aideront à tenter de saisir ou d'expliquer davantage la corrélation sérielle présente dans un instrument. En fin de compte, ils nous fourniront un moyen de prévoir les prix futurs. Cependant, il est bien connu que les séries chronologiques financières possèdent une propriété connue sous le nom de regroupement de la volatilité. Autrement dit, la volatilité de l'instrument n'est pas constante dans le temps. Le terme technique de ce comportement est connu sous le nom d'hétéroscédasticité conditionnelle. Comme les modèles AR, MA et ARMA ne sont pas conditionnellement hétéroscédasticisés, c'est-à-dire qu'ils ne tiennent pas compte de la volatilité, nous aurons besoin d'un modèle plus sophistiqué pour nos prédictions. De tels modèles incluent le modèle Hectoroskedastic conditionnel (ARCH) et le modèle Hectoroskedastic conditionnel (GARCH), et les nombreuses variantes de celui-ci. GARCH est particulièrement bien connu en finance quantitative et est principalement utilisé pour des simulations de séries chronologiques financières comme moyen d'estimer le risque. Cependant, comme avec tous les articles QuantStart, je veux construire ces modèles à partir de versions plus simples afin que nous puissions voir comment chaque nouvelle variante change notre capacité de prédiction. Malgré le fait que AR, MA et ARMA sont des modèles de séries temporelles relativement simples, ils sont à la base de modèles plus compliqués tels que la moyenne mobile intégrée (ARIMA) et la famille GARCH. Il est donc important que nous les étudions. Une de nos premières stratégies de négociation dans la série d'articles de séries chronologiques sera de combiner ARIMA et GARCH afin de prévoir les prix n périodes à l'avance. Cependant, nous devrons attendre jusqu'à ce que nous ayons discuté à la fois ARIMA et GARCH séparément avant de les appliquer à une véritable stratégie. Comment allons-nous? Dans cet article, nous allons présenter quelques nouveaux concepts de séries chronologiques qui ont besoin des autres méthodes, La stationnarité et le critère d'information Akaike (AIC). À la suite de ces nouveaux concepts, nous suivrons le modèle traditionnel pour l'étude de nouveaux modèles de séries temporelles: Rationale - La première tâche est de fournir une raison pour laquelle ils étaient intéressés par un modèle particulier, comme quants. Pourquoi introduisons-nous le modèle de la série chronologique Quels effets peut-il capturer Que gagnons-nous (ou perdons) en ajoutant une complexité supplémentaire Définition - Nous devons fournir la définition mathématique complète (et la notation associée) du modèle de série chronologique afin de minimiser Toute ambiguïté. Propriétés de second ordre - Nous allons discuter (et dans certains cas dériver) les propriétés du second ordre du modèle de série chronologique, qui comprend sa moyenne, sa variance et sa fonction d'autocorrélation. Correlogramme - Nous utiliserons les propriétés du second ordre pour tracer un corrélogramme d'une réalisation du modèle de série chronologique afin de visualiser son comportement. Simulation - Nous simulerons les réalisations du modèle de la série temporelle et ensuite adaptons le modèle à ces simulations pour nous assurer d'avoir des implémentations précises et de comprendre le processus d'ajustement. Données financières réelles - Nous allons adapter le modèle de la série chronologique aux données financières réelles et considérer le corrélogramme des résidus afin de voir comment le modèle tient compte de la corrélation série dans la série originale. Prédiction - Nous allons créer des prévisions n-step ahead du modèle de série chronologique pour des réalisations particulières afin de produire finalement des signaux de trading. Presque tous les articles que j'écris sur les modèles de séries chronologiques vont tomber dans ce modèle et il nous permettra de comparer facilement les différences entre chaque modèle que nous ajoutons plus de complexité. Nous allions commencer par regarder la stationnarité stricte et l'AIC. Strictement stationnaire Nous avons fourni la définition de stationnarité dans l'article sur la corrélation sérielle. Toutefois, étant donné que nous allons entrer dans le domaine de nombreuses séries financières, avec diverses fréquences, nous devons nous assurer que nos modèles (éventuels) tiennent compte de la volatilité variable dans le temps de ces séries. En particulier, nous devons considérer leur hétéroscédasticité. Nous rencontrerons cette question lorsque nous essaierons d'adapter certains modèles à des séries historiques. D'une manière générale, on ne peut tenir compte de la totalité de la corrélation sérielle dans les résidus des modèles ajustés sans tenir compte de l'hétéroscédasticité. Cela nous ramène à la stationnarité. Une série n'est pas stationnaire dans la variance si elle a une volatilité variable dans le temps, par définition. La stationnalité stricte de la série A est rigoureusement stationnaire si la distribution statistique conjointe des éléments x, ldots, x est la même que celle de xm, ldots, xm, Pour tout ti, m. On peut penser à cette définition simplement que la distribution de la série temporelle est inchangée pour tout changement abrégé dans le temps. En particulier, la moyenne et la variance sont constantes dans le temps pour une série strictement stationnaire et l'autocovariance entre xt et xs (disons) ne dépend que de la différence absolue de t et s, t-s. Nous reviendrons sérieusement stationnaire dans les futurs postes. Critère d'information Akaike J'ai mentionné dans les articles précédents que nous aurions éventuellement besoin d'examiner comment choisir entre les meilleurs modèles distincts. Cela est vrai non seulement de l'analyse des séries chronologiques, mais aussi de l'apprentissage automatique et, plus généralement, des statistiques en général. Les deux principales méthodes que nous utiliserons (à l'heure actuelle) sont le Critère d'information Akaike (AIC) et le Critère d'information bayésien (au fur et à mesure que nous progressons dans nos articles sur les statistiques bayésiennes). Considérons brièvement l'AIC, car il sera utilisé dans la partie 2 de l'ARMA article. AIC est essentiellement un outil pour aider à la sélection de modèles. Autrement dit, si nous avons une sélection de modèles statistiques (y compris des séries chronologiques), alors l'AIC estime la qualité de chaque modèle, par rapport aux autres que nous avons disponibles. Il est basé sur la théorie de l'information. Qui est un sujet très intéressant, profond que malheureusement nous ne pouvons pas entrer dans trop de détails au sujet. Il essaie d'équilibrer la complexité du modèle, qui dans ce cas signifie le nombre de paramètres, avec la façon dont il correspond aux données. Nous fournissons une définition: Akaike Critère d'information Si nous prenons la fonction de vraisemblance pour un modèle statistique, qui a k ​​paramètres, et L maximise la probabilité. Alors le critère d'information Akaike est donné par: Le modèle préféré, à partir d'une sélection de modèles, a le minimum AIC du groupe. Vous pouvez voir que l'AIC croît au fur et à mesure que le nombre de paramètres, k, augmente, mais est réduit si la probabilité logarithmique négative augmente. Essentiellement, il pénalise les modèles qui sont overfit. Nous allons créer des modèles AR, MA et ARMA de différents ordres et une façon de choisir le meilleur modèle adapté à un ensemble de données particulier est d'utiliser l'AIC. C'est ce que bien faire dans l'article suivant, principalement pour les modèles ARMA. Autoregressive (AR) Modèles d'ordre p Le premier modèle va être considéré, qui forme la base de la partie 1, est le modèle autorégressif d'ordre p, souvent raccourci à AR (p). Dans l'article précédent, nous avons considéré la marche aléatoire. Où chaque terme, xt dépend uniquement du terme précédent, x et un terme de bruit blanc stochastique, wt: Le modèle autorégressif est simplement une extension de la marche aléatoire qui inclut des termes plus loin dans le temps. La structure du modèle est linéaire. C'est-à-dire que le modèle dépend linéairement des termes précédents, avec des coefficients pour chaque terme. C'est d'où provient le régressif en autorégressif. Il s'agit essentiellement d'un modèle de régression où les termes précédents sont les prédicteurs. Modèle autorégressif d'ordre p Un modèle de série temporelle,, est un modèle autorégressif d'ordre p. AR (p), si: begin xt alpha1 x ldots alphap x wt somme p alphai x wt fin Où est le bruit blanc et alphai dans mathbb, avec alphap neq 0 pour un processus autorégressif p-order. Si nous considérons l'opérateur de décalage vers l'arrière. (Voir l'article précédent), alors nous pouvons réécrire ce qui précède en tant que fonction theta de: begin thetap () xt (1 - alpha1 - alpha2 2 - ldots - alphap) xt wt end Peut-être la première chose à noter sur le modèle AR (p) Est qu'une marche aléatoire est simplement AR (1) avec alpha1 égal à l'unité. Comme nous l'avons indiqué ci-dessus, le modèle auto - gressif est une extension de la marche aléatoire, ce qui est logique. Il est facile de faire des prédictions avec le modèle AR (p), pour tout temps t, car une fois que nous avons les coefficients alpha déterminés, Devient tout simplement: commencer hat t alpha1 x ldots alphap x fin Ainsi, nous pouvons faire des prévisions à l'avance en produisant chapeau, chapeau, chapeau, etc jusqu'à chapeau. En fait, une fois que nous considérerons les modèles ARMA dans la partie 2, nous utiliserons la fonction R predict pour créer des prévisions (avec les bandes d'intervalles de confiance des erreurs standard) qui nous aideront à produire des signaux commerciaux. Stationarité pour les processus autorégressifs L'un des aspects les plus importants du modèle AR (p) est qu'il n'est pas toujours stationnaire. En effet, la stationnarité d'un modèle particulier dépend des paramètres. Ive a abordé ce sujet dans un article précédent. Afin de déterminer si un processus AR (p) est stationnaire ou non, nous devons résoudre l'équation caractéristique. L'équation caractéristique est simplement le modèle autorégressif, écrit en mode de changement de direction, mis à zéro: nous résolvons cette équation pour. Pour que le processus autorégressif particulier soit stationnaire, il faut que toutes les valeurs absolues des racines de cette équation dépassent l'unité. C'est une propriété extrêmement utile et nous permet de calculer rapidement si un processus AR (p) est stationnaire ou non. Prenons quelques exemples pour concrétiser cette idée: Random Walk - Le processus AR (1) avec alpha1 1 a l'équation caractéristique theta 1 -. De toute évidence, cela a racine 1 et en tant que tel n'est pas stationnaire. AR (1) - Si on choisit alpha1 frac on obtient xt frac x wt. Ceci nous donne une équation caractéristique de 1 - frac 0, qui a une racine 4 gt 1 et donc ce processus AR (1) particulier est stationnaire. AR (2) - Si l'on place alpha1 alpha2 frac alors on obtient xt frac x frac x wt. Son équation caractéristique devient - frac () () 0, ce qui donne deux racines de 1, -2. Comme il s'agit d'une racine unitaire, il s'agit d'une série non stationnaire. Cependant, d'autres séries AR (2) peuvent être stationnaires. Propriétés du second ordre La moyenne d'un processus AR (p) est nulle. Cependant, les autocovariances et les autocorrélations sont données par des fonctions récursives, connues sous le nom d'équations de Yule-Walker. Les propriétés complètes sont données ci-dessous: begin mux E (xt) 0 fin begin gammak somme p alphai gamma, enspace k 0 fin début rhok somme p alphai rho, enspace k 0 end Notez qu'il est nécessaire de connaître les valeurs des paramètres alphai avant Calculer les autocorrélations. Maintenant que nous avons indiqué les propriétés du second ordre, nous pouvons simuler différents ordres de AR (p) et tracer les corrélogrammes correspondants. Simulations et corrélogrammes Commençons par un processus AR (1). Ceci est similaire à une marche aléatoire, sauf que alpha1 ne doit pas être égal à l'unité. Notre modèle va avoir alpha1 0,6. Le code R pour créer cette simulation est donné comme suit: Notez que notre boucle for est exécutée de 2 à 100, pas 1 à 100, comme xt-1 lorsque t0 n'est pas indexable. De même pour les processus AR (p) de rang supérieur, t doit aller de p à 100 dans cette boucle. Nous pouvons tracer la réalisation de ce modèle et son corrélogramme associé à l'aide de la fonction de mise en page: Nous allons maintenant essayer d'adapter un processus AR (p) aux données simulées que nous venons de générer, pour voir si nous pouvons récupérer les paramètres sous-jacents. Vous vous rappellerez peut-être que nous avons effectué une procédure similaire dans l'article sur le bruit blanc et les randonnées aléatoires. Comme il s'avère R fournit une commande utile ar pour s'adapter modèles autorégressifs. Nous pouvons utiliser cette méthode pour nous indiquer d'abord le meilleur ordre p du modèle (tel que déterminé par l'AIC ci-dessus) et nous fournir des estimations de paramètres pour l'alphai, que nous pouvons ensuite utiliser pour former des intervalles de confiance. Pour compléter, nous pouvons recréer la série x: Maintenant, nous utilisons la commande ar pour ajuster un modèle autorégressif à notre processus AR (1) simulé, en utilisant l'estimation du maximum de vraisemblance (MLE) comme procédure d'ajustement. Nous allons d'abord extraire l'ordre le mieux obtenu: La commande ar a déterminé avec succès que notre modèle temporel sous-jacent est un processus AR (1). Nous pouvons alors obtenir les estimations des paramètres alpha: La procédure MLE a produit une estimation, chapeau 0.523, qui est légèrement inférieure à la valeur vraie de alpha1 0.6. Enfin, nous pouvons utiliser l'erreur standard (avec la variance asymptotique) pour construire 95 intervalles de confiance autour du (des) paramètre (s) sous-jacent (s). Pour cela, il suffit de créer un vecteur c (-1.96, 1.96) et de le multiplier par l'erreur-type: Le paramètre vrai tombe dans l'intervalle de confiance 95, comme nous l'avons supposé, nous avons généré la réalisation à partir du modèle spécifiquement . Que diriez-vous si nous changeons l'alpha1 -0.6 Comme précédemment nous pouvons adapter un modèle AR (p) en utilisant ar: Encore une fois nous récupérons l'ordre correct du modèle, avec une très bonne estimation hat -0.597 d'alpha1-0.6. Nous voyons également que le paramètre vrai tombe à nouveau dans l'intervalle de confiance 95. Ajoutons un peu plus de complexité à nos processus autorégressifs en simulant un modèle d'ordre 2. En particulier, nous allons définir alpha10.666, mais aussi définir alpha2 -0.333. Heres le code complet pour simuler et tracer la réalisation, ainsi que le corrélogramme pour une telle série: Comme avant, nous pouvons voir que le corrélogramme diffère de façon significative de celui du bruit blanc, comme wed attendre. Il existe des pics statistiquement significatifs à k1, k3 et k4. Une fois de plus, allions utiliser la commande ar pour adapter un modèle AR (p) à notre réalisation AR (2) sous-jacente. La procédure est similaire à celle de l'ajustement AR (1): l'ordre correct a été récupéré et les estimations du paramètre hat 0.696 et hat -0.395 ne sont pas trop éloignées des vraies valeurs des paramètres alpha 10.666 et alpha2-0.333. Notez que nous recevons un message d'avertissement de convergence. Notez également que R utilise réellement la fonction arima0 pour calculer le modèle AR. Les modèles AR (p) sont tout simplement des modèles ARIMA (p, 0, 0), et donc un modèle AR est un cas particulier d'ARIMA sans composante de moyenne mobile (MA). Eh bien également utiliser la commande arima pour créer des intervalles de confiance autour de plusieurs paramètres, c'est pourquoi weve négligé de le faire ici. Maintenant que nous avons créé des données simulées, il est temps d'appliquer les modèles AR (p) aux séries chronologiques des actifs financiers. Données financières Amazon Inc. Commençons par obtenir le prix de l'action pour Amazon (AMZN) en utilisant quantmod comme dans le dernier article: La première tâche est de toujours tracer le prix pour une inspection visuelle brève. Dans ce cas, bien utiliser les prix de clôture quotidiens: Vous remarquerez que quantmod ajoute un formatage pour nous, à savoir la date, et un graphique un peu plus joli que les graphiques habituels R: Nous allons maintenant prendre les retours logarithmiques d'AMZN, puis le premier - ordre de la série afin de convertir la série de prix d'origine d'une série non stationnaire en une série (potentiellement) stationnaire. Cela nous permet de comparer les pommes aux pommes entre les actions, les indices ou tout autre actif, à utiliser dans les statistiques multivariées ultérieures, comme lors du calcul d'une matrice de covariance. Si vous souhaitez une explication détaillée de la raison pour laquelle les retours de journaux sont préférables, jetez un oeil à cet article sur Quantivity. Permet de créer une nouvelle série, amznrt. Pour tenir notre journal différencié retours: Encore une fois, nous pouvons tracer la série: À ce stade, nous voulons tracer le corrélogramme. Nous cherchions à voir si la série différenciée ressemble à du bruit blanc. Si ce n'est pas le cas, il existe une corrélation sérielle inexpliquée, qui pourrait être expliquée par un modèle autorégressif. Nous remarquons un pic statistiquement significatif à k2. Il existe donc une possibilité raisonnable de corrélation série inexpliquée. Soyez conscient cependant que cela peut être dû à un biais d'échantillonnage. Ainsi, nous pouvons essayer d'adapter un modèle AR (p) à la série et de produire des intervalles de confiance pour les paramètres: L'ajustement du modèle autorégressif AR à la série de prix différentiels de premier ordre produit un modèle AR (2) avec un chapeau -0,0278 Et chapeau -0.0687. Ive produit également la variance aystoptotique de sorte que nous pouvons calculer des erreurs standard pour les paramètres et produire des intervalles de confiance. Nous voulons voir si le zéro fait partie de l'intervalle de confiance 95, comme s'il l'est, cela réduit notre confiance que nous avons un vrai processus AR (2) sous-jacent pour la série AMZN. Pour calculer les intervalles de confiance au niveau 95 pour chaque paramètre, nous utilisons les commandes suivantes. Nous prenons la racine carrée du premier élément de la matrice de variance asymptotique pour produire une erreur standard, puis créons des intervalles de confiance en les multipliant par -1.96 et 1.96 respectivement, pour le niveau 95: Notez que cela devient plus simple quand on utilise la fonction arima , Mais bien attendre la partie 2 avant de l'introduire correctement. Ainsi, nous pouvons voir que pour alpha1, zéro est contenu dans l'intervalle de confiance, tandis que pour alpha2, zéro n'est pas contenu dans l'intervalle de confiance. Par conséquent, nous devrions être très prudents en pensant que nous avons vraiment un modèle AR (2) génératif sous-jacent pour l'AMZN. En particulier, nous notons que le modèle autorégressif ne prend pas en compte le regroupement de la volatilité, ce qui conduit à regroupement de la corrélation sérielle dans les séries chronologiques financières. Quand nous considérons les modèles ARCH et GARCH dans des articles ultérieurs, nous en tiendrons compte. Lorsque nous utiliserons la fonction arima complète dans l'article suivant, nous ferons des prédictions de la série de prix du journal journalier afin de nous permettre de créer des signaux commerciaux. SampP500 US Equity Index Avec les actions individuelles, nous pouvons également considérer l'indice des actions américaines, le SampP500. Appliquons toutes les commandes précédentes à cette série et produisons les parcelles comme précédemment: Nous pouvons tracer les prix: Comme avant, bien créer la différence de premier ordre des prix de clôture de log: Encore une fois, nous pouvons tracer la série: Il est clair À partir de ce graphique que la volatilité n'est pas stationnaire dans le temps. Ceci est également reflété dans l'intrigue du corrélogramme. Il existe de nombreux pics, dont k1 et k2, qui sont statistiquement significatifs au-delà d'un modèle de bruit blanc. En outre, nous constatons des processus à mémoire longue car il existe des pics statistiquement significatifs à k16, k18 et k21: En fin de compte, nous aurons besoin d'un modèle plus sophistiqué qu'un modèle autorégressif d'ordre p. Cependant, à ce stade, nous pouvons toujours essayer d'adapter un tel modèle. Voyons ce que nous obtenons si nous le faisons: L'utilisation de ar produit un modèle AR (22), c'est-à-dire un modèle avec 22 paramètres non nuls. Qu'est-ce que cela nous indique? Il est indicatif qu'il ya probablement beaucoup plus de complexité dans la corrélation sérielle que Un modèle linéaire simple des prix passés peut vraiment expliquer. Cependant, nous le savions déjà parce que nous pouvons voir qu'il existe une corrélation sérielle significative dans la volatilité. Par exemple, considérons la période très volatile autour de 2008. Cela motive le prochain ensemble de modèles, à savoir la moyenne mobile (q) et l'ARMA (p, q). Eh bien apprendre à propos de ces deux dans la partie 2 de cet article. Comme nous le mentionnons à plusieurs reprises, ces derniers nous mèneront finalement à la famille des modèles ARIMA et GARCH, qui fourniront tous deux un meilleur ajustement à la complexité de corrélation sérielle du Samp500. Cela nous permettra d'améliorer sensiblement nos prévisions et de produire finalement des stratégies plus rentables. Cliquez ci-dessous pour en savoir plus. L'information contenue sur ce site web est l'opinion des auteurs individuels basée sur leur observation personnelle, leur recherche et leurs années d'expérience. L'éditeur et ses auteurs ne sont pas des conseillers en placement, des avocats, des CPA ou d'autres professionnels des services financiers enregistrés et ne rendent pas de conseils juridiques, fiscaux, comptables, de placement ou autres services professionnels. L'information offerte par ce site Web est seulement l'éducation générale. Parce que chaque situation factuelle des individus est différente, le lecteur devrait chercher son conseiller personnel. Ni l'auteur ni l'éditeur n'assument aucune responsabilité ou responsabilité pour des erreurs ou omissions et n'a aucune responsabilité ni responsabilité envers une personne ou une entité à l'égard des dommages causés ou prétendument causés directement ou indirectement par les informations contenues sur ce site. À utiliser à vos risques et périls. En outre, ce site Web peut recevoir une compensation financière des sociétés mentionnées par la publicité, les programmes d'affiliation ou autrement. Les tarifs et offres des annonceurs affichés sur ce site Web changent fréquemment, parfois sans préavis. Alors que nous nous efforçons de maintenir des informations exactes et en temps opportun, les détails de l'offre peuvent être périmés. Les visiteurs doivent donc vérifier les modalités de ces offres avant de participer à ces offres. L'auteur et son éditeur déclinent toute responsabilité quant à la mise à jour des informations et déclinent toute responsabilité concernant le contenu, les produits et les services de tiers, y compris lorsqu'ils sont accessibles par le biais d'hyperliens et / ou d'annonces sur ce site.


No comments:

Post a Comment