Monday 20 November 2017

Mover médio sempre estacionário


4.2 Modelos estacionários lineares para séries temporais onde a variável aleatória é chamada de inovação porque representa a parte da variável observada que é imprevisível, dado os valores passados. O modelo geral (4.4) assume que é a saída de um filtro linear que transforma as inovações passadas, ou seja, é um processo linear. Este pressuposto de linearidade é baseado no teorema de decomposição de Wolds (Wold 1938) que diz que qualquer processo discreto de covariância estacionária pode ser expresso como a soma de dois processos não correlacionados, onde é puramente determinista e é um processo puramente indeterminista que pode ser escrito como linear Soma do processo de inovação: onde é uma seqüência de variáveis ​​aleatórias não correlacionadas em série com média zero e variância comum. A condição é necessária para a estacionararia. A formulação (4.4) é uma reparametrização finita da representação infinita (4.5) - (4.6) com constante. Geralmente, é escrito em termos do operador de lag definido por, que dá uma expressão mais curta: onde os polinômios do operador de atraso e são chamados de polinômio e polinômio, respectivamente. Para evitar a redundância de parâmetros, assumimos que não existem fatores comuns entre os componentes e os componentes. Em seguida, estudaremos o enredo de algumas séries temporais geradas por modelos estacionários com o objetivo de determinar os principais padrões de sua evolução temporal. A Figura 4.2 inclui duas séries geradas a partir dos seguintes processos estacionários computados por meio do gencher quantlet: Figura 4.2: séries temporais geradas por modelos Como esperado, ambas as séries temporais se movem em torno de um nível constante sem alterações de variação devido à propriedade estacionária. Além disso, esse nível é próximo ao meio teórico do processo, e a distância de cada ponto para esse valor é muito raramente fora dos limites. Além disso, a evolução da série mostra as saídas locais da média do processo, que é conhecido como o comportamento de reversão médio que caracteriza as séries temporais estacionárias. Vamos estudar com algum detalhe as propriedades dos diferentes processos, em particular, a função de autocovariância que captura as propriedades dinâmicas de um processo estocástico estacionário. Esta função depende das unidades de medida, de modo que a medida usual do grau de linearidade entre as variáveis ​​é o coeficiente de correlação. No caso de processos estacionários, o coeficiente de autocorrelação no lag, denotado por, é definido como a correlação entre e: Assim, a função de autocorrelação (ACF) é a função de autocovariância padronizada pela variância. As propriedades do ACF são: Dada a propriedade de simetria (4.10), o ACF geralmente é representado por meio de um gráfico de barras nos atrasos não negativos que se chama correlograma simples. Outra ferramenta útil para descrever a dinâmica de um processo estacionário é a função de autocorrelação parcial (PACF). O coeficiente de autocorrelação parcial em lag mede a associação linear entre e ajustado para os efeitos dos valores intermediários. Portanto, é apenas o coeficiente no modelo de regressão linear: as propriedades do PACF são equivalentes às da ACF (4.8) - (4.10) e é fácil provar isso (Box e Jenkins, 1976). Como o ACF, a função de autocorrelação parcial não depende das unidades de medida e é representada por meio de um gráfico de barras nos atrasos não negativos que se chama correlograma parcial. As propriedades dinâmicas de cada modelo estacionário determinam uma forma particular dos correlogramas. Além disso, pode-se mostrar que, para qualquer processo estacionário, ambas as funções, ACF e PACF, aproximam-se de zero à medida que o atraso tende para o infinito. Os modelos nem sempre são processos estacionários, pelo que é necessário primeiro determinar as condições de estacionaridade. Existem subclasses de modelos que possuem propriedades especiais para estudá-las separadamente. Assim, quando e, é um processo de ruído branco. Quando, é um processo de ordem média móvel puro. , E quando é um processo autoregressivo puro de ordem. . 4.2.1 Processo de ruído branco O modelo mais simples é um processo de ruído branco, onde é uma seqüência de variáveis ​​médias zero não correlacionadas com variação constante. É denotado por. Esse processo é estacionário se sua variância for finita, já que: verifica condições (4.1) - (4.3). Além disso, não está correlacionado ao longo do tempo, então a função de autocovariância é: a Figura 4.7 mostra duas séries temporais simuladas geradas a partir de processos com média e parâmetros zero e -0,7, respectivamente. O parâmetro autorregressivo mede a persistência de eventos passados ​​nos valores atuais. Por exemplo, se um choque positivo (ou negativo) afeta positivamente (ou negativamente) por um período de tempo maior, maior o valor de. Quando, a série se move mais grosseiramente em torno da média devido à alternância na direção do efeito de, isto é, um choque que afeta positivamente no momento, tem efeitos negativos sobre, positivos. O processo é sempre inversível e está parado quando o parâmetro do modelo é constrangido para ficar na região. Para provar a condição estacionária, primeiro escrevemos a forma média móvel por substituição recursiva de (4.14): Figura 4.8: correlogramas de população para processos, ou seja, é uma soma ponderada de inovações passadas. Os pesos dependem do valor do parâmetro: quando, (ou), a influência de uma determinada inovação aumenta (ou diminui) ao longo do tempo. Levando expectativas para (4.15) para calcular a média do processo, obtemos: Dado que, o resultado é uma soma de termos infinitos que converge para todo o valor somente se, nesse caso. Um problema semelhante aparece quando calculamos o segundo momento. A prova pode ser simplificada assumindo que, isto é,. Então, a variância é: novamente, a variância vai para o infinito, exceto para, nesse caso. É fácil verificar que tanto a média quanto a variância explodem quando essa condição não se mantém. A função de autocovariância de um processo estacionário é, portanto, a função de autocorrelação para o modelo estacionário é: ou seja, o correlograma mostra uma decomposição exponencial com valores positivos sempre se for positivo e com oscilações positivas negativas se for negativo (ver figura 4.8). Além disso, a taxa de decadência diminui à medida que aumenta, portanto, quanto maior o valor, maior será a correlação dinâmica no processo. Finalmente, há um corte na função de autocorrelação parcial no primeiro intervalo. Figura 4.9: correlogramas da população para os processos Pode-se mostrar que o processo geral (Box e Jenkins 1976): é estacionário somente se as raízes da equação característica do polinômio estiverem fora do círculo da unidade. A média de um modelo estacionário é. É sempre inversível para qualquer valor dos parâmetros. Sua ACF vai para zero de forma exponencial quando as raízes são reais ou com flutuações de onda de seno-cosseno quando elas são complexas. Seu PACF tem um corte no atraso, ou seja. Alguns exemplos de Os correlogramas para modelos mais complexos, como o, podem ser vistos na figura 4.9. Eles são muito semelhantes aos padrões quando os processos têm raízes reais, mas tomam uma forma muito diferente quando as raízes são complexas (veja o primeiro par de gráficos da figura 4.9). 4.2.4 Modelo de média móvel auto-agressiva O modelo de ordens de modificação vertical autoregressiva geral (ordem finita), é: Modelos de suavização média e exponencial em movimento Como um primeiro passo para se deslocar além de modelos médios, modelos de caminhada aleatórios e modelos de tendência linear não-sazonais Padrões e tendências podem ser extrapolados usando um modelo de média móvel ou suavização. O pressuposto básico por trás da média e dos modelos de suavização é que as séries temporais são localmente estacionárias com uma média que varia lentamente. Por isso, tomamos uma média móvel (local) para estimar o valor atual da média e, em seguida, use isso como a previsão para um futuro próximo. Isso pode ser considerado como um compromisso entre o modelo médio e o modelo random-walk-without-drift. A mesma estratégia pode ser usada para estimar e extrapolar uma tendência local. Uma média móvel geralmente é chamada de uma versão quotsmoothedquot da série original porque a média a curto prazo tem o efeito de suavizar os solavancos na série original. Ao ajustar o grau de alisamento (a largura da média móvel), podemos esperar encontrar algum tipo de equilíbrio ideal entre o desempenho dos modelos de caminhada aleatória e média. O tipo mais simples de modelo de média é o. Média Móvel simples (igualmente ponderada): A previsão para o valor de Y no tempo t1 que é feita no tempo t é igual à média simples das observações m mais recentes: (Aqui e em outro lugar usarei o símbolo 8220Y-hat8221 para repousar Para uma previsão das séries temporais Y feitas o mais cedo possível por um determinado modelo.) Esta média é centrada no período t (m1) 2, o que implica que a estimativa da média local tende a ficar para trás do verdadeiro Valor da média local em cerca de (m1) 2 períodos. Assim, dizemos que a idade média dos dados na média móvel simples é (m1) 2 em relação ao período para o qual a previsão é calculada: esta é a quantidade de tempo pelo qual as previsões tenderão a atrasar os pontos de viragem nos dados . Por exemplo, se você estiver calculando a média dos últimos 5 valores, as previsões serão cerca de 3 períodos atrasados ​​na resposta a pontos de viragem. Observe que se m1, o modelo de média móvel simples (SMA) é equivalente ao modelo de caminhada aleatória (sem crescimento). Se m for muito grande (comparável ao comprimento do período de estimativa), o modelo SMA é equivalente ao modelo médio. Tal como acontece com qualquer parâmetro de um modelo de previsão, é costume ajustar o valor de k para obter o melhor quotfitquot para os dados, ou seja, os menores erros de previsão em média. Aqui é um exemplo de uma série que parece exibir flutuações aleatórias em torno de uma média que varia lentamente. Primeiro, vamos tentar ajustá-lo com um modelo de caminhada aleatória, o que equivale a uma média móvel simples de 1 termo: o modelo de caminhada aleatória responde muito rapidamente às mudanças na série, mas ao fazê-lo, elege muito da quotnoisequot no Dados (as flutuações aleatórias), bem como o quotsignalquot (a média local). Se, em vez disso, tentemos uma média móvel simples de 5 termos, obtemos um conjunto de previsões mais lisas: a média móvel simples de 5 meses produz erros significativamente menores do que o modelo de caminhada aleatória neste caso. A idade média dos dados nesta previsão é de 3 ((51) 2), de modo que tende a atrasar os pontos de viragem em cerca de três períodos. (Por exemplo, uma desaceleração parece ter ocorrido no período 21, mas as previsões não se desviam até vários períodos depois). Observe que as previsões de longo prazo do modelo SMA são uma linha reta horizontal, assim como na caminhada aleatória modelo. Assim, o modelo SMA assume que não há tendência nos dados. No entanto, enquanto as previsões do modelo de caminhada aleatória são simplesmente iguais ao último valor observado, as previsões do modelo SMA são iguais a uma média ponderada de valores recentes. Os limites de confiança calculados pela Statgraphics para as previsões de longo prazo da média móvel simples não se ampliam à medida que o horizonte de previsão aumenta. Isso obviamente não está correto. Infelizmente, não existe uma teoria estatística subjacente que nos diga como os intervalos de confiança devem se ampliar para esse modelo. No entanto, não é muito difícil calcular estimativas empíricas dos limites de confiança para as previsões do horizonte mais longo. Por exemplo, você poderia configurar uma planilha em que o modelo SMA seria usado para prever 2 passos à frente, 3 passos à frente, etc., dentro da amostra de dados históricos. Você poderia então calcular os desvios padrão da amostra dos erros em cada horizonte de previsão e, em seguida, construir intervalos de confiança para previsões de longo prazo, adicionando e subtraindo múltiplos do desvio padrão apropriado. Se tentarmos uma média móvel simples de 9 termos, obtemos previsões ainda mais suaves e mais de um efeito de atraso: a idade média é agora de 5 períodos (91) 2). Se tomarmos uma média móvel de 19 termos, a média de idade aumenta para 10: Observe que, de fato, as previsões estão atrasadas em torno de 10 pontos. Qual quantidade de suavização é melhor para esta série. Aqui está uma tabela que compara suas estatísticas de erro, incluindo também uma média de 3 termos: Modelo C, a média móvel de 5 termos, produz o menor valor de RMSE por uma pequena margem ao longo dos 3 Médias temporais e de 9 termos, e suas outras estatísticas são quase idênticas. Assim, entre os modelos com estatísticas de erro muito semelhantes, podemos escolher se preferimos um pouco mais de capacidade de resposta ou um pouco mais de suavidade nas previsões. (Retornar ao topo da página.) Browns Suavização exponencial simples (média móvel ponderada exponencialmente) O modelo de média móvel simples descrito acima tem a propriedade indesejável de que trata as últimas observações k de forma igualitária e ignora completamente todas as observações precedentes. Intuitivamente, os dados passados ​​devem ser descontados de forma mais gradual - por exemplo, a observação mais recente deve ter um pouco mais de peso que o segundo mais recente, e o segundo mais recente deve ter um pouco mais de peso do que o terceiro mais recente, e em breve. O modelo de suavização exponencial simples (SES) realiza isso. Deixe 945 indicar uma constante de quotesmoothing (um número entre 0 e 1). Uma maneira de escrever o modelo é definir uma série L que represente o nível atual (isto é, o valor médio local) da série como estimado a partir de dados até o presente. O valor de L no tempo t é calculado de forma recursiva a partir de seu próprio valor anterior como este: Assim, o valor suavizado atual é uma interpolação entre o valor suavizado anterior e a observação atual, onde 945 controla a proximidade do valor interpolado para o mais recente observação. A previsão para o próximo período é simplesmente o valor suavizado atual: Equivalentemente, podemos expressar a próxima previsão diretamente em termos de previsões anteriores e observações anteriores, em qualquer uma das seguintes versões equivalentes. Na primeira versão, a previsão é uma interpolação entre previsão anterior e observação anterior: na segunda versão, a próxima previsão é obtida ajustando a previsão anterior na direção do erro anterior em uma quantidade fracionada de 945. É o erro cometido em Tempo t. Na terceira versão, a previsão é uma média móvel ponderada exponencialmente (com desconto) com o fator de desconto 1- 945: a versão de interpolação da fórmula de previsão é a mais simples de usar se você estiver implementando o modelo em uma planilha: ela se encaixa em uma Célula única e contém referências de células que apontam para a previsão anterior, a observação anterior e a célula onde o valor de 945 é armazenado. Note-se que se 945 1, o modelo SES é equivalente a um modelo de caminhada aleatória (sem crescimento). Se 945 0, o modelo SES é equivalente ao modelo médio, supondo que o primeiro valor suavizado seja igual à média. (Voltar ao topo da página.) A idade média dos dados na previsão de suavização simples-exponencial é 1 945 em relação ao período para o qual a previsão é calculada. (Isso não deve ser óbvio, mas pode ser facilmente demonstrado pela avaliação de uma série infinita.) Portanto, a previsão média móvel simples tende a atrasar os pontos de viragem em cerca de 1 945 períodos. Por exemplo, quando 945 0.5 o atraso é de 2 períodos quando 945 0.2 o atraso é de 5 períodos quando 945 0.1 o atraso é de 10 períodos e assim por diante. Para uma média de idade dada (ou seja, a quantidade de lag), a previsão de suavização exponencial simples (SES) é um pouco superior à previsão da média móvel simples (SMA) porque coloca um peso relativamente maior na observação mais recente - isto é. É um pouco mais quotresponsivech para as mudanças ocorridas no passado recente. Por exemplo, um modelo SMA com 9 termos e um modelo SES com 945 0,2 ambos têm uma idade média de 5 para os dados em suas previsões, mas o modelo SES coloca mais peso nos últimos 3 valores do que o modelo SMA e no Ao mesmo tempo, não possui 8220forget8221 sobre valores com mais de 9 períodos de tempo, como mostrado neste gráfico: Outra vantagem importante do modelo SES sobre o modelo SMA é que o modelo SES usa um parâmetro de suavização que é continuamente variável, portanto, pode otimizar facilmente Usando um algoritmo quotsolverquot para minimizar o erro quadrático médio. O valor ideal de 945 no modelo SES para esta série é 0.2961, como mostrado aqui: A idade média dos dados nesta previsão é 10.2961 3,4 períodos, o que é semelhante ao de uma média móvel simples de 6 termos. As previsões de longo prazo do modelo SES são uma linha direta horizontal. Como no modelo SMA e no modelo de caminhada aleatória sem crescimento. No entanto, note que os intervalos de confiança computados por Statgraphics agora divergem de forma razoável e que eles são substancialmente mais estreitos do que os intervalos de confiança para o modelo de caminhada aleatória. O modelo SES assume que a série é um pouco mais previsível do que o modelo de caminhada aleatória. Um modelo SES é realmente um caso especial de um modelo ARIMA. Então a teoria estatística dos modelos ARIMA fornece uma base sólida para o cálculo de intervalos de confiança para o modelo SES. Em particular, um modelo SES é um modelo ARIMA com uma diferença não-sazonal, um termo MA (1) e nenhum termo constante. Também conhecido como um modelo quotARIMA (0,1,1) sem constantequot. O coeficiente MA (1) no modelo ARIMA corresponde à quantidade 1- 945 no modelo SES. Por exemplo, se você ajustar um modelo ARIMA (0,1,1) sem constante para a série analisada aqui, o coeficiente MA (1) estimado é 0.7029, o que é quase exatamente um menos 0.2961. É possível adicionar a hipótese de uma tendência linear constante não-zero ao modelo SES. Para fazer isso, basta especificar um modelo ARIMA com uma diferença não-sazonal e um termo MA (1) com uma constante, ou seja, um modelo ARIMA (0,1,1) com constante. As previsões a longo prazo terão uma tendência que é igual à tendência média observada durante todo o período de estimação. Você não pode fazer isso em conjunto com o ajuste sazonal, porque as opções de ajuste sazonal são desativadas quando o tipo de modelo é definido como ARIMA. No entanto, você pode adicionar uma tendência exponencial constante a longo prazo a um modelo de suavização exponencial simples (com ou sem ajuste sazonal) usando a opção de ajuste de inflação no procedimento de Previsão. A taxa de quotinflação adequada (taxa de crescimento) por período pode ser estimada como o coeficiente de inclinação em um modelo de tendência linear ajustado aos dados em conjunto com uma transformação de logaritmo natural, ou pode ser baseado em outras informações independentes sobre perspectivas de crescimento a longo prazo . (Voltar ao topo da página.) Browns Linear (ou seja, duplo) Suavização exponencial Os modelos SMA e os modelos SES assumem que não há nenhuma tendência de nenhum tipo nos dados (o que normalmente é OK ou pelo menos não muito ruim para 1- Previsões passo a passo quando os dados são relativamente barulhentos) e podem ser modificados para incorporar uma tendência linear constante como mostrado acima. E quanto a tendências de curto prazo Se uma série exibir uma taxa de crescimento variável ou um padrão cíclico que se destaca claramente contra o ruído e, se houver necessidade de prever mais de 1 período à frente, a estimativa de uma tendência local também pode ser um problema. O modelo de alisamento exponencial simples pode ser generalizado para obter um modelo de alisamento exponencial linear (LES) que calcula estimativas locais de nível e tendência. O modelo de tendência mais simples do tempo é o modelo de suavização exponencial linear Browns, que usa duas séries suavizadas diferentes centradas em diferentes pontos no tempo. A fórmula de previsão é baseada em uma extrapolação de uma linha através dos dois centros. (Uma versão mais sofisticada deste modelo, Holt8217s, é discutida abaixo.) A forma algébrica do modelo de alisamento exponencial linear Brown8217s, como a do modelo de suavização exponencial simples, pode ser expressa em várias formas diferentes, mas equivalentes. A forma quotstandardquot deste modelo geralmente é expressa da seguinte maneira: Seja S denotar a série de suavização individual obtida pela aplicação de suavização exponencial simples para a série Y. Ou seja, o valor de S no período t é dado por: (Lembre-se que, sob simples Suavização exponencial, esta seria a previsão de Y no período t1.) Então, deixe Squot indicar a série duplamente suavizada obtida aplicando o alisamento exponencial simples (usando o mesmo 945) para a série S: Finalmente, a previsão para Y tk. Para qualquer kgt1, é dada por: Isto produz e 1 0 (isto é, traga um pouco e deixe a primeira previsão igual a primeira observação real) e e 2 Y 2 8211 Y 1. Após o que as previsões são geradas usando a equação acima. Isso produz os mesmos valores ajustados que a fórmula com base em S e S, se estes últimos foram iniciados usando S 1 S 1 Y 1. Esta versão do modelo é usada na próxima página que ilustra uma combinação de suavização exponencial com ajuste sazonal. Holt8217s Linear Exponential Suavizante Brown8217s modelo LES calcula estimativas locais de nível e tendência ao suavizar os dados recentes, mas o fato de que ele faz com um único parâmetro de suavização coloca uma restrição nos padrões de dados que ele pode caber: o nível e a tendência Não podem variar a taxas independentes. O modelo LES de Holt8217s aborda esse problema ao incluir duas constantes de suavização, uma para o nível e outra para a tendência. A qualquer momento t, como no modelo Brown8217s, existe uma estimativa L t do nível local e uma estimativa T t da tendência local. Aqui, eles são computados de forma recursiva a partir do valor de Y observado no tempo t e as estimativas anteriores do nível e tendência por duas equações que aplicam o alisamento exponencial separadamente. Se o nível estimado e a tendência no tempo t-1 são L t82091 e T t-1. Respectivamente, então a previsão de Y tshy que teria sido feita no tempo t-1 é igual a L t-1 T t-1. Quando o valor real é observado, a estimativa atualizada do nível é calculada de forma recursiva interpolando entre Y tshy e sua previsão, L t-1 T t-1, usando pesos de 945 e 1- 945. A alteração no nível estimado, Lt 8209 L t82091. Pode ser interpretado como uma medida ruim da tendência no tempo t. A estimativa atualizada da tendência é então calculada de forma recursiva interpolando entre L t 8209 L t82091 e a estimativa anterior da tendência, T t-1. Usando pesos de 946 e 1-946: a interpretação da constante de simulação de tendência 946 é análoga à da constante de alívio de nível 945. Modelos com valores pequenos de 946 assumem que a tendência muda muito lentamente ao longo do tempo, enquanto modelos com 946 maiores assumem que está mudando mais rapidamente. Um modelo com um grande 946 acredita que o futuro distante é muito incerto, porque os erros na estimativa de tendência se tornam bastante importantes ao prever mais de um período à frente. (Voltar ao topo da página.) As constantes de suavização 945 e 946 podem ser estimadas da maneira usual, minimizando o erro quadrático médio das previsões de 1 passo à frente. Quando isso é feito em Statgraphics, as estimativas revelam-se 945 0,3048 e 946 0,008. O valor muito pequeno de 946 significa que o modelo assume mudanças muito pequenas na tendência de um período para o outro, então, basicamente, esse modelo está tentando estimar uma tendência de longo prazo. Por analogia com a noção de idade média dos dados utilizados na estimativa do nível local da série, a idade média dos dados utilizados na estimativa da tendência local é proporcional a 1 946, embora não exatamente igual a ela. . Neste caso, isso é 10.006 125. Este não é um número muito preciso na medida em que a precisão da estimativa de 946 não é realmente 3 casas decimais, mas é da mesma ordem geral de grandeza que o tamanho da amostra de 100, então Este modelo está com uma média de bastante história na estimativa da tendência. O gráfico de previsão abaixo mostra que o modelo de LES estima uma tendência local um pouco maior no final da série do que a tendência constante estimada no modelo SEStrend. Além disso, o valor estimado de 945 é quase idêntico ao obtido pela montagem do modelo SES com ou sem tendência, então este é quase o mesmo modelo. Agora, isso parece previsões razoáveis ​​para um modelo que deveria estimar uma tendência local Se você 8220eyeball8221 este gráfico, parece que a tendência local virou para baixo no final da série O que aconteceu Os parâmetros deste modelo Foi estimado pela minimização do erro quadrado das previsões de 1 passo à frente, não de previsões a mais longo prazo, caso em que a tendência não faz muita diferença. Se tudo o que você está procurando é erros de 1 passo a passo, você não está vendo a imagem maior das tendências em relação a (digamos) 10 ou 20 períodos. Para obter este modelo mais em sintonia com a extrapolação dos dados no olho, podemos ajustar manualmente a constante de alívio da tendência, de modo que ele use uma linha de base mais curta para a estimativa de tendência. Por exemplo, se optar por definir 946 0,1, a idade média dos dados utilizados na estimativa da tendência local é de 10 períodos, o que significa que estamos em média a tendência nos últimos 20 períodos ou mais. Aqui é o que parece o gráfico de previsão se definimos 946 0,1 enquanto mantemos 945 0,3. Isso parece intuitivamente razoável para esta série, embora seja provavelmente perigoso extrapolar esta tendência mais de 10 períodos no futuro. E as estatísticas de erro Aqui está uma comparação de modelo para os dois modelos mostrados acima, bem como três modelos SES. O valor ideal de 945 para o modelo SES é de aproximadamente 0,3, mas resultados semelhantes (com um pouco mais ou menos capacidade de resposta, respectivamente) são obtidos com 0,5 e 0,2. (A) Holts linear exp. Alisamento com alpha 0.3048 e beta 0.008 (B) Holts linear exp. Alisamento com alfa 0.3 e beta 0.1 (C) Suavização exponencial simples com alfa 0.5 (D) Suavização exponencial simples com alfa 0.3 (E) Suavização exponencial simples com alfa 0.2 Suas estatísticas são quase idênticas, então realmente podemos usar a escolha com base De erros de previsão de 1 passo à frente na amostra de dados. Temos de voltar atrás em outras considerações. Se acreditamos firmemente que faz sentido basear a estimativa da tendência atual sobre o que aconteceu nos últimos 20 períodos, podemos fazer um caso para o modelo LES com 945 0,3 e 946 0,1. Se quisermos ser agnósticos sobre se existe uma tendência local, então um dos modelos SES pode ser mais fácil de explicar e também daria mais previsões do meio da estrada para os próximos 5 ou 10 períodos. (Retornar ao topo da página.) Qual tipo de tendência-extrapolação é melhor: horizontal ou linear Evidências empíricas sugerem que, se os dados já foram ajustados (se necessário) para a inflação, então pode ser imprudente extrapolar linear a curto prazo Tendências muito distantes no futuro. As tendências evidentes hoje podem diminuir no futuro devido a causas variadas, como obsolescência do produto, aumento da concorrência e recessões cíclicas ou aumentos em uma indústria. Por este motivo, o alisamento exponencial simples geralmente apresenta melhor fora da amostra do que seria de esperar, apesar da sua extrapolação de tendência horizontal de quotnaivequot. As modificações de tendências amortecidas do modelo de alisamento exponencial linear também são freqüentemente usadas na prática para introduzir uma nota de conservadorismo em suas projeções de tendência. O modelo LES da modificação amortecida pode ser implementado como um caso especial de um modelo ARIMA, em particular, um modelo ARIMA (1,1,2). É possível calcular intervalos de confiança em torno de previsões de longo prazo produzidas por modelos exponenciais de suavização, considerando-os como casos especiais de modelos ARIMA. (Beware: nem todo o software calcula os intervalos de confiança para esses modelos corretamente.) A largura dos intervalos de confiança depende de (i) o erro RMS do modelo, (ii) o tipo de alisamento (simples ou linear) (iii) o valor (S) da (s) constante (s) de suavização e (iv) o número de períodos adiante que você está prevendo. Em geral, os intervalos se espalham mais rápido, à medida que 945 se ampliam no modelo SES e se espalham muito mais rápido quando o alisamento linear, em vez do simples, é usado. Este tópico é discutido mais adiante na seção de modelos ARIMA das notas. (Voltar ao topo da página.) 2.1 Modelos médios em movimento (modelos MA) Os modelos de séries temporais conhecidos como modelos ARIMA podem incluir termos autorregressivos e os termos médios móveis. Na semana 1, aprendemos um termo autorregressivo em um modelo de séries temporais para a variável x t é um valor remanescente de x t. Por exemplo, um termo autorregressivo de lag 1 é x t-1 (multiplicado por um coeficiente). Esta lição define os termos médios móveis. Um termo médio móvel em um modelo de séries temporais é um erro passado (multiplicado por um coeficiente). Deixe (wt overset N (0, sigma2w)), o que significa que o w t é idêntico, distribuído independentemente, cada um com uma distribuição normal com média 0 e a mesma variância. O modelo de média móvel de 1ª ordem, denotado por MA (1) é (xt mu wt theta1w) O modelo de média móvel de 2ª ordem, denotado por MA (2) é (xt mu wt theta1w theta2w) O modelo de média móvel da ordem q , Denotado por MA (q) é (xt mu wt theta1w theta2w dots thetaqw) Nota. Muitos livros didáticos e programas de software definem o modelo com sinais negativos antes dos termos. Isso não altera as propriedades teóricas gerais do modelo, embora ele flip os signos algébricos de valores de coeficientes estimados e termos (desactuados) em fórmulas para ACFs e variâncias. Você precisa verificar seu software para verificar se os sinais negativos ou positivos foram usados ​​para escrever corretamente o modelo estimado. R usa sinais positivos em seu modelo subjacente, como fazemos aqui. Propriedades teóricas de uma série de tempo com um modelo MA (1) Observe que o único valor diferente de zero na ACF teórica é para o atraso 1. Todas as outras autocorrelações são 0. Assim, uma amostra ACF com autocorrelação significativa apenas no intervalo 1 é um indicador de um possível modelo MA (1). Para estudantes interessados, as provas dessas propriedades são um apêndice para este folheto. Exemplo 1 Suponha que um modelo de MA (1) seja x t 10 w t .7 w t-1. Onde (com o excesso de N (0,1)). Assim, o coeficiente 1 0,7. O ACF teórico é dado por um gráfico deste ACF segue. O enredo que acabamos de mostrar é o ACF teórico para um MA (1) com 1 0,7. Na prática, uma amostra geralmente não fornece um padrão tão claro. Usando R, simulamos n 100 valores de amostra usando o modelo x t 10 w t .7 w t-1 onde w t iid N (0,1). Para esta simulação, segue-se um gráfico de séries temporais dos dados da amostra. Não podemos dizer muito dessa trama. A amostra ACF para os dados simulados segue. Vemos um pico no intervalo 1 seguido de valores geralmente não significativos para atrasos após 1. Observe que o ACF de amostra não corresponde ao padrão teórico da MA subjacente (1), que é que todas as autocorrelações por atrasos após 1 serão 0 . Uma amostra diferente teria uma ACF de amostra ligeiramente diferente mostrada abaixo, mas provavelmente teria os mesmos recursos amplos. Propriedades terapêuticas de uma série de tempo com um modelo MA (2) Para o modelo MA (2), as propriedades teóricas são as seguintes: Observe que os únicos valores não nulos no ACF teórico são para atrasos 1 e 2. As autocorrelações para atrasos superiores são 0 . Assim, uma amostra de ACF com autocorrelações significativas nos intervalos 1 e 2, mas as autocorrelações não significativas para atrasos maiores indicam um possível modelo de MA (2). Iid N (0,1). Os coeficientes são de 1 0,5 e 2 0,3. Uma vez que este é um MA (2), o ACF teórico terá valores diferentes de zero apenas nos intervalos 1 e 2. Os valores das duas autocorrelações não-zero são A Um gráfico do ACF teórico segue. Como quase sempre é o caso, os dados da amostra não se comportam tão perfeitamente quanto a teoria. Nós simulamos n 150 valores de amostra para o modelo x t 10 w t .5 w t-1 .3 w t-2. Onde w t iid N (0,1). A série de séries temporais dos dados segue. Tal como acontece com a série de séries temporais para os dados da amostra MA (1), você não pode contar muito com isso. A amostra ACF para os dados simulados segue. O padrão é típico para situações em que um modelo de MA (2) pode ser útil. Existem dois picos estatisticamente significativos nos intervalos 1 e 2 seguidos de valores não significativos para outros atrasos. Observe que, devido ao erro de amostragem, a amostra ACF não corresponde exatamente ao padrão teórico. ACF para General MA (q) Modelos Uma propriedade de modelos de MA (q) em geral é que existem autocorrelações diferentes de zero para os primeiros intervalos de q e autocorrelações 0 para todos os atrasos gt q. Não singularidade de conexão entre valores de 1 e (rho1) em MA (1) Modelo. No modelo MA (1), para qualquer valor de 1. O recíproco 1 1 dá o mesmo valor para Como exemplo, use 0,5 para 1. E depois use 1 (0,5) 2 para 1. Você obterá (rho1) 0.4 em ambos os casos. Para satisfazer uma restrição teórica chamada invertibilidade. Nós restringimos os modelos de MA (1) para ter valores com valor absoluto inferior a 1. No exemplo que acabamos de dar, 1 0.5 será um valor de parâmetro permitido, enquanto que 1 10.5 2 não irá. Invertibilidade de modelos de MA Um modelo de MA é considerado inversível se for algébricamente equivalente a um modelo de AR de ordem infinita convergente. Ao convergir, queremos dizer que os coeficientes de AR diminuem para 0, enquanto nos movemos para trás no tempo. Invertibilidade é uma restrição programada em software de série temporal usado para estimar os coeficientes de modelos com termos MA. Não é algo que buscamos na análise de dados. Informações adicionais sobre a restrição de invertibilidade para modelos MA (1) são apresentadas no apêndice. Nota de teoria avançada. Para um modelo MA (q) com um ACF especificado, existe apenas um modelo inversível. A condição necessária para a invertibilidade é que os coeficientes possuem valores tais que a equação 1- 1 y-. - q e q 0 possui soluções para y que se encontram fora do círculo da unidade. Código R para os Exemplos No Exemplo 1, traçamos o ACF teórico do modelo x t 10 w t. 7w t-1. E depois simulou n 150 valores desse modelo e traçou as séries temporais da amostra e a amostra ACF para os dados simulados. Os comandos R utilizados para traçar o ACF teórico foram: acfma1ARMAacf (mac (0,7), lag. max10) 10 lags de ACF para MA (1) com theta1 0,7 lags0: 10 cria uma variável chamada atrasos que varia de 0 a 10. trama (Lag, acfma1, xlimc (1,10), ylabr, typeh, ACF principal para MA (1) com theta1 0,7) abline (h0) adiciona um eixo horizontal ao gráfico O primeiro comando determina o ACF e o armazena em um objeto Nomeado acfma1 (nossa escolha de nome). O comando de parcela (o comando 3) representa atrasos em relação aos valores ACF para os atrasos 1 a 10. O parâmetro ylab rotula o eixo y e o parâmetro principal coloca um título no gráfico. Para ver os valores numéricos do ACF, use simplesmente o comando acfma1. A simulação e os gráficos foram feitos com os seguintes comandos. Xcarima. sim (n150, list (mac (0.7))) Simula n 150 valores de MA (1) xxc10 acrescenta 10 para fazer a média 10. Padrões de simulação significa 0. plot (x, typeb, mainSimulated MA (1) dados) Acf (x, xlimc (1,10), mainACF para dados de amostra simulados) No Exemplo 2, traçamos o ACF teórico do modelo xt 10 wt .5 w t-1 .3 w t-2. E depois simulou n 150 valores desse modelo e traçou as séries temporais da amostra e a amostra ACF para os dados simulados. Os comandos R utilizados foram acfma2ARMAacf (mac (0.5,0.3), lag. max10) acfma2 lags0: 10 plot (lags, acfma2, xlimc (1,10), ylabr, typeh, ACF principal para MA (2) com theta1 0,5, Theta20.3) abline (h0) xcarima. sim (n150, list (mac (0.5, 0.3))) xxc10 plot (x, typeb, principal Simulated MA (2) Series) acf (x, xlimc (1,10), MainACF para dados simulados de MA (2) Apêndice: Prova de propriedades de MA (1) Para estudantes interessados, aqui estão as provas para propriedades teóricas do modelo MA (1). Variance: (texto (texto) (mu wt theta1 w) Texto de 0 texto (wt) (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Quando h 1, a expressão anterior 1 w 2. Para qualquer h 2, a expressão anterior 0 . A razão é que, por definição de independência do peso. E (w k w j) 0 para qualquer k j. Além disso, porque o w t tem 0, E (w j w j) E (w j 2) w 2. Para uma série de tempo, aplique este resultado para obter o ACF fornecido acima. Um modelo de MA reversível é aquele que pode ser escrito como um modelo de AR de ordem infinita que converge para que os coeficientes de AR convergem para 0 à medida que nos movemos infinitamente de volta no tempo. Bem, demonstre invertibilidade para o modelo MA (1). Em seguida, substituímos a relação (2) para w t-1 na equação (1) (3) (zt wt theta1 (z - theta1w) wt theta1z - theta2w) No momento t-2. A equação (2) torna-se então substituímos a relação (4) para w t-2 na equação (3) (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z - theta12z theta31w) Se continuássemos ( Infinitamente), obteríamos o modelo de AR de ordem infinita (zt wt theta1 z - theta21z theta31z - theta41z dots) Note, no entanto, que se 1 1, os coeficientes que multiplicam os atrasos de z aumentarão (infinitamente) de tamanho à medida que avançamos Tempo. Para evitar isso, precisamos de 1 lt1. Esta é a condição para um modelo de MA reversível (1). Modelo de ordem infinita MA Na semana 3, veja que um modelo de AR (1) pode ser convertido em um modelo de MA de ordem infinita: (xt - mu wt phi1w phi21w dots phik1 w dots sum phij1w) Este somatório de termos de ruído branco passados ​​é conhecido Como a representação causal de um AR (1). Em outras palavras, x t é um tipo especial de MA com um número infinito de termos que retornam no tempo. Isso é chamado de uma ordem infinita MA ou MA (). Uma ordem finita MA é uma ordem infinita AR e qualquer ordem finita AR é uma ordem infinita MA. Recorde na Semana 1, observamos que um requisito para um AR estacionário (1) é aquele 1 lt1. Vamos calcular o Var (x t) usando a representação causal. Este último passo usa um fato básico sobre séries geométricas que requerem (phi1lt1) caso contrário a série diverge. Navegação

No comments:

Post a Comment