Moving Average Forecasting Introducción. Como usted podría adivinar, estamos estudiando algunos de los enfoques más primitivos para la predicción. Pero espero que estas sean al menos una introducción valiosa a algunos de los problemas de computación relacionados con la implementación de pronósticos en hojas de cálculo. En este sentido, continuaremos comenzando desde el principio y comenzando a trabajar con las previsiones de Media móvil. Pronósticos de media móvil. Todo el mundo está familiarizado con los pronósticos de promedio móvil, independientemente de si creen que son. Todos los estudiantes universitarios lo hacen todo el tiempo. Piense en los resultados de su examen en un curso en el que va a tener cuatro pruebas durante el semestre. Supongamos que tienes un 85 en tu primera prueba. ¿Qué predecirías para tu segundo puntaje de prueba? ¿Qué crees que tu maestro predijo para tu siguiente puntaje de prueba? ¿Qué crees que tus amigos podrían predecir para tu siguiente puntaje de prueba? ¿Qué crees que tus padres podrían predecir para tu próximo puntaje de prueba? Todo el blabbing que usted puede hacer a sus amigos y padres, él y su profesor son muy probables esperar que usted consiga algo en el área de los 85 que usted acaba de conseguir. Bueno, ahora vamos a suponer que a pesar de su autopromoción a sus amigos, usted se sobreestimar y la figura que puede estudiar menos para la segunda prueba y por lo que se obtiene un 73. Ahora lo que todos los interesados y despreocupados va a Anticipar que usted conseguirá en su tercer examen Hay dos acercamientos muy probables para que desarrollen una estimación sin importar si lo compartirán con usted. Pueden decir a sí mismos: "Este tipo siempre está soplando el humo de su inteligencia. Hes va a conseguir otro 73 si hes suerte. Tal vez los padres tratarán de ser más solidarios y decir: "Bueno, hasta ahora has conseguido un 85 y un 73, por lo que tal vez debería figura en obtener sobre un (85 73) / 2 79. No sé, tal vez si usted hizo menos Fiesta y werent meneando la comadreja en todo el lugar y si comenzó a hacer mucho más estudiando que podría obtener una puntuación más alta. quot Ambos de estos estimados son en realidad las previsiones de promedio móvil. El primero es usar sólo su puntaje más reciente para pronosticar su rendimiento futuro. Esto se denomina pronóstico de media móvil utilizando un período de datos. El segundo es también un pronóstico de media móvil, pero utilizando dos períodos de datos. Vamos a asumir que todas estas personas estallando en su gran mente tienen tipo de molesto y usted decide hacer bien en la tercera prueba por sus propias razones y poner una puntuación más alta en frente de sus quotalliesquot. Usted toma la prueba y su puntuación es en realidad un 89 Todos, incluido usted mismo, está impresionado. Así que ahora tiene la prueba final del semestre que viene y como de costumbre se siente la necesidad de incitar a todos a hacer sus predicciones acerca de cómo youll hacer en la última prueba. Bueno, espero que veas el patrón. Ahora, espero que puedas ver el patrón. ¿Cuál crees que es el silbido más preciso mientras trabajamos? Ahora volvemos a nuestra nueva compañía de limpieza iniciada por su hermana separada llamada Whistle While We Work. Tiene algunos datos de ventas anteriores representados en la siguiente sección de una hoja de cálculo. Primero presentamos los datos para un pronóstico de media móvil de tres periodos. La entrada para la celda C6 debe ser Ahora puede copiar esta fórmula de celda abajo a las otras celdas C7 a C11. Observe cómo el promedio se mueve sobre los datos históricos más recientes, pero utiliza exactamente los tres períodos más recientes disponibles para cada predicción. También debe notar que realmente no necesitamos hacer las predicciones para los períodos pasados con el fin de desarrollar nuestra predicción más reciente. Esto es definitivamente diferente del modelo de suavizado exponencial. He incluido las predicciones anteriores porque las usaremos en la siguiente página web para medir la validez de la predicción. Ahora quiero presentar los resultados análogos para un pronóstico de media móvil de dos periodos. La entrada para la celda C5 debe ser Ahora puede copiar esta fórmula de celda abajo a las otras celdas C6 a C11. Observe cómo ahora sólo se usan las dos más recientes piezas de datos históricos para cada predicción. Nuevamente he incluido las predicciones anteriores para fines ilustrativos y para uso posterior en la validación de pronósticos. Algunas otras cosas que son importantes de notar. Para una predicción de promedio móvil del período m sólo se usan los m valores de datos más recientes para hacer la predicción. Nada más es necesario. Para una predicción media móvil del período m, al hacer predicciones quotpast, observe que la primera predicción ocurre en el período m 1. Ambas cuestiones serán muy significativas cuando desarrollemos nuestro código. Desarrollo de la función de media móvil. Ahora necesitamos desarrollar el código para el pronóstico del promedio móvil que se puede usar con más flexibilidad. El código sigue. Observe que las entradas son para el número de períodos que desea utilizar en el pronóstico y la matriz de valores históricos. Puede guardarlo en cualquier libro que desee. Función MovingAverage (Histórica, NumberOfPeriods) Como única Declaración e inicialización de variables Dim Item como variante Dim Contador como Entero Dim Acumulación como único Dim HistoricalSize As Entero Inicialización de variables Counter 1 Acumulación 0 Determinación del tamaño del historial HistoricalSize Historical. Count For Counter 1 To NumberOfPeriods Acumular el número apropiado de los valores observados anteriormente más recientes Acumulación Acumulación Histórica (HistoricalSize - NumberOfPeriods Counter) MovingAverage Acumulación / NumberOfPeriods El código se explicará en la clase. Desea colocar la función en la hoja de cálculo para que aparezca el resultado de la computación donde debería tener gusto de lo siguiente. Example Questions (from Past Tests) Nota: La respuesta correcta es seguida por. El código i - j se refiere a qué sección del texto se pretende abordar la pregunta. 1. ¿Qué factores tienen en común las cinco técnicas de suavizado de datos presentadas en el capítulo tres A) Todos usan sólo observaciones pasadas de los datos. B) Todos fallan en predecir reversiones cíclicas en los datos. C) Todos suavizan el ruido a corto plazo promediando los datos. D) Todos los productos correlacionados en serie las previsiones. E) Todo lo anterior es correcto. 2. Un promedio móvil de tres puntos centrado simple de la variable de la serie temporal Xt viene dado por: A) (Xt-1 Xt-2 Xt-3) / 3. B) (Xt Xt - 1 Xt - 1) / 3. C) (Xt _ {1} Xt Xt - 1) / 3. D) Ninguna de las anteriores es correcta. 3. La suavización del promedio móvil puede conducir a una inferencia engañosa cuando se aplica a A) datos estacionarios. B) previsión de tendencia inversa en el mercado de valores. C) conjuntos de datos pequeños y limitados. D) grandes y abundantes conjuntos de datos. E) Ninguna de las anteriores es correcta. 4. ¿Cuál de las siguientes no es correcta para elegir el tamaño adecuado de la constante de suavizado (a) en el modelo de suavizado exponencial simple A) Seleccione valores cercanos a cero si la serie tiene una gran variación aleatoria. B) Seleccione valores cercanos a uno si desea que los valores de pronóstico dependan fuertemente de los cambios recientes en los valores reales. C) Seleccione un valor que minimice RMSE. D) Seleccione un valor que maximice el error de cuadrado medio. E) Todo lo anterior es correcto. 5. La constante de suavizado (a) del modelo de suavizado exponencial simple A) debería tener un valor cercano a uno si los datos subyacentes son relativamente erráticos. B) debe tener un valor cercano a cero si los datos subyacentes son relativamente suaves. C) está más cerca de cero, mayor es la revisión en la previsión actual dado el error de pronóstico actual. D) se aproxima a uno, mayor es la revisión en el pronóstico actual dado el error de pronóstico actual. 6. El procedimiento de mínimos cuadrados minimiza la A) suma de los residuos. B) cuadrado del error máximo. C) suma de errores absolutos. D) suma de los residuos cuadrados. E) Ninguna de las anteriores es correcta. 7. Un residuo es A) la diferencia entre la media de Y condicional en X y la media incondicional. B) la diferencia entre la media de Y y su valor real. C) la diferencia entre la predicción de regresión de Y y su valor real. D) la diferencia entre la suma de errores cuadrados antes y después de X se utiliza para predecir Y. E) Ninguna de las anteriores es correcta. Se supone que las perturbaciones del modelo de regresión (errores de predicción) A) siguen una distribución de probabilidad normal. B) se supone que son independientes en el tiempo. C) se asume que promedian a cero. D) se puede estimar por residuos OLS. E) Todo lo anterior es correcto. 9. Los índices estacionales de ventas para el Black Lab Ski Resort son para enero 1.20 y diciembre .80. Si las ventas de diciembre para 1998 fueran 5.000, una estimación razonable de las ventas para enero de 1999 es: E) Ninguna de las anteriores es correcta. 10. ¿Cuáles de las siguientes técnicas no se utilizan para resolver el problema de la autocorrelación? A) Modelos autorregresivos. B) Mejora de la especificación del modelo. C) Movimiento de suavizado promedio. D) Diferenciando primero los datos. E) Regresión usando cambios porcentuales. 11. ¿Cuál de las siguientes no es una consecuencia de la correlación serial A) Las estimaciones de la pendiente de la OLS ahora son imparciales. B) Los intervalos de predicción OLS están sesgados. C) El R-cuadrado es menor que .5. D) Las estimaciones puntuales son imparciales. E) Ninguna de las anteriores es correcta. 12. La autocorrelación causa o causa: B) Correlación en serie. C) Regresión espuria. D) Regresión no lineal. E) Todo lo anterior es correcto. 13. Los intervalos de predicción exactos para la variable dependiente A) están arqueados alrededor de la línea de regresión estimada. B) Son lineales alrededor de la línea de regresión estimada. C) no tienen en cuenta la variabilidad de Y alrededor de la regresión de la muestra. D) no tienen en cuenta la aleatoriedad de la muestra. E) Ninguna de las anteriores es correcta. Problema corto Ejemplo 14. Un modelo de regresión lineal bivariante que relaciona los gastos de viaje interno (DTE) en función del ingreso per cápita (IPC) fue estimado como: DTE -9589.67 .953538 (IPC) DTE de previsión en el supuesto de que IPC será 14.750. Hacer el punto apropiado y estimaciones aproximadas del intervalo del 95 por ciento, asumiendo que la varianza estimada del error de la regresión era 2.077.230.38. La estimación puntual de DTE es: DTE -9589,67 .953538 (14.750) 4.475,02. El error estándar de la regresión es 1441,26, y el intervalo de confianza aproximado es: 4,475.02 plusmn (2) (1441,26) 4,475.02 plusmn 2882,52 P1592,50 lt DTE lt 7357,54 .95. B) Dado que el DTE real resultó ser 7.754 (millones), calcule el error porcentual en su pronóstico. Si el valor real de DTE es 7.754, el porcentaje de error en la previsión, basado en la estimación puntual de 4475.02, es 42.3. (7754 - 4475,02) / 7754,423. 15 Si se encuentra que los errores de pronóstico de un modelo de tipo ARIMA muestran correlación serial, este modelo A) no es un modelo de predicción adecuado. B) es un candidato para añadir otra variable explicativa. C) casi seguramente contiene estacionalidad. D) es un candidato para la regresión Cochrane-Orcutt. E) Todo lo anterior es correcto. 16. Los modelos de media móvil se describen mejor como A) promedios simples. B) promedios no ponderados. C) promedios ponderados de las series de ruido blanco. D) promedios ponderados de las variables aleatorias no normales. E) Ninguna de las anteriores es correcta. 17. ¿Cuál de los siguientes patrones del correlograma de la función de autocorrelación parcial es inconsistente con un proceso de datos autorregresivo subyacente A) Declinación exponencial a cero. B) Cíclicamente declinando a cero. C) Positivo al principio, luego negativo y aumentando a cero. D) Negativo al principio, luego positivo y descendiendo a cero. E) Todo lo anterior es correcto. 18 La función de autocorrelación de una serie de tiempo muestra coeficientes significativamente diferentes de cero en los retornos 1 a 4. La función de autocorrelación parcial muestra un pico y monótonamente aumenta a cero a medida que aumenta la longitud. Tal serie puede ser modelada como un modelo. E) Ninguna de las anteriores es correcta. 19. ¿Cuál de los siguientes no es un primer paso en el proceso de selección del modelo ARIMA A) Examine la función de autocorrelación de la serie cruda. B) Examinar la función de autocorrelación parcial de la serie cruda. C) Probar los datos de estacionariedad. D) Estimar un modelo ARIMA (1,1,1) para fines de referencia. E) Todo lo anterior es correcto. 20 ¿Cuál es la hipótesis nula que se está probando utilizando la estadística Box-Pierce A) El conjunto de autocorrelaciones es conjuntamente igual a cero. B) El conjunto de autocorrelaciones no son conjuntamente iguales a cero. C) El conjunto de autocorrelaciones es conjuntamente igual a uno. D) El conjunto de autocorrelaciones no son conjuntamente iguales a uno. E) Todo lo anterior es incorrecto. 21. El propósito principal de combinar pronósticos es reducir B) el sesgo de pronóstico medio. C) error de pronóstico cuadrático medio. D) error de pronóstico absoluto medio. E) Todo lo anterior es correcto. 22. ¿Cuál de las siguientes es una ventaja al usar el enfoque adaptativo para estimar los pesos óptimos en el proceso de combinación de pronósticos A) Los pesos cambian de un período a otro. B) Puede realizarse una prueba del sesgo del modelo de pronóstico combinado. C) Se utiliza la covarianza entre varianzas de error. D) Los pesos se eligen para maximizar la varianza del error de regresión. E) Todas las anteriores son correctas. En la práctica, el promedio móvil proporcionará una buena estimación de la media de la serie temporal si la media es constante o cambia lentamente. En el caso de una media constante, el mayor valor de m dará las mejores estimaciones de la media subyacente. Un período de observación más largo promediará los efectos de la variabilidad. El propósito de proporcionar un m más pequeño es permitir que el pronóstico responda a un cambio en el proceso subyacente. Para ilustrar, proponemos un conjunto de datos que incorpora cambios en la media subyacente de la serie temporal. La figura muestra las series temporales utilizadas para la ilustración junto con la demanda media a partir de la cual se generó la serie. La media comienza como una constante en 10. Comenzando en el tiempo 21, aumenta en una unidad en cada período hasta que alcanza el valor de 20 en el tiempo 30. Entonces se vuelve constante otra vez. Los datos se simulan sumando a la media un ruido aleatorio de una distribución Normal con media cero y desviación estándar 3. Los resultados de la simulación se redondean al entero más próximo. La tabla muestra las observaciones simuladas utilizadas para el ejemplo. Cuando usamos la tabla, debemos recordar que en cualquier momento dado, sólo se conocen los datos pasados. Las estimaciones del parámetro del modelo, para tres valores diferentes de m se muestran junto con la media de las series temporales de la siguiente figura. La figura muestra la media móvil de la estimación de la media en cada momento y no la previsión. Los pronósticos cambiarían las curvas de media móvil a la derecha por períodos. Una conclusión es inmediatamente aparente de la figura. Para las tres estimaciones, la media móvil se queda por detrás de la tendencia lineal, con el rezago aumentando con m. El retraso es la distancia entre el modelo y la estimación en la dimensión temporal. Debido al desfase, el promedio móvil subestima las observaciones a medida que la media aumenta. El sesgo del estimador es la diferencia en un tiempo específico en el valor medio del modelo y el valor medio predicho por el promedio móvil. El sesgo cuando la media está aumentando es negativo. Para una media decreciente, el sesgo es positivo. El retraso en el tiempo y el sesgo introducido en la estimación son funciones de m. Cuanto mayor sea el valor de m. Mayor es la magnitud del retraso y sesgo. Para una serie cada vez mayor con tendencia a. Los valores de retraso y sesgo del estimador de la media se dan en las ecuaciones siguientes. Las curvas de ejemplo no coinciden con estas ecuaciones porque el modelo de ejemplo no está aumentando continuamente, sino que comienza como una constante, cambia a una tendencia y luego vuelve a ser constante de nuevo. También las curvas de ejemplo se ven afectadas por el ruido. El pronóstico de media móvil de los períodos en el futuro se representa desplazando las curvas hacia la derecha. El desfase y sesgo aumentan proporcionalmente. Las ecuaciones a continuación indican el retraso y sesgo de los períodos de previsión en el futuro en comparación con los parámetros del modelo. Nuevamente, estas fórmulas son para una serie de tiempo con una tendencia lineal constante. No debemos sorprendernos de este resultado. El estimador del promedio móvil se basa en el supuesto de una media constante, y el ejemplo tiene una tendencia lineal en la media durante una parte del período de estudio. Dado que las series de tiempo real rara vez obedecerán exactamente las suposiciones de cualquier modelo, debemos estar preparados para tales resultados. También podemos concluir de la figura que la variabilidad del ruido tiene el efecto más grande para m más pequeño. La estimación es mucho más volátil para el promedio móvil de 5 que el promedio móvil de 20. Tenemos los deseos en conflicto de aumentar m para reducir el efecto de la variabilidad debido al ruido y disminuir m para hacer que el pronóstico más sensible a los cambios En promedio El error es la diferencia entre los datos reales y el valor previsto. Si la serie temporal es verdaderamente un valor constante, el valor esperado del error es cero y la varianza del error está compuesta por un término que es una función de y un segundo término que es la varianza del ruido. El primer término es la varianza de la media estimada con una muestra de m observaciones, suponiendo que los datos provienen de una población con una media constante. Este término se minimiza haciendo m tan grande como sea posible. Un m grande hace que el pronóstico no responda a un cambio en la serie temporal subyacente. Para hacer que el pronóstico responda a los cambios, queremos que m sea lo más pequeño posible (1), pero esto aumenta la varianza del error. La predicción práctica requiere un valor intermedio. Previsión con Excel El complemento de previsión implementa las fórmulas de promedio móvil. El siguiente ejemplo muestra el análisis proporcionado por el complemento para los datos de muestra en la columna B. Las primeras 10 observaciones se indexan -9 a 0. En comparación con la tabla anterior, los índices de período se desplazan en -10. Las primeras diez observaciones proporcionan los valores iniciales para la estimación y se utilizan para calcular la media móvil para el período 0. La columna MA (10) (C) muestra las medias móviles calculadas. El parámetro de la media móvil m está en la celda C3. La columna Fore (1) (D) muestra un pronóstico para un período en el futuro. El intervalo de pronóstico está en la celda D3. Cuando el intervalo de pronóstico se cambia a un número mayor, los números de la columna Fore se desplazan hacia abajo. La columna Err (1) (E) muestra la diferencia entre la observación y el pronóstico. Por ejemplo, la observación en el tiempo 1 es 6. El valor pronosticado a partir de la media móvil en el tiempo 0 es 11.1. El error entonces es -5.1. La desviación estándar y la media media de desviación (MAD) se calculan en las células E6 y E7, respectivamente.
No comments:
Post a Comment