Manual de MMS. Ejemplos

1MB Größe 13 Downloads 238 vistas

MANUAL DE MMS EJEMPLOS

Contenido

Ejemplos de MMS (ed.1)

1

Contenido Contenido ................................................................................................................................................................. 1 I

Estimación y previsión de modelos ARIMAX................................................................................... 3

II

Estimación y previsión de modelos cualitativos .......................................................................... 10 II.1

Sobre la encuesta ............................................................................................................................. 10

II.2

Variables del modelo...................................................................................................................... 11

II.3

Modelo logit y probit ...................................................................................................................... 12

II.3.1

Logit ............................................................................................................................................. 13

II.3.2

Probit........................................................................................................................................... 14

II.4 III

IV

Parámetros estimados del modelo ........................................................................................... 14

Estimación con información a priori y jerarquías ....................................................................... 16 III.1

Modelo ................................................................................................................................................. 20

III.2

Inferencia Bayesiana ...................................................................................................................... 20

III.2.1

Restricciones de signo, de orden y de igualdad......................................................... 21

III.2.2

Jerarquías de parámetros ................................................................................................... 21

Estimación y previsión de modelos mixtos .................................................................................... 23

Índices ..................................................................................................................................................................... 26 Índice de figuras ............................................................................................................................................. 26 Índice de tablas ............................................................................................................................................... 26

Ejemplo I

Ejemplos de MMS (ed.1)

2

Ejemplo I

I

Ejemplos de MMS (ed.1)

3

Estimación y previsión de modelos ARIMAX

Para ilustrar el ejemplo de modelos ARIMAX se ha elegido la serie de matriculación de vehículos en España. La información de matriculaciones se publica agregada mensualmente desde enero de 1990 y en este caso se trata de la suma de los siguientes tipos de vehículos: turismos, autobuses, camiones, furgonetas, motocicletas, tractores y otros. Se utilizan datos públicos, obtenidos de las bases de datos del INE (Instituto Nacional de Estadística) y de la DGT (Dirección General de Tráfico). La serie de matriculación de vehículos es la siguiente: Crisis desde finales de 2007

Tendencia creciente

Impuesto de matriculación

Figura I.1: Serie de matriculación de vehículos.

En una primera observación de la evolución de las matriculaciones permite identificar distintos comportamientos:      

Ralentización de las matriculaciones en el segundo semestre del año 1992. Repunte a principios del año 1994 hasta el año 1997. Tendencia creciente en el periodo 1997 - 1999. Estabilidad durante los años 2000, 2001, 2002 y 2003. Ligero crecimiento en 2004 y estabilidad hasta 2007. Brusca caída a finales de 2007.

El objetivo es construir un modelo explicativo de las matriculaciones de vehículos que mida el impacto de los siguientes impulsores: Evolución de la economía: PIB, IPC, créditos al consumo,… Impuestos de matriculación. Planes de incentivo del gobierno. Variables de calendario: número de días laborables de cada mes,… Oferta: debería recoger el efecto de la variable opciones, características y los efectos de precio.

Ejemplo I

Ejemplos de MMS (ed.1)

4

Para homogeneizar la varianza de las observaciones (se trata de una desviación típica de 43836.627), realizaremos una transformación BoxCox a las observaciones, luego el output de nuestro modelo será el logaritmo de la serie de matriculación de vehículos (nos queda una desviación típica de 0.328). Una variable que podría explicar parte de la tendencia de la serie de matriculaciones podría ser la variable económica del PIB, cuya gráfica es la siguiente:

PIB Previsión del PIB

Figura I.2: Serie del PIB.

Vemos que ambas series tienen tendencias similares, por lo tanto la incluiremos en el modelo como variable explicativa. Pero no el PIB como tal, sino el logaritmo del PIB. Como variable explicativa de calendario incluiremos en el modelo una variable que indique el número de días laborables de cada mes. Ya que en días festivos no se matriculan vehículos, luego se podría pensar que un mes que tiene más días laborables tiene mayor opción de haber tenido más matriculaciones. Como el PIB no es suficiente para corregir la crisis que sufre España aproximadamente a partir del 2007/2008, que se ve reflejada en las matriculaciones con un brusco descenso, es necesario introducir variables escalón. Observamos que sufre como dos caídas consecutivas:

Crisis económica

Plan 2000E

Figura I.3: Efectos destacados sobre las matriculaciones de vehículos.

Una variable escalón, es decir:

Ejemplo I

Ejemplos de MMS (ed.1)

5

y es el parámetro a estimar. Lo utilizamos para explicar los desajustes que sufre la serie y la fuerte bajada debido a la crisis en el 2008. Una variable escalón con tres retardos, es decir:

y

y

son los parámetros a ser estimados.

Además, tenemos que tener en cuenta los Planes del Gobierno para incentivar la compra de vehículos, en la serie se ve, el efecto que tuvo el Plan 2000E a partir de mediados de 2009. Véase la información de la página: http://www.preguntasfrecuentes.net/2009/05/15/ayuda-de-2000e-para-compra-decoche-plan-2000e/. Una variable rectángulo, esto es:

y

es el parámetro a estimar

También, incluimos una variable pulso, para corregir la caída debido a la Ley de Impuestos Especiales en Enero de 1993. Más información en: http://www.agenciatributaria.es/AEAT/Contenidos_Comunes/La_Agencia_Tributaria/Est adisticas/Publicaciones/sites/matriculaciones/2008/doc3507.html?doc=metod/introduc cion.html&idactual=introd&estad=matriculaciones/anual2008. Una variable pulso:

y

es el parámetro a estimar.

Una vez que hemos encontrado todas las variables que nos podrían ser necesarias, podemos empezar a construir el modelo. Para conseguir heterocedasticidad en las observaciones aplicamos logaritmo (transformación BoxCox) a la serie de matriculación de vehículos, y a continuación mostramos la serie resultante, es decir el output del modelo:

Ejemplo I

Ejemplos de MMS (ed.1)

Figura I.4: Serie con el logaritmo de las matriculaciones de vehículos.

Por lo tanto, un modelo ARIMAX tiene como ecuación matemática:

Donde el primer sumando es la suma de los efectos de los inputs . Estos inputs afectan al output a través de la correspondiente función de transferencia que viene definida por los polinomios . Los polinomios y son polinomios en B con raíces fuera del círculo unidad y debería ser una serie de ruido blanco de media cero y varianza constante. Sin caer en demasiados tecnicismos, de lo que se trata es de explicar una variable output Log(Obs) como la suma de unos términos explicativos y un ruido o parte no explicada:

Donde el ruido lo modelamos con un proceso ARIMA:

Figura I.5: Ruido del proceso ARIMA del modelo de matriculaciones de vehículos.

Observamos estacionalidad mensual y además una tendencia oscilante. Los gráficos de la autocorrelación y la autocorrelación parcial del ruido son los que siguen:

6

Ejemplo I

Ejemplos de MMS (ed.1)

Figura I.6: Gráficos de autocorrelaciones del ruido del modelo sin ARIMA.

Luego introducimos un modelo ARIMA:

Donde

es un proceso de RB, es decir de media 0 y varianza constante.

Una vez que tenemos definido el modelo lo que sigue es la estimación de los parámetros. Para ello podemos utilizar el método de estimación de máxima verosimilitud (MLE), éste busca el conjunto de valores de los parámetros más congruente con los datos del modelo, es decir, es aquel que maximiza la función de verosimilitud. Los parámetros estimados se encuentran en la tabla siguiente: parámetro

Log_PIB Laborables EUSetup Plan2000E Crisis2008m01d01 Crisis2008m05d01

valor 0.005 0.629 0.387 0.653 1.566 0.04 -0.322 0.222 -0.274 -0.24 -0.156

Tabla I.1: Parámetros estimados

Observamos que todos los parámetros salen significativos, es decir, los parámetros que acompañan a inputs de crisis salen negativos, y parámetros que acompañan a inputs de ayudas del gobierno son positivos. Por otra parte los parámetros del modelo ARIMA son significativos. La serie del filtro o serie de la suma de términos explicativos (parte determinista del modelo), una vez estimados los parámetros:

7

Ejemplo I

Ejemplos de MMS (ed.1)

8

Pulso de impuestos Crisis

Plan 2000E

Figura I.7: Serie del filtro del modelo, destacando algunos de los inputs introducidos.

El ajuste de la serie, es decir el output frente a la predicción del output (filtro + noise) es el siguiente:

Output Prediction

Figura I.8: Series del output y la predicción del modelo.

Respecto a la estimación, lo último que quedaría por comprobar es la bondad del ajuste, para ello tenemos que ver que el residuo (output-predicción del output) es “bueno”, es decir que, el gráfico de autocorrelación del residuo no presente ninguna estructura, tendría que ser totalmente aleatorio.

Figura I.9: Gráficos de autocorrelaciones de los residuos del modelo.

Observamos en la autocorrelación y la autocorrelación parcial que quizás hiciera falta un AR2 en el ARIMA del modelo. Por último, queremos conseguir una previsión de la serie de matriculación de vehículos.

Ejemplo I

Ejemplos de MMS (ed.1)

La previsión del output tiene una doble componente, por un lado la previsión debida a la parte explicada por el modelo y por otro lado la debida al ruido y que representa la componente aleatoria o no explicable por el modelo. Por lo tanto, necesitamos previsión de todos los inputs introducidos por el modelo (por eso hemos introducido el PIB con previsión).

Serie de las Observaciones Previsión Bandas de Confianza de la Previsión Figura I.10: Serie de matriculaciones de vehículos y su previsión.

En este ejemplo hemos utilizado una previsión puntual que es la que utiliza el valor del parámetro como un valor determinista libre de incertidumbre.

9

Ejemplo II

II

Ejemplos de MMS (ed.1)

10

Estimación y previsión de modelos cualitativos

Para explicar los modelos de variable cualitativa utilizaremos una encuesta que mide la satisfacción con el Sistema Sanitario Español. El Ministerio de Sanidad y Política Social (MSC) realiza una encuesta llamada Barómetro Sanitario con el objetivo de medir distintos aspectos sobre el sistema sanitario español. El Barómetro Sanitario es un estudio de opinión que, desde 1995, realiza cada año el Ministerio de Sanidad, Servicios Sociales e Igualdad mediante un convenio de colaboración con el Centro de Investigaciones Sociológicas (CIS). Se puede acceder a los microdatos desde: http://www.msc.es/estadisticas/microdatos.do.

II.1 Sobre la encuesta En el año 2010 se realizó una 3 oleadas y 2.600 entrevistas en cada una. Válidas fueron 7.750 y distribuidas en tres submuestras:   

1ª submuestra: 2.594 entrevistas. 2ª submuestra: 2.586 entrevistas. 3ª submuestra: 2.570 entrevistas.

La encuesta consta de 62 preguntas (no todas a responder por el encuestado) separadas en cinco bloques: 1) Opinión sobre las áreas (Defensa, Sanidad, Vivienda…) de mayor preocupación de los ciudadanos y de satisfacción con el sistema sanitario español. 2) Opinión sobre preguntas generales acerca del sistema sanitario: diferencias entre los sistemas público y privado, leyes del tabaco y el alcohol, experiencias sanitarias fuera de su comunidad autónoma. 3) Experiencia y opinión sobre la sanidad (pública o privada) en: a) La atención primaria b) La atención especializada c) Las urgencias d) El ingreso hospitalario 4) Opinión acerca de los servicios sanitarios públicos: listas de espera, competencias de la comunidad autónoma, errores en la asistencia sanitaria, confianza… 5) Información sociológica del encuestado: localización (municipio, provincia, comunidad autónoma), sexo, edad, estudios, situación laboral, nacionalidad y teléfono. Además existe información adicional respecto a la entrevista: incidencias, fecha y hora, valoración del encuestador (desarrollo y sinceridad) y codificación. El objetivo es construir un modelo que describa los impulsores y detractores de la insatisfacción con el sistema sanitario español. Para conseguir dicho objetivo, se obtendrá a partir de una de las preguntas del bloque 1 (calificación de 1 a 10 del nivel de satisfacción con el sistema sanitario) una respuesta dicotómica (1 si la respuesta es menor o igual a cuatro y cero en otro caso) sobre la insatisfacción. Un modelo de este tipo se podría escribir generalmente de la forma:

Ejemplo II

Ejemplos de MMS (ed.1)

11

Donde es una función de enlace que linealiza el modelo.

II.2 Variables del modelo Como se trata de modelar con variables cualitativas, a través de técnicas propias de variables discretas, se exige la codificación como paso previo a la modelización, proceso por el cual las alternativas de las variables se transforman en códigos o valores cuánticos, susceptibles de ser modelizados utilizando técnicas econométricas. Las variables que entran en el modelo son las que siguen: El output del modelo es una variable cualitativa que nos indica si el encuestado está satisfecho o no lo está con el Sistema de Sanidad Español, la variable que tomamos es la siguiente:

Los inputs pueden ser variables cualitativas o cuantitativas. Si son variables cualitativas pueden tomar dos o más valores, en los distintos casos: Si la variable cualitativa modelo, tal que:

Si la variable cualitativa modelo, tal que:

, tenemos que definir una variable y binaria en el

, tenemos que definir dos variables binarias en el

y ya que

.

En general si la variable cualitativa toma n valores, hay que definir n-1 variables binarias. Las variables cuantitativas entran en el modelo tal cual. En este modelo hemos considerado como variables inputs las que se presentan a continuación, pero podrían ser otras cualesquiera que se puedan rescatar de la encuesta: Nombre EstanciaHospitalaria

AttPrimariaPubMuyBuena AttPrimariaPubBuena AttPrimariaPubRegular AttPrimariaPubMala AttPrimariaPubMuyMala NumeroDiasEspera AttUrgenciaPub

Descripción Si el encuestado fuera de la CCAA se necesitó una estancia hospitalaria de más de un día toma valor 1, en caso contrario valor 0 Atención primaria publica recibida muy buena Atención primaria publica recibida buena Atención primaria publica recibida regular Atención primaria publica recibida mala Atención primaria publica recibida muy mala Número de días de espera tras cita En los últimos 12 meses cuantas veces ha

Tipo Cualitativa

Cualitativa Cualitativa Cualitativa Cualitativa Cualitativa Cuantitativa Cuantitativa

Ejemplo II

AttUrgenciaPriv

AttUrgPocaRapidez AttUrgNingunaRapidez EspecialistaPrivado Edad NoEspañol

Ejemplos de MMS (ed.1) recibido atención de urgencias en un centro público En los últimos 12 meses cuantas veces ha recibido atención de urgencias en un centro privado Atención de urgencia con poca rapidez Atención en urgencia con ninguna rapidez Ha necesitado atención de algún especialista privado Edad del encuestado Nacionalidad no española ( Extranjero =1 )

12

Cuantitativa Cualitativa Cualitativa Cuantitativa Cuantitativa Cualitativa

A parte de todas estas variables tenemos que introducir en el modelo una constante. El motivo por el cual se introduce una constante en el modelo es el mismo que para una regresión lineal, quitar la obligación de que pase por el origen y deforme los resultados. Como hemos mencionado antes, éstas no tienen por qué ser las variables definitivas, leyendo la encuesta se pueden encontrar muchas otras. Tras la estimación de los parámetros del modelo se podrá ver la influencia o peso relativo que estas variables tienen sobre la variable endógena.

II.3 Modelo logit y probit A continuación damos una breve introducción sobre este tipo de modelos: En este modelo tenemos una variable dicotómica como output y la necesitamos explicar con otras variables (inputs). El problema viene a la hora de estimar este output que toma valores entre 0 y 1 a partir de unos inputs cuyas combinaciones pueden tomar cualquier número entre menos infinito y más infinito. Luego la solución está en una transformación de este output, para que en lugar de unos y ceros aparezcan probabilidades. Cada una de nuestras probabilidades será nuestro nuevo valor de output, pero aún queda otra transformación para pasar de un intervalo entre 0 y 1 a toda la recta real, para de esta manera no tener ninguna restricción en el modelo. Parece lógico pensar que si necesito una función cuyo argumento sea una probabilidad y la salida sea cualquier valor entre menos infinito e infinito esta función tenga que ser la inversa de una distribución de probabilidad y así es, de hecho las dos más empleadas son la distribución Normal (para el modelo probit) y la función logística (para el modelo logit). Luego para afrontar el problema de la modelización de una variable dicotómica, tratamos de modelar una variable índice, inobservable o latente, no limitada en su rango de variación . La variable latente depende de un conjunto de variables explicativas que generan las alternativas que se dan en la realidad y que permiten expresar el modelo dicotómico como:

Donde el supuesto sobre la distribución 

Si se trata de una distribución

determinará el tipo de modelo a estimar: : modelo probit.

Ejemplo II 

Ejemplos de MMS (ed.1)

13

Si se trata de una distribución logística: modelo logit.

La hipótesis de que el umbral a superar por la variable latente sea cero se puede modificar por cualquier otro valor, sugiriéndose, en determinador estudios, que el valor crítico sea el definido por el término constante. Bajo este enfoque el modelo probabilístico quedaría definido por:

Esta probabilidad viene dada por la función de distribución de la variable aleatoria . Tanto los modelos logit como los probit relacionan, por tanto la variable endógena con las variables explicativas a través de una función de distribución. II.3.1 Logit En el caso del modelo logit, la distribución es la distribución logística:

cuya gráfica es la siguiente:

Figura II.1: Serie de matriculaciones de vehículos y su previsión.

Esto quiere decir que si a una probabilidad obtenemos la función logit:

, le aplicamos su inversa,

Figura II.2: Serie de matriculaciones de vehículos y su previsión.

Ejemplo II

Ejemplos de MMS (ed.1)

14

II.3.2 Probit En el caso del modelo probit, es exactamente lo mismo que en el caso anterior pero utilizando la función de distribución de una variable normal de media 0 y varianza 1:

Por lo tanto, si

Donde

, se tiene que:

es la llamada función error ó función error de Gauss, que se define como sigue:

Y la inversa de esta función es la serie infinita:

II.4 Parámetros estimados del modelo Los parámetros correspondientes al modelo logit según las tres estrategias de estimación:   

Método máximo verosímil Método máximo verosímil (vlogit) Método de optimización no lineal Parámetro EstanciaHospitalaria AttPrimariaPubMuyBuena AttPrimariaPubBuena AttPrimariaPubRegular AttPrimariaPubMala AttPrimariaPubMuyMala NumeroDiasEspera AttUrgenciaPub AttUrgenciaPriv AttUrgPocaRapidez AttUrgNingunaRapidez EspecialistaPrivado Edad NoEspañol Constante

MLE 0.3901 -0.8786 -0.6789 0.5811 1.5933 2.33 0.0895 0.0158 0.1656 0.6516 0.975 0.0602 -0.006 -1.0962 -1.6067

MLE(vlogit) 0.3901 -0.8786 -0.6789 0.5811 1.5933 2.33 0.0895 0.0158 0.1656 0.6516 0.975 0.0602 -0.006 -1.0962 -1.6067

NLO (mean) 0.5338 -0.881 -0.7063 0.545 1.6895 2.9284 0.0901 0.0118 0.181 0.6804 0.9455 0.0635 -0.006 -1.1064 -1.635

NLO (sigma) 0.083 0.097 0.032 0.068 0.055 0.342 0.003 0.012 0.014 0.070 0.058 0.009 0.0008 0.063 0.039

Tabla II.1: Tabla con las diferentes estimaciones de los parámetros para el modelo logit. Podemos destacar a AttPrimariaPubMuyMala y a NoEspañol como las variables impulsora y detractora más discriminatorias respectivamente.

Los parámetros correspondientes al modelo probit según las tres estrategias de estimación:  

Método máximo verosímil Método bayesiano

Ejemplo II

Ejemplos de MMS (ed.1) Parámetro EstanciaHospitalaria AttPrimariaPubMuyBuena AttPrimariaPubBuena AttPrimariaPubRegular AttPrimariaPubMala AttPrimariaPubMuyMala NumeroDiasEspera AttUrgenciaPub AttUrgenciaPriv AttUrgPocaRapidez AttUrgNingunaRapidez EspecialistaPrivado Edad NoEspañol Constante

MLE 0.1985 -0.4544 -0.3552 0.3411 0.9518 1.4001 0.0504 0.0076 0.0975 0.3537 0.5520 0.0345 -0.0038 -0.5702 -0.9585

BSR(mean) 0.1752 -0.4616 -0.3619 0.3324 0.9522 1.4170 0.0508 0.0070 0.1011 0.3525 0.5477 0.0339 -0.0036 -0.5536 -0.9658

15 BSR(sigma) 0.151 0.065 0.049 0.073 0.131 0.257 0.007 0.013 0.032 0.069 0.1 0.014 0.001 0.088 0.058

Tabla II.2: Tabla con las diferentes estimaciones de los parámetros para el modelo probit. Podemos destacar a NumeroDiasEspera como el parámetro impulsor que acompaña a una variable cuantitativa: la insatisfacción aumenta con el número de días. El parámetro Edad es un parámetro detractor poco significativo: se podría eliminar esta variable.

En cuanto a la interpretación de los parámetros estimados en un modelo logit, el signo de los mismos indica la dirección en que se mueve la probabilidad cuando aumenta la variable explicativa correspondiente, es decir, si es una variable impulsora (parámetro positivo) ó detractora (parámetro negativo). Sin embargo la cuantía del parámetro no coincide con la magnitud de la variación en la probabilidad, además el significado varía tanto si se trata de una variable explicativa cualitativa o cuantitativa. 



Parámetros que acompañan a variables cuantitativas, la significación se comporta de una manera “proporcional”, es decir en la variable días de espera, cuanto mayor es el número de días de espera, mayor es la probabilidad a estar insatisfecho con el Sistema Sanitario. Parámetros que acompañan a variables cualitativas: cuanto mayor es el valor del parámetro (en valor absoluto) más crítico será el valor que tome la variable binaria, o sea, mas discriminatoria será esa variable.

Ejemplo III

Ejemplos de MMS (ed.1)

16

III Estimación con información a priori y jerarquías Para explicar la estimación bayesiana en modelos ARIMAX con información a priori de los parámetros (restricciones, priors y jerarquías) utilizaremos de nuevo el ejemplo de la matriculación de vehículos (véase el ejemplo 0); pero esta vez se modelará la matriculación de cada tipo de vehículo: turismos, motos, camiones, etc. La información de matriculaciones se publica agregada mensualmente desde enero 1990 hasta agosto del 2012 para los siguientes tipos de vehículos:       

Turismos Autobuses Camiones y Furgonetas Motocicletas Tractores Otros (Estos datos sólo se tienen desde 1998) Total (Suma de los anteriores)

Las fuentes de las que se extraen los datos son el INE (Instituto Nacional de Estadística) y la DGT (Dirección General de Tráfico). A continuación estudiaremos las series por separado, como en el caso de la matriculación total del ejemplo 0, y haremos una transformación Box Cox (logarítmica) de las observaciones, luego nuestros outputs serán los que siguen:

Crisis 2008

Plan Prever Impuestos

Plan 2000E

Figura III.1: Serie en logaritmos de la matriculación de turismos.

Es muy parecida a la serie total de matriculaciones del ejemplo 0, es decir la mayoría de matriculación de vehículos son de turismos, luego las variables que la explicaran se espera que sean similares. Como variables explicativas de esta serie entran:   

El logaritmo del PIB El efecto calendario de los días laborables del mes Pulso en Enero de 1993 por la Vigencia de Impuesto de Matriculación

Ejemplo III 

    

Ejemplos de MMS (ed.1)

17

Plan Prever: I, II y III: Son tres variables de tipo escalón que deberían de tomar parámetro positivo porque representan planes del gobierno para incentivar la venta de vehículos. Sus intervalos de fechas son: Plan Prever I: [y1997m04, y2000m12] Plan Prever II: [y2001m01, y2004m12] Plan Prever III: [y2005m01, y2007m07] Plan 2000E: Otro plan del gobierno en los años [y2009m06, y2010m07]. Escalones de crisis: la crisis española que se sufre desde principios de 2008 o antes, la recogemos con variables escalón, cuyos parámetros deberían de tomar valores negativos.

¿?

Impuesto matriculación Más variabilidad

Figura III.2: Serie en logaritmos de la matriculación de autobuses.

Se observa en los últimos años mayor variabilidad en los meses de verano, pero no se observa una caída tan acusada por la crisis como en la serie anterior. También los meses son más irregulares.      

El logaritmo del PIB El efecto calendario de los días laborables del mes Pulso en Enero de 1993 por la Vigencia de Impuesto de Matriculación Plan Prever: I, II y III, aunque el que se observa que el plan que más afecta es el Plan Prever I No es necesario introducir todos los escalones de crisis como en otras series de matriculaciones. Pulso por un Enero atípico que nos fastidia la previsión

Ejemplo III

Ejemplos de MMS (ed.1)

18

Crisis

Planes del gobierno

Figura III.3: Serie en logaritmos de la matriculación de camiones y furgonetas.

Se observa que la crisis ha afectado bastante a este tipo de vehículos, la caída no cesa desde principios de 2008, antes de esto la serie es bastante regular. Los inputs que introducimos son:    



El logaritmo del PIB El efecto calendario de los días laborables del mes Pulso en Enero de 1993 por la Vigencia de Impuesto de Matriculación Plan Prever: I, II y III, aunque el que se observa que el plan que más afecta es el Plan Prever I, además a partir de 2001, la serie cae, luego no es de extrañar que el parámetro salga negativo, aún así lo metemos como input. Escalones de crisis, además de los escalones de 2008, vemos que la serie vuelve a caer a partir de mediados del año 2011.

Durante estos años decaen mucho las matriculaciones

Plan Prever

Figura III.4: Serie en logaritmos de la matriculación de motos.

Esta serie es la más oscilatoria de todas, es bastante estacional y la crisis no está muy acusada. Pero lo más difícil de captar es la caída de matriculaciones que se observa desde el principio de la serie hasta el año 1996, ya que la variable PIB es creciente en estos años. Las variables explicativas que se introducen en este modelo son:

Ejemplo III     

Ejemplos de MMS (ed.1)

19

El logaritmo del PIB El efecto calendario de los días laborables del mes Una variable tendencia que recoge la caída hasta 1996 Plan Prever: I, II y III, aunque no nos extrañe que el parámetro que acompaña a la variable escalón que representa el Plan Prever II nos salga negativo Una variable de Crisis en Mayo de 2008 con un retardo de tres meses.

Crisis

Recuperación

Figura III.5: Serie en logaritmos de la matriculación de tractores.

Es un caso parecido al de la matriculación de motos, cae desde 1990 hasta 1994 y luego es creciente hasta 2008, es menos oscilatoria que la anterior, pero menos estacionaria. Además a pesar de la Crisis, en los últimos tres años se observa que las matriculaciones vuelven a estar en ascenso. Las variables que intervienen para explicar este modelo son:     

El logaritmo del PIB El efecto calendario de los días laborables del mes Una variable de tendencia para captar el pico negativo que hay en los primeros años Planes Prever I, II y III, bastante positivos Tan solo una variable escalón de crisis en mayo de 2008 con un retardo de 3 meses, es suficiente. (La subida de los últimos años queda recogida en el noise, no la hemos captado con variables explicativas)

Ejemplo III

Ejemplos de MMS (ed.1)

20

Crisis

Figura III.6: Serie en logaritmos de la matriculación de otros vehículos.

Esta serie tiene menos histórico que las anteriores, es bastante estable, tan solo se observa la disminución de las matriculaciones en la época de crisis. Entonces, para explicar esta serie introducimos los inputs:    

El logaritmo del PIB El efecto calendario de los días laborables del mes Dos escalones de crisis, uno en Enero 2008 y otro en Marzo de 2012 Pulso en Diciembre atípico en 2007

III.1 Modelo Nuestro modelo, en MMS, va a constar de 7 submodelos, uno por cada output (matriculaciones por tipo de vehículo). Luego primero se montan los submodelos por separado introduciendo los términos explicativos que mejor se ajustan a cada uno. Luego matemáticamente, tendremos en principio 7 ecuaciones del tipo:

El modelo ARIMA para el ruido es común en todos los submodelos, se podría afinar el modelo, introduciendo para cada submodelo un ARIMA distinto, como se ha hecho con los términos explicativos. En este caso hemos propuesto un proceso

. Cuya ecuación es:

III.2 Inferencia Bayesiana La estadística bayesiana se usa cuando tenemos información a priori de los parámetros. Es decir, la estadística clásica siempre intenta minimizar el error del ajuste (método de máxima verosimilitud) y por ello, pueden aparecen parámetros sin sentido, como por ejemplo que el parámetro de una variable de crisis sea positivo. Entonces con la estadística bayesiana ayudamos al modelo introduciendo información de los parámetros.

Ejemplo III

Ejemplos de MMS (ed.1)

21

Información a priori: Podemos dar una distribución estadística a priori de cuánto debe ser un parámetro. Si sabemos que el parámetro se mueve en torno a 1, debemos de dar como media a priori 1 y la desviación típica depende de lo influyente que queramos que sea esta información.

Figura III.7: Ejemplo de las distribuciones relativas a un parámetro.

Por ejemplo, nosotros queremos que el parámetro del PIB se mueva entorno a 1.5, luego deberemos introducir en el modelo que:

III.2.1 Restricciones de signo, de orden y de igualdad 

En las restricciones de signo podemos indicar que un parámetro sea positivo o negativo. Por ejemplo:



En las restricciones de orden podemos indicar que un parámetro sea menos que otro (o combinaciones de suma parámetros) En las restricciones de igualdad podemos indicar que un parámetro sea igual a otro (o combinación de suma de parámetros)



Por ejemplo en nuestro, caso, queremos que los parámetros de los planes del gobierno salgan positivos, luego introduciremos una variable de restricción de signo. III.2.2 Jerarquías de parámetros Una jerarquía consiste en un modelo de parámetros. Un modelo jerárquico se caracteriza por poder expresar relaciones lineales entre los parámetros, de modo que un parámetro o un conjunto de parámetros pueda escribirse como una regresión de nuevos parámetros inventados auxiliares (hiperparámetros). Por ejemplo, en nuestro modelo queremos que los parámetros que acompañan a la variable Log del PIB se parezcan entre sí (homogeneidad de parámetros), y que además tome un valor similar al que tomaba en el ejemplo 0.

Ejemplo III

Ejemplos de MMS (ed.1)

22

Luego queremos crear una regresión lineal de este tipo:

Donde son los parámetros que acompañan a logaritmo del PIB en cada modelo, es un hiperparámetro y la desviación que queremos que tome. Estas sigmas (o pesos) sirven para indicar el peso que le damos al parámetro correspondiente, es decir, si queremos dar importancia al parámetro del PIB del modelo de total de matriculaciones, pondremos en este caso una sigma más pequeña que en los demás. Además como hemos dicho antes, queremos que todos se muevan entorno a 1.5, luego queremos que el hiperparámetro se distribuya según una normal con media 1.5 y desviación típica 0.2. Luego, una vez definido el modelo, estimamos los parámetros utilizando la estrategia bayesiana (es necesario, cuando hemos introducido información a priori, no podemos utilizar la estrategia máximo verosímil). La estimación de los parámetros del LogPIB de los distintos submodelos es la siguiente: Parámetro Veh.CaF.Mat.0__Log_PIB__Linear.0 Veh.Bus.Mat.0__Log_PIB__Linear.0 Veh.Tur.Mat.0__Log_PIB__Linear.0 Veh.Mot.Mat.0__Log_PIB__Linear.0 Veh.Tra.Mat.0__Log_PIB__Linear.0 Veh.Otr.Mat.0__Log_PIB__Linear.0 Veh.XXX.Mat.0__Log_PIB__Linear.0 MatVeh_Hierarchy_HomogeneityPIB__homogeneity_PIB__Hyper MatVeh_Hierarchy_HomogeneityPIB__Sigma2

Mean 1.623 1.469 1.491 1.617 1.616 1.674 1.563 1.575 0.0197

Sigma 0.17 0.16 0.13 0.17 0.17 0.16 0.15 0.11 0.0172

Tabla III.1: Tabla de parámetros.

Podemos observar que los parámetros han salido homogéneos, en torno a 1.5, como le hemos pedido.

Ejemplo IV

Ejemplos de MMS (ed.1)

23

IV Estimación y previsión de modelos mixtos Un modelo mixto consiste en un modelo que a la vez tiene efectos multiplicativos (como hemos visto hasta ahora) y efectos aditivos, es decir, que cumple la ecuación matemática:

Donde multiplicativos y

representa la suma de los efectos aditivos,

los efectos

la parte explicada por un proceso ARIMA.

Para ilustrar este ejemplo sin adentrarse demasiado en la parte teórica, utilizaremos el ejemplo de matriculación de vehículos en España (ejemplo 0) pero esta vez introduciremos algunos inputs aditivos. Utilizaremos inputs de compensación. Nos referimos a utilizar una serie temporal que definimos como sigue:

Siendo una serie mensual. Es decir toma el valor 1 en un mes y -1 en el mes siguiente. Este tipo de inputs se utilizan cuando hay una descompensación en dos meses consecutivos, esto es que por ejemplo, el efecto de un mes se adelanta al anterior o al revés. Entonces utilizaremos este término explicativo para representar la subida de IVA en España, es decir que en la última subida de septiembre de 2012, se puede observar que muchas matriculaciones bajan en septiembre, y muchas de ellas se han adelantado al mes anterior, agosto, para no pillar esta subida, luego podría haber un efecto compensación. Observamos lo que hemos comentado en la serie temporal, y observamos que en los años anteriores septiembre era más alto que agosto y en este año no es así, en septiembre cae.

Lo que ocurre Lo que se esperaba

Figura IV.1: Comparación del valor de las observaciones con el valor aproximado.

Ejemplo IV

Ejemplos de MMS (ed.1)

24

Luego hemos introducido, dos variables compensación, una en diciembre de 1994, para captar la subida de enero de 1995 y otra en agosto de 2012 para captar la de Septiembre. Los efectos multiplicativos son los mismos que pusimos en el ejemplo 1 y la parte ARIMA también. Por otra parte, a la hora de estimar los parámetros, lo que haremos será aproximar el modelo mixto a un modelo multiplicativo de la siguiente manera:

Donde son las observaciones, el término aditivo y el término multiplicativo y el error que se distribuye normalmente con media 0 y varianza constante . Luego tenemos que estimar: , y obtendremos un residuo

Pero para estimar, utilizamos la aproximación:

Entonces, lo que hacemos es estimar el modelo multiplicativo:

Luego, una vez estimado este modelo, obtenemos los parámetros estimados: Si,

, tenemos que

es una buena estimación de . Por lo tanto, tendremos

los residuos

Entonces, lo que mediremos es que los residuos

aproximen bien a los residuos

Si esto no es así, al realizar la estimación, nos dará un warning comunicándonos que la aproximación no es buena. Pero esto no es demasiado dramático en algunos casos: Warning: [1] [@Estimation::_CheckAdditiveApproximation] La aproximación para el filtro aditivo no es admisible (error: 10.55%)

En el caso de la estimación MLE, y en el caso BSR disminuye un poco: Warning: [8] [@Estimation::_CheckAdditiveApproximation] La aproximación para el filtro aditivo no es admisible (error: 9.78%)

En MMS, cuando el error supera el 2% nos advierte que la aproximación para el filtro aditivo no es buena; y si supera el 5% nos dice que la aproximación no es admisible. Pero en este caso, si comparamos la serie de los residuos, podemos comprobar que el desajuste que produce no es muy escandaloso.

Ejemplo IV

Máximo Mínimo Suma Media Des.Est. Varianza

Ejemplos de MMS (ed.1)

0.2114046 -0.2958954 -1.6245810 -0.0062244 0.0698612 0.0048805

25

0.2114046 -0.2959042 -1.6990158 -0.006223 0.0692321 0.0047930

Figura IV.2: Comparación de los residuos entre la estimación exacta y la variante aproximada. Los parámetros estimados que nos devuelve una estimación máximo verosímil y una bayesiana son los siguientes: parámetro Sigma2 ARIMABlock.1_Period.1__AR.1 ARIMABlock.2_Period.3__AR.3 ARIMABlock.3_Period.12__MA.12 Log_PIB Laborables EUSetup Plan2000E Crisis2008m01d01 Crisis2008m05d01 Crisis2008m05d01__3 CompensIVA2 CompensIVA1

MLE mean 0.0045 0.6596 0.4139 0.6963 1.5583 0.0430 -0.3405 0.2240 -0.2876 -0.2376 -0.1557 10432.1809 13655.7708

sigma 0.0505 0.0616 0.0467 0.2457 0.0034 0.0477 0.0397 0.0536 0.0513 0.0508 1993.163 2369.860

BSR mean 0.0136 0.5709 0.4218 0.5346 1.8293 0.0457 -0.3068 0.2620 -0.1742 -0.1996 -0.2995 9690.091 11526.441

sigma 0.0012 0.1445 0.1753 0.1600 0.2258 0.0088 0.0841 0.0259 0.0434 0.0523 0.0466 5297.630 5773.993

Tabla IV.1: Tabla de parámetros.

Con el MLE tenemos mejor resultados que con BSR, ya que tenemos más precisión e n los parámetros correspondientes a inputs aditivo (con coeficiente de variación, menor que 20%).

Índices

Ejemplos de MMS (ed.1)

26

Índices Índice de figuras Figura I.1: Serie de matriculación de vehículos...........................................................................................................................3 Figura I.2: Serie del PIB. .........................................................................................................................................................................4 Figura I.3: Efectos destacados sobre las matriculaciones de vehículos. ..........................................................................4 Figura I.4: Serie con el logaritmo de las matriculaciones de vehículos. ...........................................................................6 Figura I.5: Ruido del proceso ARIMA del modelo de matriculaciones de vehículos. ..................................................6 Figura I.6: Gráficos de autocorrelaciones del ruido del modelo sin ARIMA. ..................................................................7 Figura I.7: Serie del filtro del modelo, destacando algunos de los inputs introducidos. ...........................................8 Figura I.8: Series del output y la predicción del modelo. ........................................................................................................8 Figura I.9: Gráficos de autocorrelaciones de los residuos del modelo. .............................................................................8 Figura I.10: Serie de matriculaciones de vehículos y su previsión. ....................................................................................9 Figura II.1: Serie de matriculaciones de vehículos y su previsión. .................................................................................. 13 Figura II.2: Serie de matriculaciones de vehículos y su previsión. .................................................................................. 13 Figura III.1: Serie en logaritmos de la matriculación de turismos. .................................................................................. 16 Figura III.2: Serie en logaritmos de la matriculación de autobuses. ............................................................................... 17 Figura III.3: Serie en logaritmos de la matriculación de camiones y furgonetas. ..................................................... 18 Figura III.4: Serie en logaritmos de la matriculación de motos. ....................................................................................... 18 Figura III.5: Serie en logaritmos de la matriculación de tractores. ................................................................................. 19 Figura III.6: Serie en logaritmos de la matriculación de otros vehículos. ..................................................................... 20 Figura III.7: Ejemplo de las distribuciones relativas a un parámetro. ........................................................................... 21 Figura IV.1: Comparación del valor de las observaciones con el valor aproximado. .............................................. 23 Figura IV.2: Comparación de los residuos entre la estimación exacta y la variante aproximada. ..................... 25

Índice de tablas Tabla I.1: Parámetros estimados .......................................................................................................................................................7 Tabla II.1: Tabla con las diferentes estimaciones de los parámetros para el modelo logit. Podemos destacar a AttPrimariaPubMuyMala y a NoEspañol como las variables impulsora y detractora más discriminatorias respectivamente. ..................................................................................................................................... 14 Tabla II.2: Tabla con las diferentes estimaciones de los parámetros para el modelo probit. Podemos destacar a NumeroDiasEspera como el parámetro impulsor que acompaña a una variable cuantitativa: la insatisfacción aumenta con el número de días. El parámetro Edad es un parámetro detractor poco significativo: se podría eliminar esta variable. .............................................................................. 15 Tabla III.1: Tabla de parámetros. .................................................................................................................................................... 22 Tabla IV.1: Tabla de parámetros. .................................................................................................................................................... 25

Índices

Ejemplos de MMS (ed.1)

27

Ejemplos de MMS Edición 1. Fecha: 04/02/2013 Autora: Claudia Escalonilla. Editor: Pedro Gea. Correspondencia: [email protected].

www.bayesforecast.com www.tol-project.org