Table Of ContentThree Essays on Applied Econometrics
Rocío Álvarez Aranda
Three Essays on Applied Econometrics
Rocío Álvarez Aranda
Supervisors: Máximo Camacho y Gabriel Pérez Quirós
Quantitative Economics Doctorate
Departamento de Fundamentos del Análisis Económico
Universidad de Alicante
July 2012
2 Three Essays on Applied Econometrics
A mis padres.
Rocío Álvarez Aranda 3
Agradecimientos
Quiero empezar agradeciendo a mi familia su apoyo a lo largo de toda mi vida. Sin
la motivación de mis padres para conseguir alcanzar mis metas no habría llegado a ser la
persona que soy hoy. Y sobre todo, gracias a mi padre, que fue quien despertó en mi el
interés por las matemáticas. Recuerdo con mucho cariño cuando de pequeña me ensañaba
a calcular raíces cuadradas.
GraciasaGabrielportodosucariño. Ygraciastambiénporsusconsejosycorrecciones
que siempre logran mejorar mis trabajos.
También mi más sincero agradecimiento a mi profesor Paco Palomos, sus clases y
sus consejos hicieron que finalmente me decidiera a estudiar esa misteriosa ciencia las
Matemáticas.
A mis dos directores de tesis, Máximo Camacho y Gabriel Pérez Quirós, les estaré
eternamente agradecida por su ayuda y apoyo durante estos últimos años. No sólo en
lo profesional sino también en lo personal, sus consejos han logrado que me sienta más
segura para afrontar cualquier reto en el futuro.
Esta tesis no podría haberse llevado a cabo sin la ayuda de los miembros del departa-
mento de Fundamentos del Análisis Económico, a los que estoy sinceramente agradecida
y recordaré siempre con mucho cariño.
También quiero agradecer al Ministerio de Ciencia e Innovación no sólo por su ayuda
financiera (BES-2008-008153 y SEJ2007-62656) sino también por darme la oportunidad
de visitar la Universidad Queen Mary University of London y conocer a Ana Galvao, a la
que estoy muy agradecida por su acogida durante mi estancia y por su ayuda que no ha
cesado desde que nos conocimos.
4 Three Essays on Applied Econometrics
Contents
Agradecimientos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Bibliography . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1 Finite Sample Performance of Small versus Large Scaly Dynamic Factor
Model 23
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2 Dynamic factor models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.2.1 Small scale dynamic factor models . . . . . . . . . . . . . . . . . . 27
1.2.2 Large scale dynamic factor models . . . . . . . . . . . . . . . . . . 28
1.3 Designing the simulation study . . . . . . . . . . . . . . . . . . . . . . . . 29
1.3.1 Forecasting scenarios . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.3.2 Generating small data sets . . . . . . . . . . . . . . . . . . . . . . . 30
1.3.3 Generating large data sets . . . . . . . . . . . . . . . . . . . . . . . 31
1.3.4 Generating the target series . . . . . . . . . . . . . . . . . . . . . . 32
1.4 Simulation results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.4.1 Factor estimates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.4.2 Forecasting accuracy . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.5 Empirical analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.5.1 Preliminary analysis of data . . . . . . . . . . . . . . . . . . . . . . 39
1.5.2 Forecasting accuracy . . . . . . . . . . . . . . . . . . . . . . . . . . 40
1.6 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Bibliography . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Tables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
Figures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5
6 Three Essays on Applied Econometrics
2 Confidence Intervals for the Probability of Being in a Recession 63
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.2 Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.3 Asymptotic normal approximation . . . . . . . . . . . . . . . . . . . . . . . 69
2.4 Bootstrap Confidence Intervals . . . . . . . . . . . . . . . . . . . . . . . . 72
2.4.1 Parametric Bootstrap (PB) Confidence Intervals . . . . . . . . . . . 73
2.4.2 Moving Block Bootstrap (MBB) Confidence Intervals . . . . . . . . 74
2.5 Monte Carlo simulations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.5.1 Asymptotic Normal Confidence Intervals . . . . . . . . . . . . . . . 78
2.5.2 Bootstrap Confidence Intervals . . . . . . . . . . . . . . . . . . . . 79
2.6 Empirical Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
2.6.1 Backwards Estimation . . . . . . . . . . . . . . . . . . . . . . . . . 80
2.6.2 Real Time Estimation . . . . . . . . . . . . . . . . . . . . . . . . . 81
2.7 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
Bibliography . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Tables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Figures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
Appendix A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Appendix B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
3 Improving Inferences about the State of an Economy 109
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
3.2 Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
3.3 Asymptotic distribution of the Recession Probability Estimator . . . . . . 113
3.4 Confidence intervals of recession probabilities . . . . . . . . . . . . . . . . . 113
3.5 Monte Carlo simulation exercise . . . . . . . . . . . . . . . . . . . . . . . . 114
3.6 Empirical application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.6.1 Backwards estimation . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.6.2 Real time estimation . . . . . . . . . . . . . . . . . . . . . . . . . . 119
3.7 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
Bibliography . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Tables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Figures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
Rocío Álvarez Aranda 7
Introducción
Esta tesis está compuesta de tres trabajos de investigación que pueden ser leídos inde-
pendientemente. Lostrescapítulostratanimportantestemasenlaliteraturaeconométrica,
talescomolaóptimaseleccióndelosdatosylareducciónenlaincertidumbreenelproceso
de estimación.
El aumento del número de series disponibles hoy en día para llevar a cabo un análisis,
una estimación o predicción, ha dado lugar a nuevas discusiones sobre el número óptimo y
métodosdeseleccióndeseriesparaminimizarelerrorolaincertidumbreenunaestimación
opredicción. Enestatesismecentroenelproblemadelnúmeroóptimoyselecciónóptima
de series para estimaciones y predicciones de series Macroeconómicas o Financieras con
modelos de componentes no observadas, como son los modelos de factores comunes no
observados y modelos de cambio de estado mediante procesos de Markov. Sobre este
último modelo, mi investigación es novel en el sentido de que introduzco en el segundo
capítulo de mi tesis las herramientas necesarias para poder llevar a cabo el análisis sobre
el número óptimo y mejores propiedades de la series que serán incluidas en el modelo para
realizar una predicción o estimación de la probabilidad de estar en recesión o en expansión
una determinada economía.
La organización de mi tesis es la siguiente. En el Capítulo 1 analizo el problema de
selección de variables para realizar una predicción de una serie de interés usando una
estimación de los factores comunes no observables de un determinado conjunto de datos.
EnelsegundoCapítuloderivounadistribuciónasintóticadelestimadordelaprobabilidad
de estar en recesión dada por el filtro de Hamilton en un modelo de cambio de estado de
Markov. A partir de esta distribución asintótica se puede medir la incertidumbre sobre la
probabilidad de recesión estimada y calcular intervalos de confianza del verdadero valor
de la probabilidad de recesión dada por el filtro de Hamilton. Además, esta medida de la
incertidumbre sobre la estimación de la probabilidad de recesión me permite llevar a cabo
en el Capítulo 3 un análisis sobre el efecto que el incremento del número de series con
diferentes características tiene sobre la estimación de la probabilidad de estar en recesión.
Como ya he mencionado antes, este es, según mi conocimiento, el primer trabajo de
investigación sobre este tema ya que no había hasta ahora ninguna medida disponible
para determinar la variabilidad del estimador de la probabilidad de estar en recesión.
A continuación paso a detallar de forma más precisa en qué consiste cada uno de los
capítulos de mi tesis, prestando especial atención a la motivación y contribución de cada
uno de ellos.
8 Three Essays on Applied Econometrics
Capítulo 1. Finite Sample Performance of Small Versus Large
Scale Dynamic Factor Models
Este capítulo es un trabajo conjunto con Máximo Camacho y Gabriel Pérez-Quirós.
En este trabajo desarrollamos un profundo análisis de la óptima selección de datos en
modelos de factores comunes dinámicos. Estos modelos son principalmente usados para
determinar el estado de una economía a partir de un conjunto de indicadores económicos.
La idea subyacente en los modelos de factores es que la economía de un país evoluciona
de manera conjunta, lo que es generalmente conocido como el ciclo económico.
Como el título del capítulo indica, existen dos corrientes diferenciadas de modelos
de factores comunes. Los defensores de los modelos a pequeña escala consideran que
para una mejor estimación de los factores se debe realizar una selección exhaustiva de
los indicadores. En este caso, los factores se estiman mediante un estimador de Máxima
Verosimilitud Exacto vía de Kalman Filter. En esta corriente se encuentran artículos
como los de Aruoba, Diebold y Scotti [0.2] y Camacho y Pérez Quirós [0.6]. Por otro
lado, losdefensoresdelosmodelosagranescalaargumentanquedebidoaqueactualmente
hay disponible un gran número de indicadores económicos y a la mayor potencia de los
ordenadores es factible realizar estimaciones a partir de una base datos con cientos de
indicadores. En este sentido, Stock y Watson [0.14] y Doz, Giannone y Reichlin [0.8]
introdujeron cada uno de ellos procedimientos para llevar a cabo la estimación de lo
factores comunes a partir de una base de datos contiendo más de cien indicadores. Este
modelo ha sido utilizado para determinar el estado de la economía en EE.UU. en artículos
como Stock y Watson [0.15], Mariano y Murasawa [0.11] y Giannone, Reichlin y Small
[0.9].
En la literatura existen artículos que analizan para los modelos de factores a gran
escala si efectivamente cuanto mayor es el número de series se obtiene mejor información
y por tanto, se mejora la estimación de los factores. Éste sería el caso de artículos
como los de Boivin y Ng [0.4] y Caggiano, Kapetanios y Labhard [0.5], que concluyen
que no siempre al aumentar el número de series se consiguen mejores estimaciones de los
factores. De hecho, las propiedades de las series que se añaden en función de si son buenos
o malos indicadores determinan las propiedades de las estimaciones. En todo caso, ellos
argumentan que a partir de 60 series se empeora la estimación de factores. Aunque aún
persiste el problema sobre la selección de esas 60 series.
Lo que nosotros planteamos en nuestra investigación es que si en los artículos en la
literatura consideran que en cualquier caso una selección de las variables disponibles es
necesario,enquécircunstanciasunaselecciónmásexhaustivaconunnúmeromuypequeño
de series, no más de 10 series, proporciona mejores resultados que una selección más laxa
con un mayor número de series para utilizar el factor estimado para llevar a cabo una
predicción de una serie determinada.
Un ejemplo real de dos estimaciones de factores con dos bases de datos de distinto
Rocío Álvarez Aranda 9
tamaño lo encontramos en dos indicadores desarrollados por dos bancos centrales de
EE.UU. El banco de la Reserva Federal de Chicago (Federal Reserve Bank of Chicago)
elaboraelÍndicedeActividadNacional, elChicagoFEDNationalAcitivyIndex, elcuales
una estimación de un factor común obtenido de un total de 85 indicadores de la economía
de EE.UU. El factor común es obtenido mediante un estimador no paramétrico denom-
inado estimador de Componentes Principales dado por Stock y Watson [0.14]. Por otro
lado, el banco de la Reserva Federal de Filadelfía (Federal Reserve Bank of Philadelphia)
reporta el Índice de la Condición Económica de Aruoba-Diebold y Scotti, el Aruoba-
Diebold and Scotti Business Condition Index, el cual es un índice obtenido a partir de
sólo seis indicadores de la economía de EE.UU. El índice es un factor común estimado
mediante un estimador de Máxima Verosimilitud exacto. Por lo tanto, estos dos índices
proveendosestimadoresdelestadodelaeconomíadeEE.UU.apartirdedosmetodologías
distintas. Nuestra investigación aborda la cuestión de si efectivamente sólo 6 indicadores
no son suficientes y con más series se obtendría una mejor estimación del estado de la
economía, o por el contrario, al incluir un gran número de series en la base de datos
podríamos estar introduciendo demasiado ruido en la estimación o tal vez obtener estima-
ciones sesgadas al estar sobrevalorando una determinada área de la economía de EE.UU.
Para llevar a cabo nuestro análisis realizamos un ejercicio de Monte Carlo en el que
generamos un total de cien series a partir de un factor común. Esta base de datos con-
stituirá la base de datos a gran escala. Para obtener la base de datos a pequeña escala,
consideramos que las cien series están clasificadas en categorías, por ejemplo, estas cate-
gorías representarían indicadores de empleo, índices de producción, índices de precios, etc.
Seleccionamos de cada categoría la serie más representativa. Aquí tenemos un problema
a la hora de seleccionar la serie más representativa. Con datos reales el criterio del inves-
tigador decide la selección de la serie, pero en un ejercicio de Monte Carlo se requiere un
procedimiento automático. Por ello, consideramos la serie representativa de una categoría
es aquella que tiene el máximo nivel de correlación media con las otras series de la misma
categoría.
Una vez que tenemos las dos bases de datos, estimamos vía el filtro de Kalman los
factores por un estimador de Máximo Verosimilitud Exacto en el caso de la base de datos
de pequeña escala, y un estimador de Máximo Verosimilitud Aproximado dado por Doz,
Giannone y Reichlin [0.8] para la base de datos a gran escala. Dado que trabajamos
con una base de datos ficticia, podemos comparar los factores estimados con los factores
creados. Además, como con datos reales esta comparación no se puede llevar a cabo ya
que los factores no son observados, creamos una nueva variable a partir de los factores
y comparamos la predicción de una serie creada con los verdaderos factores con una
predicción de la serie mediante los factores estimados. Los resultados muestran que en
ambos casos, tanto en la estimación de los factores como en la predicción de la serie, la
selección exhaustiva de los datos proporciona mejores resultados que una selección más
laxa cuando las series incluidas en una categoría tienen un alto nivel de correlación en su
Description:2 Confidence Intervals for the Probability of Being in a Recession 63. 2.1 Introduction. dex of consumer goods and the industrial production index of non durable goods account . Business cycle asymmetries in stock returns:.