Three Essays on Applied Econometrics Rocío Álvarez Aranda Three Essays on Applied Econometrics Rocío Álvarez Aranda Supervisors: Máximo Camacho y Gabriel Pérez Quirós Quantitative Economics Doctorate Departamento de Fundamentos del Análisis Económico Universidad de Alicante July 2012 2 Three Essays on Applied Econometrics A mis padres. Rocío Álvarez Aranda 3 Agradecimientos Quiero empezar agradeciendo a mi familia su apoyo a lo largo de toda mi vida. Sin la motivación de mis padres para conseguir alcanzar mis metas no habría llegado a ser la persona que soy hoy. Y sobre todo, gracias a mi padre, que fue quien despertó en mi el interés por las matemáticas. Recuerdo con mucho cariño cuando de pequeña me ensañaba a calcular raíces cuadradas. GraciasaGabrielportodosucariño. Ygraciastambiénporsusconsejosycorrecciones que siempre logran mejorar mis trabajos. También mi más sincero agradecimiento a mi profesor Paco Palomos, sus clases y sus consejos hicieron que finalmente me decidiera a estudiar esa misteriosa ciencia las Matemáticas. A mis dos directores de tesis, Máximo Camacho y Gabriel Pérez Quirós, les estaré eternamente agradecida por su ayuda y apoyo durante estos últimos años. No sólo en lo profesional sino también en lo personal, sus consejos han logrado que me sienta más segura para afrontar cualquier reto en el futuro. Esta tesis no podría haberse llevado a cabo sin la ayuda de los miembros del departa- mento de Fundamentos del Análisis Económico, a los que estoy sinceramente agradecida y recordaré siempre con mucho cariño. También quiero agradecer al Ministerio de Ciencia e Innovación no sólo por su ayuda financiera (BES-2008-008153 y SEJ2007-62656) sino también por darme la oportunidad de visitar la Universidad Queen Mary University of London y conocer a Ana Galvao, a la que estoy muy agradecida por su acogida durante mi estancia y por su ayuda que no ha cesado desde que nos conocimos. 4 Three Essays on Applied Econometrics Contents Agradecimientos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Bibliography . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1 Finite Sample Performance of Small versus Large Scaly Dynamic Factor Model 23 1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 1.2 Dynamic factor models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 1.2.1 Small scale dynamic factor models . . . . . . . . . . . . . . . . . . 27 1.2.2 Large scale dynamic factor models . . . . . . . . . . . . . . . . . . 28 1.3 Designing the simulation study . . . . . . . . . . . . . . . . . . . . . . . . 29 1.3.1 Forecasting scenarios . . . . . . . . . . . . . . . . . . . . . . . . . . 30 1.3.2 Generating small data sets . . . . . . . . . . . . . . . . . . . . . . . 30 1.3.3 Generating large data sets . . . . . . . . . . . . . . . . . . . . . . . 31 1.3.4 Generating the target series . . . . . . . . . . . . . . . . . . . . . . 32 1.4 Simulation results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 1.4.1 Factor estimates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 1.4.2 Forecasting accuracy . . . . . . . . . . . . . . . . . . . . . . . . . . 37 1.5 Empirical analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 1.5.1 Preliminary analysis of data . . . . . . . . . . . . . . . . . . . . . . 39 1.5.2 Forecasting accuracy . . . . . . . . . . . . . . . . . . . . . . . . . . 40 1.6 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 Bibliography . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 Tables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 Figures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 5 6 Three Essays on Applied Econometrics 2 Confidence Intervals for the Probability of Being in a Recession 63 2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 2.2 Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 2.3 Asymptotic normal approximation . . . . . . . . . . . . . . . . . . . . . . . 69 2.4 Bootstrap Confidence Intervals . . . . . . . . . . . . . . . . . . . . . . . . 72 2.4.1 Parametric Bootstrap (PB) Confidence Intervals . . . . . . . . . . . 73 2.4.2 Moving Block Bootstrap (MBB) Confidence Intervals . . . . . . . . 74 2.5 Monte Carlo simulations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 2.5.1 Asymptotic Normal Confidence Intervals . . . . . . . . . . . . . . . 78 2.5.2 Bootstrap Confidence Intervals . . . . . . . . . . . . . . . . . . . . 79 2.6 Empirical Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 2.6.1 Backwards Estimation . . . . . . . . . . . . . . . . . . . . . . . . . 80 2.6.2 Real Time Estimation . . . . . . . . . . . . . . . . . . . . . . . . . 81 2.7 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 Bibliography . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 Tables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 Figures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 Appendix A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 Appendix B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 3 Improving Inferences about the State of an Economy 109 3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 3.2 Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 3.3 Asymptotic distribution of the Recession Probability Estimator . . . . . . 113 3.4 Confidence intervals of recession probabilities . . . . . . . . . . . . . . . . . 113 3.5 Monte Carlo simulation exercise . . . . . . . . . . . . . . . . . . . . . . . . 114 3.6 Empirical application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 3.6.1 Backwards estimation . . . . . . . . . . . . . . . . . . . . . . . . . 117 3.6.2 Real time estimation . . . . . . . . . . . . . . . . . . . . . . . . . . 119 3.7 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 Bibliography . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 Tables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 Figures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 Rocío Álvarez Aranda 7 Introducción Esta tesis está compuesta de tres trabajos de investigación que pueden ser leídos inde- pendientemente. Lostrescapítulostratanimportantestemasenlaliteraturaeconométrica, talescomolaóptimaseleccióndelosdatosylareducciónenlaincertidumbreenelproceso de estimación. El aumento del número de series disponibles hoy en día para llevar a cabo un análisis, una estimación o predicción, ha dado lugar a nuevas discusiones sobre el número óptimo y métodosdeseleccióndeseriesparaminimizarelerrorolaincertidumbreenunaestimación opredicción. Enestatesismecentroenelproblemadelnúmeroóptimoyselecciónóptima de series para estimaciones y predicciones de series Macroeconómicas o Financieras con modelos de componentes no observadas, como son los modelos de factores comunes no observados y modelos de cambio de estado mediante procesos de Markov. Sobre este último modelo, mi investigación es novel en el sentido de que introduzco en el segundo capítulo de mi tesis las herramientas necesarias para poder llevar a cabo el análisis sobre el número óptimo y mejores propiedades de la series que serán incluidas en el modelo para realizar una predicción o estimación de la probabilidad de estar en recesión o en expansión una determinada economía. La organización de mi tesis es la siguiente. En el Capítulo 1 analizo el problema de selección de variables para realizar una predicción de una serie de interés usando una estimación de los factores comunes no observables de un determinado conjunto de datos. EnelsegundoCapítuloderivounadistribuciónasintóticadelestimadordelaprobabilidad de estar en recesión dada por el filtro de Hamilton en un modelo de cambio de estado de Markov. A partir de esta distribución asintótica se puede medir la incertidumbre sobre la probabilidad de recesión estimada y calcular intervalos de confianza del verdadero valor de la probabilidad de recesión dada por el filtro de Hamilton. Además, esta medida de la incertidumbre sobre la estimación de la probabilidad de recesión me permite llevar a cabo en el Capítulo 3 un análisis sobre el efecto que el incremento del número de series con diferentes características tiene sobre la estimación de la probabilidad de estar en recesión. Como ya he mencionado antes, este es, según mi conocimiento, el primer trabajo de investigación sobre este tema ya que no había hasta ahora ninguna medida disponible para determinar la variabilidad del estimador de la probabilidad de estar en recesión. A continuación paso a detallar de forma más precisa en qué consiste cada uno de los capítulos de mi tesis, prestando especial atención a la motivación y contribución de cada uno de ellos. 8 Three Essays on Applied Econometrics Capítulo 1. Finite Sample Performance of Small Versus Large Scale Dynamic Factor Models Este capítulo es un trabajo conjunto con Máximo Camacho y Gabriel Pérez-Quirós. En este trabajo desarrollamos un profundo análisis de la óptima selección de datos en modelos de factores comunes dinámicos. Estos modelos son principalmente usados para determinar el estado de una economía a partir de un conjunto de indicadores económicos. La idea subyacente en los modelos de factores es que la economía de un país evoluciona de manera conjunta, lo que es generalmente conocido como el ciclo económico. Como el título del capítulo indica, existen dos corrientes diferenciadas de modelos de factores comunes. Los defensores de los modelos a pequeña escala consideran que para una mejor estimación de los factores se debe realizar una selección exhaustiva de los indicadores. En este caso, los factores se estiman mediante un estimador de Máxima Verosimilitud Exacto vía de Kalman Filter. En esta corriente se encuentran artículos como los de Aruoba, Diebold y Scotti [0.2] y Camacho y Pérez Quirós [0.6]. Por otro lado, losdefensoresdelosmodelosagranescalaargumentanquedebidoaqueactualmente hay disponible un gran número de indicadores económicos y a la mayor potencia de los ordenadores es factible realizar estimaciones a partir de una base datos con cientos de indicadores. En este sentido, Stock y Watson [0.14] y Doz, Giannone y Reichlin [0.8] introdujeron cada uno de ellos procedimientos para llevar a cabo la estimación de lo factores comunes a partir de una base de datos contiendo más de cien indicadores. Este modelo ha sido utilizado para determinar el estado de la economía en EE.UU. en artículos como Stock y Watson [0.15], Mariano y Murasawa [0.11] y Giannone, Reichlin y Small [0.9]. En la literatura existen artículos que analizan para los modelos de factores a gran escala si efectivamente cuanto mayor es el número de series se obtiene mejor información y por tanto, se mejora la estimación de los factores. Éste sería el caso de artículos como los de Boivin y Ng [0.4] y Caggiano, Kapetanios y Labhard [0.5], que concluyen que no siempre al aumentar el número de series se consiguen mejores estimaciones de los factores. De hecho, las propiedades de las series que se añaden en función de si son buenos o malos indicadores determinan las propiedades de las estimaciones. En todo caso, ellos argumentan que a partir de 60 series se empeora la estimación de factores. Aunque aún persiste el problema sobre la selección de esas 60 series. Lo que nosotros planteamos en nuestra investigación es que si en los artículos en la literatura consideran que en cualquier caso una selección de las variables disponibles es necesario,enquécircunstanciasunaselecciónmásexhaustivaconunnúmeromuypequeño de series, no más de 10 series, proporciona mejores resultados que una selección más laxa con un mayor número de series para utilizar el factor estimado para llevar a cabo una predicción de una serie determinada. Un ejemplo real de dos estimaciones de factores con dos bases de datos de distinto Rocío Álvarez Aranda 9 tamaño lo encontramos en dos indicadores desarrollados por dos bancos centrales de EE.UU. El banco de la Reserva Federal de Chicago (Federal Reserve Bank of Chicago) elaboraelÍndicedeActividadNacional, elChicagoFEDNationalAcitivyIndex, elcuales una estimación de un factor común obtenido de un total de 85 indicadores de la economía de EE.UU. El factor común es obtenido mediante un estimador no paramétrico denom- inado estimador de Componentes Principales dado por Stock y Watson [0.14]. Por otro lado, el banco de la Reserva Federal de Filadelfía (Federal Reserve Bank of Philadelphia) reporta el Índice de la Condición Económica de Aruoba-Diebold y Scotti, el Aruoba- Diebold and Scotti Business Condition Index, el cual es un índice obtenido a partir de sólo seis indicadores de la economía de EE.UU. El índice es un factor común estimado mediante un estimador de Máxima Verosimilitud exacto. Por lo tanto, estos dos índices proveendosestimadoresdelestadodelaeconomíadeEE.UU.apartirdedosmetodologías distintas. Nuestra investigación aborda la cuestión de si efectivamente sólo 6 indicadores no son suficientes y con más series se obtendría una mejor estimación del estado de la economía, o por el contrario, al incluir un gran número de series en la base de datos podríamos estar introduciendo demasiado ruido en la estimación o tal vez obtener estima- ciones sesgadas al estar sobrevalorando una determinada área de la economía de EE.UU. Para llevar a cabo nuestro análisis realizamos un ejercicio de Monte Carlo en el que generamos un total de cien series a partir de un factor común. Esta base de datos con- stituirá la base de datos a gran escala. Para obtener la base de datos a pequeña escala, consideramos que las cien series están clasificadas en categorías, por ejemplo, estas cate- gorías representarían indicadores de empleo, índices de producción, índices de precios, etc. Seleccionamos de cada categoría la serie más representativa. Aquí tenemos un problema a la hora de seleccionar la serie más representativa. Con datos reales el criterio del inves- tigador decide la selección de la serie, pero en un ejercicio de Monte Carlo se requiere un procedimiento automático. Por ello, consideramos la serie representativa de una categoría es aquella que tiene el máximo nivel de correlación media con las otras series de la misma categoría. Una vez que tenemos las dos bases de datos, estimamos vía el filtro de Kalman los factores por un estimador de Máximo Verosimilitud Exacto en el caso de la base de datos de pequeña escala, y un estimador de Máximo Verosimilitud Aproximado dado por Doz, Giannone y Reichlin [0.8] para la base de datos a gran escala. Dado que trabajamos con una base de datos ficticia, podemos comparar los factores estimados con los factores creados. Además, como con datos reales esta comparación no se puede llevar a cabo ya que los factores no son observados, creamos una nueva variable a partir de los factores y comparamos la predicción de una serie creada con los verdaderos factores con una predicción de la serie mediante los factores estimados. Los resultados muestran que en ambos casos, tanto en la estimación de los factores como en la predicción de la serie, la selección exhaustiva de los datos proporciona mejores resultados que una selección más laxa cuando las series incluidas en una categoría tienen un alto nivel de correlación en su
Description: