Introducción a la econometría Un enfoque moderno 4a. edición Jeffrey M. Wooldridge Michigan State University Traducción Ma. del Carmen Enriqueta Hano Roa Érika M. Jasso Hernan D´Borneville Traductoras profesionales Revisión técnica Roberto Palma Pacheco Centro de Alta Dirección en Economía y Negocios Universidad Anáhuac Domingo Rodríguez Benavides Facultad de Economía Universidad Nacional Autónoma de México Australia • Brasil • Corea • España • Estados Unidos • Japón • México • Reino Unido • Singapur Introducción a la econometría © D.R. 2010 por Cengage Learning Edi to res, S.A. de C.V., Un enfoque moderno una Compañía de Cengage Lear ning, Inc. 4a. edición Corporativo Santa Fe Jeffrey M. Wooldridge Av. Santa Fe núm. 505, piso 12 Col. Cruz Manca, Santa Fe Presidente de Cengage Learning C.P. 05349, México, D.F. Latinoamérica: Cengage Lear ning™ es una mar ca re gis tra da Javier Arellano Gutiérrez usa da ba jo per mi so. Director general México y DE RE CHOS RE SER VA DOS. Ninguna parte de Centroamérica: este trabajo amparado por la Ley Federal del Pedro Turbay Garrido Derecho de Autor, podrá ser re pro ducida, transmitida, almacenada o utilizada en Director editorial Latinoamérica: cualquier forma o por cualquier medio, ya sea José Tomás Pérez Bonilla gráfico, electrónico o mecánico, incluyendo, pero sin limitarse a lo siguiente: fotocopiado, Director de producción: reproducción, escaneo, digitalización, Raúl D. Zendejas Espejel grabación en audio, distribución en internet, distribución en redes de información o Coordinadora editorial: almacenamiento y recopilación en sistemas María Rosas López de información a excepción de lo permitido en el Capítulo III, Artículo 27 de la Ley Federal Editor senior: del Derecho de Autor, sin el consentimiento Javier Reyes Martínez por escrito de la Editorial. Editora de producción: Abril Vega Orozco Traducido del libro Introductory Econometrics, Fourth Edition. Diseño de portada: Publicado en inglés por South-Western DIHO Comunicación gráfica Cengage Learning ©2009 ISBN-13: 978-0-324-66054-8 Imagen de portada: ISBN-10: 0-324-66054-5 Stock.xchng Datos para catalogación bibliográfi ca: Composición tipográfica: Wooldridge, Jeffrey M. Introducción a la Heriberto Gachúz Chávez econometría. Un enfoque moderno, 4a. edición. ISBN-13: 978-607-481-312-8 ISBN-10: 607-481-312-4 Visite nuestro sitio en: http://latinoamerica.cengage.com Contenido breve Capítulo 1 La naturaleza de la econometría y los datos económicos 1 PARTE 1: ANÁLISIS DE REGRESIÓN CON DATOS DE CORTE TRANSVERSAL 21 Capítulo 2 El modelo de regresión simple 22 Capítulo 3 Análisis de regresión múltiple: estimación 68 Capítulo 4 Análisis de regresión múltiple: inferencia 117 Capítulo 5 Análisis de regresión múltiple: MCO asintóticos 167 Capítulo 6 Análisis de regresión múltiple: temas adicionales 184 Capítulo 7 Análisis de regresión múltiple con información cualitativa: variables binarias (o dummy) 225 Capítulo 8 Heterocedasticidad 264 Capítulo 9 Más sobre especifi cación y temas de datos 300 PARTE 2: ANÁLISIS DE REGRESIÓN CON DATOS DE SERIES DE TIEMPO 339 Capítulo 10 Análisis básico de regresión con datos de series de tiempo 340 Capítulo 11 Aspectos adicionales de MCO con datos de series de tiempo 377 Capítulo 12 Correlación serial y heterocedasticidad en regresiones de series de tiempo 408 PARTE 3: TEMAS AVANZADOS 443 Capítulo 13 Combinación de cortes transversales en el tiempo: métodos simples para datos de panel 444 Capítulo 14 Métodos avanzados para datos de panel 481 Capítulo 15 Estimación con variables instrumentales y mínimos cuadrados en dos etapas 506 Capítulo 16 Modelos de ecuaciones simultáneas 546 Capítulo 17 Modelos de variable dependiente limitada y correcciones a la selección muestral 574 Capítulo 18 Temas avanzados de series de tiempo 623 Capítulo 19 Realización de un proyecto empírico 668 APÉNDICE Apéndice A Herramientas matemáticas básicas 695 Apéndice B Fundamentos de probabilidad 714 Apéndice C Fundamentos de estadística matemática 747 Apéndice D Resumen de álgebra matricial 788 Apéndice E El modelo de regresión lineal en forma matricial 799 Apéndice F Respuestas a las preguntas del capítulo 813 Apéndice G Tablas estadísticas 823 Referencias 830 Glosario 835 Índice 849 iii Contenido detallado 2.5 Valores esperados y varianzas de los estimadores CAPÍTULO 1 por MCO 46 La naturaleza de la econometría Insesgadez de los estimadores MCO 47 y los datos económicos 1 Varianza de los estimadores por mínimos cuadrados 52 Estimación de la varianza del error 56 1.1 ¿Qué es la econometría? 1 2.6 Regresión a través del origen 58 1.2 Pasos en un análisis económico empírico 2 Resumen 59 1.3 Estructura de los datos económicos 5 Términos clave 60 Datos de corte transversal 5 Problemas 61 Datos de series de tiempo 8 Ejercicios en computadora 64 Combinación de cortes transversales 9 Apéndice 2A 66 Datos de panel o longitudinales 10 Comentario sobre las estructuras de datos 12 CAPÍTULO 3 1.4 Causalidad y la noción de ceteris paribus en el análisis econométrico 12 Análisis de regresión múltiple: Resumen 17 estimación 68 Términos clave 17 Problemas 17 3.1 Motivación para la regresión múltiple 68 Ejercicios en computadora 18 El modelo con dos variables independientes 68 Modelo con k variables independientes 71 PARTE 1 3.2 Mecánica e interpretación de los mínimos cuadrados ordinarios 73 Análisis de regresión con Obtención de las estimaciones de MCO 73 datos de corte transversal 21 Interpretación de la ecuación de regresión de MCO 74 El significado de “mantener todos los demás CAPÍTULO 2 factores constantes” en la regresión múltiple 77 El modelo de regresión simple 22 Cambiar de manera simultánea más de una variable independiente 77 2.1 Definición del modelo de regresión simple 22 Valores ajustados y residuales de MCO 77 2.2 Obtención de las estimaciones por mínimos Una interpretación de descuento de efectos cuadrados ordinarios 27 parciales de la regresión múltiple 78 Nota sobre la terminología 35 Comparación entre las estimaciones de la 2.3 Propiedades de los MCO en cualquier muestra regresión simple y de la regresión múltiple 79 de datos 36 Bondad de ajuste 80 Valores ajustados y residuales 36 Regresión a través del origen 83 Propiedades algebraicas de los estadísticos 3.3 Valor esperado de los estimadores de MCO 84 MCO 37 Inclusión de variables irrelevantes Bondad de ajuste 40 en un modelo de regresión 89 2.4 Unidades de medición y forma funcional 41 Sesgo de la variable omitida: caso sencillo 89 Efectos de los cambios de unidades de medición Sesgo de la variable omitida: casos más sobre los estadísticos obtenidos por MCO 41 generales 93 Incorporación de no linealidades 3.4 Varianza de los estimadores de MCO 94 en la regresión simple 43 Los componentes de las varianzas de los Significado de regresión “lineal” 46 estimadores de MCO: multicolinealidad 95 iv Contenido v Varianzas en modelos mal especificados 99 5.2 Normalidad asintótica e inferencia Estimación de (cid:2)2: errores estándar con muestras grandes 172 de los estimadores de MCO 101 Otras pruebas con muestras grandes: 3.5 Eficiencia de MCO: el teorema el estadístico multiplicador de Lagrange 176 de Gauss-Markov 102 5.3 Eficiencia asintótica de MCO 179 Resumen 104 Resumen 180 Términos clave 105 Términos clave 181 Problemas 105 Problemas 181 Ejercicios en computadora 110 Ejercicios en computadora 181 Apéndice 3A 113 Apéndice 5A 182 CAPÍTULO 4 CAPÍTULO 6 Análisis de regresión múltiple: Análisis de regresión múltiple: inferencia 117 temas adicionales 184 4.1 Distribución de muestreo de los estimadores 6.1 Efectos del escalamiento de datos de MCO 117 sobre los estadísticos de MCO 184 4.2 Prueba de hipótesis para un solo parámetro Coeficientes beta 187 poblacional: la prueba t 120 6.2 Más acerca de la forma funcional 189 Pruebas contra alternativas de una cola 123 Más acerca del empleo de las Alternativas de dos colas 128 formas funcionales logarítmicas 189 Otras pruebas de hipótesis acerca de (cid:3) 130 j Modelos con funciones cuadráticas 192 Cálculo del valor-p en las pruebas-t 133 Modelos con términos de interacción 197 Repaso del lenguaje empleado en las 6.3 Más sobre bondad de ajuste y selección pruebas de hipótesis clásicas 135 de los regresores 199 Significancia económica o práctica R-cuadrada ajustada 200 frente a significancia estadística 135 Uso de la R-cuadrada ajustada para 4.3 Intervalos de confianza 138 elegir entre modelos no anidados 201 4.4 Pruebas de hipótesis de una sola Control de demasiados factores combinación lineal de los parámetros 140 en un análisis de regresión 203 4.5 Pruebas para restricciones lineales múltiples: Adición de regresores para reducir la prueba F 143 la varianza del error 205 Prueba para las restricciones 6.4 Predicción y análisis de residuales 206 de exclusión 143 Intervalos de confianza para predicciones 206 Relación entre los estadísticos F y t 149 Análisis de residuales 209 Forma R-cuadrada del estadístico F 150 Predicción de y cuando log(y) es la variable Cálculo de los valores-p para dependiente 210 pruebas F 151 Resumen 215 El estadístico F para la significancia Términos clave 215 general de una regresión 152 Problemas 216 Prueba para las restricciones Ejercicios en computadora 218 generales lineales 153 Apéndice 6A 223 4.6 Informe de los resultados de la regresión 154 Resumen 156 CAPÍTULO 7 Términos clave 158 Análisis de regresión múltiple Problemas 159 Ejercicios en computadora 163 con información cualitativa: variables binarias (o dummy) 225 CAPÍTULO 5 Análisis de regresión múltiple: 7.1 Descripción de la información cualitativa 225 MCO asintóticos 167 7.2 Una sola variable binaria independiente 226 Interpretación de los coeficientes de variables 5.1 Consistencia 167 explicativas binarias cuando la variable Obtención de la inconsistencia en MCO 170 dependiente es log(y) 231 vi Contenido 7.3 Uso de variables binarias en categorías 9.2 Uso de las variables proxy para las variables múltiples 233 explicativas no observadas 306 Incorporación de información ordinal mediante Utilización de variables dependientes rezagadas el uso de variables binarias 235 como variables proxy 310 7.4 Interacciones en las que intervienen variables Un enfoque diferente de la regresión binarias 238 múltiple 312 Interacciones entre variables binarias 238 9.3 Modelos con pendientes aleatorias 313 Considerar pendientes diferentes 239 9.4 Propiedades de MCO bajo error Prueba para diferencias en las funciones de medición 315 de regresión a través de los grupos 243 Error de medición en la variable 7.5 Una variable dependiente binaria: dependiente 316 el modelo de probabilidad lineal 246 Error de medición en las variables 7.6 Más acerca del análisis de políticas explicativas 318 y evaluación de programas 251 9.5 Datos faltantes, muestras no aleatorias Resumen 254 Términos clave 255 y observaciones aberrantes 322 Problemas 255 Datos faltantes 322 Ejercicios en computadora 258 Muestras no aleatorias 323 Observaciones influyentes y observaciones CAPÍTULO 8 aberrantes 325 Heterocedasticidad 264 9.6 Estimación por mínimas desviaciones absolutas 330 8.1 Consecuencias de la heterocedasticidad Resumen 331 para MCO 264 Términos clave 332 8.2 Inferencia robusta a la heterocedasticidad Problemas 332 en la estimación por MCO 265 Ejercicios en computadora 334 Cálculo de pruebas ML robustas a la heterocedasticidad 269 PARTE 2 8.3 Pruebas para heterocedasticidad 271 Prueba de White para heterocedasticidad 274 Análisis de regresión 8.4 Estimación por mínimos cuadrados con datos de series ponderados 276 Heterocedasticidad conocida, de tiempo 339 salvo una constante multiplicativa 277 La función de heterocedasticidad debe ser estimada: MCG factibles 282 CAPÍTULO 10 ¿Qué pasa si la función de heterocedasticidad Análisis básico de regresión supuesta es incorrecta? 287 con datos de series de tiempo 340 Predicción e intervalos de predicción con heterocedasticidad 289 8.5 Reconsideración del modelo de probabilidad 10.1 Naturaleza de los datos de series lineal 290 de tiempo 340 Resumen 293 10.2 Ejemplos de modelos de regresión con series Términos clave 294 de tiempo 342 Problemas 294 Modelos estáticos 342 Ejercicios en computadora 296 Modelos de rezagos distribuidos finitos 342 Una convención sobre el índice CAPÍTULO 9 de tiempo 345 Más sobre especifi cación 10.3 Propiedades en muestras finitas de MCO bajo y temas de datos 300 los supuestos clásicos 345 Insesgamiento de MCO 345 9.1 Especificación incorrecta de la forma Las varianzas de los estimadores de MCO y el funcional 300 teorema de Gauss-Markov 349 RESET como una prueba general para Inferencia bajo los supuestos del modelo especificación incorrecta de formas lineal clásico 351 funcionales 303 10.4 Forma funcional, variables binarias Pruebas contra alternativas no anidadas 305 y números índice 353 Contenido vii 10.5 Tendencias y estacionalidad 360 Correlación serial en presencia de variables Caracterización de la tendencia en las dependientes rezagadas 411 series de tiempo 360 12.2 Métodos de prueba de la correlación serial 412 Uso de variables con tendencia en el Prueba t de correlación serial AR(1) análisis de regresión 363 con regresores estrictamente exógenos 412 Interpretación de las regresiones con tendencia Prueba de Durbin-Watson bajo los supuestos en el tiempo mediante la eliminación de la clásicos 415 tendencia 365 Prueba de correlación serial AR(1) sin regresores estrictamente exógenos 416 Cálculo de la R-cuadrada cuando la variable Prueba de correlación serial de orden dependiente tiene tendencia 366 superior 417 Estacionalidad 368 12.3 Corrección de correlación serial con regresores Resumen 370 estrictamente exógenos 419 Términos clave 371 Obtención del mejor estimador lineal insesgado Problemas 371 en el modelo AR(1) 419 Ejercicios en computadora 373 Estimación por MCG factibles con errores AR(1) 421 CAPÍTULO 11 Comparación de MCO y MCGF 423 Aspectos adicionales de MCO Corrección de la correlación serial con datos de series de tiempo 377 de orden superior 425 12.4 Diferenciación y correlación serial 426 12.5 Inferencia robusta a la correlación 11.1 Series de tiempo estacionarias y débilmente serial después de MCO 428 dependientes 377 12.6 Heterocedasticidad en regresiones Series de tiempo estacionarias de series de tiempo 432 y no estacionarias 378 Estadísticos robustos a la Series de tiempo débilmente heterocedasticidad 432 dependientes 379 Pruebas de heterocedasticidad 432 11.2 Propiedades asintóticas de MCO 381 Heterocedasticidad condicional 11.3 Uso de series de tiempo altamente persistentes autorregresiva 433 en el análisis de regresión 388 Heterocedasticidad y correlación serial Series de tiempo altamente persistentes 388 en modelos de regresión 435 Transformaciones de series de tiempo altamente Resumen 437 persistentes 393 Términos clave 437 Decidir si una serie de tiempo Problemas 438 es o no I(1) 394 Ejercicios en computadora 438 11.4 Modelos dinámicamente completos y ausencia de correlación serial 396 PARTE 3 11.5 El supuesto de homocedasticidad en los modelos de series de tiempo 399 Temas avanzados 443 Resumen 400 Términos clave 401 CAPÍTULO 13 Problemas 401 Combinación de cortes transversales Ejercicios en computadora 404 en el tiempo: métodos simples para CAPÍTULO 12 datos de panel 444 Correlación serial y heterocedasticidad en regresiones 13.1 Combinación independiente de cortes transversales en el tiempo 445 de series de tiempo 408 Prueba de Chow para el cambio estructural en el tiempo 449 12.1 Propiedades de MCO con errores 13.2 Análisis de políticas con combinación de cortes correlacionados serialmente 408 transversales 450 Insesgamiento y consistencia 408 13.3 Análisis de datos de panel para un periodo Eficiencia e inferencia 409 de dos años 455 Bondad de ajuste 410 Organización de los datos de panel 461 viii Contenido 13.4 Análisis de políticas con datos de panel 15.4 Soluciones de VI a los problemas de errores de dos periodos 462 en las variables 525 13.5 Diferenciación con más de dos periodos 465 15.5 Pruebas de endogeneidad y pruebas Posibles dificultades con la primera de restricciones de sobreidentificación 527 diferenciación en los datos de panel 470 Prueba de endogeneidad 527 Resumen 471 Prueba de restricciones Términos clave 471 de sobreidentificación 529 15.6 MC2E con heterocedasticidad 531 Problemas 471 15.7 Aplicación de MC2E a las ecuaciones Ejercicios en computadora 473 de series de tiempo 531 Apéndice 13A 478 15.8 Aplicación de MC2E a cortes transversales CAPÍTULO 14 combinados y a datos de panel 534 Resumen 536 Métodos avanzados Términos clave 536 para datos de panel 481 Problemas 536 Ejercicios en computadora 539 14.1 Estimación de efectos fijos 481 Apéndice 15A 543 Regresión de variables binarias 485 ¿Efectos fijos o primera diferencia? 487 CAPÍTULO 16 Efectos fijos con paneles no balanceados 488 Modelos de ecuaciones 14.2 Modelos de efectos aleatorios 489 simultáneas 546 Efectos aleatorios o efectos fijos? 493 14.3 Aplicación de métodos de datos 16.1 Naturaleza de los modelos de ecuaciones de panel a otras estructuras de datos 494 simultáneas 546 Resumen 496 16.2 Sesgo de simultaneidad en MCO 550 Términos clave 496 16.3 Identificar y estimar una ecuación estructural 552 Problemas 497 Identificación en un sistema de dos ecuaciones 552 Ejercicios en computadora 498 Estimación mediante MC2E 557 Apéndice 14A 503 16.4 Sistemas con más de dos ecuaciones 559 Identificación en sistemas con tres o más CAPÍTULO 15 ecuaciones 559 Estimación con variables Estimación 560 16.5 Modelos de ecuaciones simultáneas con series instrumentales y mínimos de tiempo 560 cuadrados en dos etapas 506 16.6 Modelos de ecuaciones simultáneas con datos de panel 564 15.1 Justificación: variables omitidas en un modelo Resumen 566 de regresión simple 507 Términos clave 567 Inferencia estadística con el estimador Problemas 567 de VI 510 Ejercicios en computadora 570 Propiedades de VI con una variable instrumental CAPÍTULO 17 deficiente 514 Cálculo de la R-cuadrada después de la Modelos de variable dependiente estimación de VI 516 limitada y correcciones a la selección 15.2 Estimación de VI del modelo de regresión muestral 574 múltiple 517 15.3 Mínimos cuadrados en dos etapas 521 17.1 Modelos logit y probit para respuesta Una sola variable explicativa endógena 521 binaria 575 Multicolinealidad y MC2E 523 Especificación de modelos logit Múltiples variables explicativas y probit 575 endógenas 524 Estimación de máxima verosimilitud Pruebas de hipótesis múltiples después de los modelos logit y probit 578 de la estimación de MC2E 525 Prueba de hipótesis múltiples 579