PRUEBA DE FALTA DE AJUSTE (Lack-of-fit Test) Fortino Vela Peón [email protected] Octubre, 2011 F. VELA Introducción (cid:1) Un supuesto básico del modelo es la existencia de una relación lineal entre la variable dependiente y los regresores. (cid:1) Dos formas de verificar esta suposición son: ex-ante 1. Mediante la elaboración del diagrama de dispersión; ex-post 2. Graficar a los residuales (estandarizados) vs el valor de la variable de respuesta ajustada, así como vs los predictores. F. VELA Prueba de falta de ajuste (cid:1) Esta diseñada para evaluar si una relación curvilineal podría ajustar mejor a los datos que un modelo lineal. (cid:1) Para ello la SCE se descompone en dos partes: 1. El componente de error puro; y 2. El componente de falta de ajuste. (cid:1) Estos dos componentes son utilizados para construir un estadístico de prueba F particular con el fin de contrastar la hipótesis siguiente: F. VELA H : la relación es lineal vs H : la relación no es lineal o 1 (cid:1) La prueba requiere observaciones repetidas en al menos uno de los niveles de X. (cid:1) Las observaciones de X e Y son independientes y se encuentran normalmente distribuidas. (cid:1) La distribuciones de Y tienen la misma varianza. F. VELA H : la relación es lineal vs H : la relación no es lineal o 1 SCE =suma de cuadrados del error ( ) R - (cid:215) SCE SCE gl del modelo reducido. F* = R F F ( ) SCE = suma de cuadrados del error (cid:215) - F SCE gl gl del modelo completo. F R F gl = grados de libertad del modelo R reducido. gl = grados de libertad del modelo F completo. (cid:1) La regla de decisión esta dada por: * > a Rechazar Ho ssi F F - - c k,n c donde c= # de niveles distintos de X p= # de variables en la ecuación de regresión n= # de observaciones F. VELA ( ) = = ∑∑ - 2 SCE SCPE Y Y j=1,2,…,c (niveles de X) F ij j j i ( ) = = ∑∑ - ˆ 2 SCE SCE Y Y R ij ij j i = - gl (n c) F = - gl (n k) R ( ) - (cid:215) - SCE SCPE (n c) \ * = F ( ) (cid:215) - - - SCPE n 2) (n c Observe que = SCPE Suma de cuadrados del error puro (en inglés SSPE) F. VELA (cid:1) Es común encontrar la siguiente notación: = = SCE SSEP SCE SSE R se define entonces = + SSLF SSE SSEP donde = SSLF suma de cuadrados de falta de ajuste observe - SSE SSPE ( ) - (cid:215) - - - - SCE SSPE (n c) (n 2) (n c) MSLF * = = = F ( ) (cid:215) - - - SSE SSPE n 2) (n c MSPE - (n c) F. VELA Ejemplo Una empresa dedicada a comercializar productos de belleza utiliza los servicios de telemarketing para promover a sus mercancías. El gerente de la División de Mercadeo de la compañía de telemarketing esta interesado en conocer el tiempo que utilizan sus empleados en una llamada para realizar sus tareas. Para ello recolecta el número de meses (meses) que lleva en la compañía el operador y el número de llamadas telefónicas (llamadas) realizadas al día para 20 de sus empleados. F. VELA | meses llamadas | |------------------| 1. | 10 18 | 2. | 10 19 | 3. | 11 22 | 4. | 14 23 | 5. | 15 25 | |------------------| 6. | 17 28 | 7. | 18 29 | 8. | 20 29 | 9. | 20 31 | 10. | 21 31 | |------------------| 11. | 22 33 | 12. | 22 32 | 13. | 24 31 | 14. | 25 32 | 15. | 25 32 | |------------------| 16. | 25 33 | 17. | 25 31 | 18. | 28 33 | 19. | 29 33 | 20. | 30 34 | +------------------+ F. VELA El promedio de llamadas al día para los 20 empleados seleccionados es de 28.95. El gerente sospecha que pudiera haber algún tipo de relación entre la antigüedad en el trabajo y el número de llamadas, dado que el empleado puede ir especializándose. Se plantea entonces el siguiente modelo: = b + b + llamadas meses u 1 2
Description: