i Guía de aplicaciones de IBM SPSS Modeler 15 Nota: Antesdeutilizarestainformaciónyelproductoqueadmite,lealainformacióngeneral en Avisos el p. . Esta edición se aplica a IBM SPSS Modeler 15 y a todas las versiones y modificaciones posterioreshastaqueseindiquelocontrarioennuevasediciones. Capturas de pantalla de productos de Adobe reimpresas con permiso de Adobe Systems Incorporated. CapturasdepantalladeproductosdeMicrosoftreimpresasconpermisodeMicrosoftCorporation. Materialesbajolicencia: PropiedaddeIBM ©CopyrightIBMCorporation1994,2012. DerechosrestringidosparalosusuariosdelgobiernodeEstadosUnidos: Uso,duplicacióno revelaciónrestringidosporGSAADPScheduleContractconIBMCorp. Prefacio IBM®SPSS®ModelereselconjuntodeprogramasdemineríadedatosdeIBMCorp. orientado alasempresas. SPSSModelerayudaalasorganizacionesamejorarlarelaciónconsusclientesy losciudadanosatravésdelacomprensiónprofundadelosdatos. Lasorganizacionesutilizanla comprensiónquelesofreceSPSSModelerparareteneralosclientesmásrentables,identificarlas oportunidadesdeventacruzada,atraeranuevosclientes,detectarelfraude,reducirelriesgoy mejorarlaprestacióndeserviciosdelgobierno. LainterfazvisualdeSPSSModelerinvitaalapericiaempresarialespecíficadelosusuarios, loquederivaenmodelospredictivosmáseficacesylareduccióndeltiemponecesariopara encontrarsoluciones. SPSSModelerofrecemuchastécnicasdemodeladotalescomopronósticos, clasificaciones,segmentaciónyalgoritmosdedeteccióndeasociaciones. Unavezquesecreanlos modelos,IBM®SPSS®ModelerSolutionPublisherpermitesudistribuciónentodalaempresaa losencargadosdetomarlasdecisionesoaunabasededatos. Acerca de IBM Business Analytics ElsoftwareIBMBusinessAnalyticsofreceinformacióncompleta, coherenteyprecisaenla que losórganos de toma de decisionesconfían para mejorarel rendimiento comercial. Un conjunto integral de inteligenciaempresarial, análisispredictivo,, rendimientocomercialy gestióndeestrategias, asícomodeaplicacionesdeanálisisleofreceunainformaciónclara, inmediataeinteractivadelrendimientoactualylacapacidadparapredecirresultadosfuturos. En combinaciónconextensassolucionessectoriales,prácticasprobadasyserviciosprofesionales,las organizacionesdecualquiertamañopuedenconseguirelmáximodeproductividadyalcanzar mejores resultados. Como parte de esta familia, el software de análisis predictivo de IBM SPSS ayuda a las organizacionesapredecireventosfuturosyactuarproactivamentesegúnesainformaciónpara lograrmejoresresultadoscomerciales. Losclientescomerciales,gubernamentalesyacadémicos detodoelmundoconfíanenlatecnologíadeIBMSPSScomoventajaantelacompetenciapara atraer,reteneryhacercrecerlosclientes,reduciendoalmismotiempoelfraudeyreduciendoel riesgo. AlincorporarelsoftwaredeIBMSPSSensusoperacionesdiarias,lasorganizacionesse conviertenenempresaspredictivas,capacesdedirigiryautomatizardecisionesparaalcanzarlos objetivoscomercialesylograrunaventajaconsiderablesobrelacompetencia. Paraobtenermás informaciónocontactarconunrepresentante,visitehttp://www.ibm.com/spss. Asistencia técnica Laasistenciatécnicaestádisponibleparaelmantenimientodelosclientes. Losclientespodrán ponerse en contacto con el servicio de asistencia técnica si desean recibir ayuda sobre la utilizacióndelosproductosdeIBMCorp. osobrelainstalaciónenlosentornosdehardware admitidos. Paraponerseencontactoconelserviciodeasistencia,visiteelIBMCorp. sitioWeb enhttp://www.ibm.com/support. Prepáreseparaidentificarse,identificarasuorganizaciónysu acuerdodeasistenciaalsolicitarasistencia. ©CopyrightIBMCorporation1994,2012. iii Contenido 1 Acerca de IBM SPSS Modeler 1 ProductosIBMSPSSModeler ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 1 IBMSPSSModeler.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 1 IBMSPSSModelerServer .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 2 IBMSPSSModelerAdministrationConsole.. ... ... ... ... ... ... ... ... ... ... ... ... 2 IBMSPSSModelerBatch... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 2 IBMSPSSModelerSolutionPublisher... ... ... ... ... ... ... ... ... ... ... ... ... ... 3 IBMSPSSModelerServerAdaptadoresparaIBMSPSSCollaborationandDeployment Services . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 3 EdicionesdeIBMSPSSModeler . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 3 DocumentacióndeIBMSPSSModeler... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 4 DocumentacióndeSPSSModelerProfessional.. ... ... ... ... ... ... ... ... ... ... ... 4 DocumentacióndeSPSSModelerPremium.. ... ... ... ... ... ... ... ... ... ... ... ... 5 Ejemplosdeaplicaciones. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 6 CarpetaDemos... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 7 Parte I: Introducción 2 Conceptos básicos de IBM SPSS Modeler 9 Primerospasos... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 9 InicieIBMSPSSModeler. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 9 Ejecucióndesdelalíneadecomandos .. ... ... ... ... ... ... ... ... ... ... ... ... ... 10 ConexiónconIBMSPSSModelerServer. ... ... ... ... ... ... ... ... ... ... ... ... ... 11 Modificacióndeldirectoriotemporal. ... ... ... ... ... ... ... ... ... ... ... ... ... ... 15 IniciodevariassesionesdeIBMSPSSModeler . ... ... ... ... ... ... ... ... ... ... ... 15 ConceptosbásicossobrelainterfazdeIBMSPSSModeler .. ... ... ... ... ... ... ... ... ... 16 LienzoderutasdeIBMSPSSModeler... ... ... ... ... ... ... ... ... ... ... ... ... ... 16 Paletadenodos.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 16 AdministradoresdeIBMSPSSModeler.. ... ... ... ... ... ... ... ... ... ... ... ... ... 18 ProyectosdeIBMSPSSModeler ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 19 BarradeherramientasdeIBMSPSSModeler... ... ... ... ... ... ... ... ... ... ... ... 20 Personalizacióndelabarradeherramientas. ... ... ... ... ... ... ... ... ... ... ... ... 21 PersonalizacióndelaventanadeIBMSPSSModeler ... ... ... ... ... ... ... ... ... ... 22 Cambiodeltamañodeiconodeunaruta. ... ... ... ... ... ... ... ... ... ... ... ... ... 23 UtilizacióndelratónenIBMSPSSModeler.. ... ... ... ... ... ... ... ... ... ... ... ... 24 Usodeteclasdemétodoabreviado.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... 24 Impresión. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 25 iv AutomatizacióndeIBMSPSSModeler... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 26 3 Introducción al modelado 27 Generacióndelaruta. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 29 Exploracióndelmodelo... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 34 Evaluacióndelmodelo ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 39 Puntuaciónderegistros .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 43 Resumen . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 44 4 Modelado automatizado para un objetivo de marca 45 Modeladoderespuestadeclientes(clasificadorautomático). ... ... ... ... ... ... ... ... ... 45 Datoshistóricos.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 45 Generacióndelaruta. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 46 Generaciónycomparacióndemodelos .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... 51 Resumen . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 56 5 Modelado automatizado para objetivo continuo 57 Valoresdepropiedad(Autonumérico). ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 57 Datosdeentrenamiento.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 58 Generacióndelaruta. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 58 Comparacióndelosmodelos . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 62 Resumen . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 64 Parte II: Ejemplos de preparación de datos 6 Preparación automática de datos (ADP) 66 Generacióndelaruta. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 67 Comparacióndelaprecisióndemodelos . ... ... ... ... ... ... ... ... ... ... ... ... ... ... 72 v 7 Preparación de los datos para análisis (Auditar datos) 75 Generacióndelaruta. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 75 Exploracióndeestadísticasygráficos ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 79 Gestióndevaloresatípicosyperdidos ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 82 8 Tratamientos con medicamentos (Gráficos exploratorios/C5.0) 87 Lecturadedatosdetexto. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 87 Adicióndeunatabla.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 91 Creacióndeungráficodedistribución... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 92 Creacióndeundiagramadedispersión .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... 94 Creacióndeungráficodemalla.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 96 Derivarunnuevocampo.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 97 Generacióndeunmodelo. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 100 Exploracióndelmodelo... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 103 UtilizacióndelnodoAnálisis.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 105 9 Predictores de filtrado (Selección de características) 107 Generacióndelaruta. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 108 Generacióndelosmodelos... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 111 Comparacióndelosresultados... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 112 Resumen . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 114 10 Reducción de la longitud de cadena de datos de entrada (Nodo Reclasificar) 115 Reduccióndelalongituddecadenadedatosdeentrada(Reclasificar) .. ... ... ... ... ... .. 115 Reclasificacióndelosdatos . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 115 vi Parte III: Ejemplos de modelado 11 Modelado de respuesta de clientes (Lista de decisiones) 121 Datoshistóricos.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 122 Generacióndelaruta. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 123 Creacióndelmodelo.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 126 CálculodelasmedidaspersonalizadasconExcel. ... ... ... ... ... ... ... ... ... ... ... .. 139 ModificacióndelaplantilladeExcel . ... ... ... ... ... ... ... ... ... ... ... ... ... .. 145 Almacenamientoderesultados... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 148 12 Clasificación de clientes de telecomunicaciones (Regresión logística multinomial) 150 Generacióndelaruta. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 151 Exploracióndelmodelo... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 156 13 Pérdida de clientes de telecomunicaciones (Regresión logística binomial) 160 Generacióndelaruta. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 160 Exploracióndelmodelo... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 168 14 Predicción del uso de la banda ancha (serie temporal) 175 PrediccionesconelnodoSerietemporal . ... ... ... ... ... ... ... ... ... ... ... ... ... .. 175 Creacióndelaruta .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 177 Examendelosdatos . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 178 Definicióndelasfechas.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 182 Definicióndelosobjetivos... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 184 Configuracióndelintervalodetiempo ... ... ... ... ... ... ... ... ... ... ... ... ... .. 185 Creacióndelmodelo . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 187 Examendelmodelo.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 189 Resumen. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 198 vii Nuevaaplicacióndemodelosdeseriestemporales .. ... ... ... ... ... ... ... ... ... ... .. 198 Recuperacióndelaruta.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 199 Recuperacióndelmodeloguardado.. ... ... ... ... ... ... ... ... ... ... ... ... ... .. 201 Generacióndeunnododemodelado. ... ... ... ... ... ... ... ... ... ... ... ... ... .. 202 Generacióndenuevosmodelos.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 203 Examendelnuevomodelo... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 204 Resumen. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 206 15 Predicción de ventas por catálogo (Serie temporal) 207 Creacióndelaruta... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 207 Examendelosdatos.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 211 Suavizadoexponencial... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 211 ARIMA... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 216 Resumen . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 223 16 Realización de ofertas a clientes (Autoaprendizaje) 224 Generacióndelaruta. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 225 Exploracióndelmodelo... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 231 17 Predicción de moras en préstamos (red bayesiana) 236 Generacióndelaruta. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 236 Exploracióndelmodelo... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 241 18 Reentrenamiento de un modelo mensualmente (red bayesiana) 246 Generacióndelaruta. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 247 Evaluacióndelmodelo ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 251 viii 19 Promoción de ventas al por menor (Red neuronal/C&RT) 259 Examendelosdatos.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 259 Aprendizajeycomprobación . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 262 20 Control de estado (Red neuronal/C5.0) 264 Examendelosdatos.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 265 Preparacióndedatos. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 267 Aprendiendo.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 268 Comprobación ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 268 21 Clasificación de clientes de telecomunicaciones (Análisis discriminante) 270 Creacióndelaruta... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 270 Examendelmodelo... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 276 Análisisdiscriminanteporpasos. ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 278 Notadeadvertenciasobrelosmétodosporpasos... ... ... ... ... ... ... ... ... ... .. 279 Comprobacióndelajustedelmodelo. ... ... ... ... ... ... ... ... ... ... ... ... ... .. 279 Matrizdeestructura . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 280 Mapaterritorial.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 281 Resultadosdelaclasificación... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 282 Resumen . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 282 22 Análisis de datos de supervivencia censurados por intervalos (modelos lineales generalizados) 284 Creacióndelaruta... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 284 Pruebasdeefectosdelmodelo... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 290 Ajustedelosmodelosexclusivosdetratamiento . ... ... ... ... ... ... ... ... ... ... ... .. 290 Estimacionesdelosparámetros.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 292 Probabilidadesderecurrenciapronosticadaysupervivencia. ... ... ... ... ... ... ... ... .. 293 Modeladodeprobabilidadesderecurrenciaporperíodo . ... ... ... ... ... ... ... ... ... .. 298 Pruebasdeefectosdelmodelo... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 304 Ajustedemodelosreducidos . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 304 ix Estimacionesdelosparámetros.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 306 Probabilidadesderecurrenciapronosticadaysupervivencia. ... ... ... ... ... ... ... ... .. 307 Resumen . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 312 23 Uso de la regresión de Poisson para analizar las tasas de daños sufridos por barcos (modelos lineales generalizados)314 AjustedeunaregresióndePoisson“sobredispersada” .. ... ... ... ... ... ... ... ... ... .. 314 Estadísticosdebondaddeajuste . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 319 ContrasteOmnibus... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 320 Pruebasdeefectosdelmodelo... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 320 Estimacionesdelosparámetros.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 321 Ajustedemodelosalternativos... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 322 Estadísticosdebondaddeajuste . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 325 Resumen . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 326 24 Ajuste de una regresión gamma a reclamaciones de seguros de coches (modelos lineales generalizados) 327 Creacióndelaruta... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 327 Estimacionesdelosparámetros.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 331 Resumen . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 332 25 Clasificación de muestras de células (SVM) 333 Creacióndelaruta... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 334 Examendelosdatos.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 339 Pruebadeunafuncióndiferente.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 341 Comparacióndelosresultados... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 343 Resumen . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 344 x
Description: