ANALÍTICA DE BIG DATA (BDA) Tendencias – Retos – Oportunidades Fabián García Nocetti IIMAS-UNAM CAACFMI-UNAM AMIAC • Ciencia de Datos y Big Data • Analítica de Big Data (BDA) • Aplicaciones • Arquitectura General para BDA • Oportunidades-Retos-Tendencias • Conclusiones • Crecimiento explosivo cantidad de datos – Generados a grandes velocidades – Distintos formatos y diferentes fuentes • Redes sociales, dispositivos móviles, sensores, etc. • Necesidad de extraer – Patrones, tendencias y/o conocimiento – De forma rápida y eficiente • Evolución de métodos tradicionales – Rendimiento – Escalabilidad • Contenido de valor que genera permite – Mejora en toma de decisiones – Obtención de ventajas competitivas – Diferentes campos de acción Ciencia de Datos • Ciencia de datos y Big Data Ciencia de Datos • Ciencia de datos y Big Data • Big Data: – Debe involucrar cómputo distribuido en múltiples servidores. – Debe entremezclar gestión y procesamiento de datos. – Debe ir más allá de las bases de datos relacionales y data warehouses. – Debe permitir resultados que no estaban disponibles con los enfoques anteriores, o que llevarían sustancialmente mucho más tiempo (tiempo de ejecución o latencia). Ciencia de Datos • Ciencia de datos y Big Data • Ciencia de Datos: – Debe involucrar conocimientos de uno o más dominios (por ejemplo finanzas, medicina o geología). – Debe tomar en cuenta aspectos computacionales. – Debe incluir técnicas científicas tales como la prueba de hipótesis y la validación de resultados. – Los resultados deben ser confiables. – Debería involucrar más matemáticas y estadísticas que los enfoques anteriores.. Ciencia de Datos • Ciencia de datos y Big Data • Ciencia de Datos: – Debería incluir el aprendizaje automatizado (machine learning), inteligencia artificial o algoritmos de descubrimiento de conocimiento (knowledge discovery). – Debería implicar la visualización y creación rápida de prototipos para el desarrollo de software. – Debe satisfacer al menos uno de estos deberes en un nivel perturbador. Big Data • Avance tecnológico ha permitido un crecimiento explosivo de datos generados • Fuentes: redes sociales, dispositivos móviles, sensores, máquinas de rayos x, telescopios, sondas espaciales, log de aplicativos, sistemas de predicción del clima, sistemas de geo-posicionamiento y, en términos generales, lo que se puede clasificar como Internet de las Cosas" Big Data • Necesidad de extraer patrones, tendencias y/o conocimiento para apoyar la toma de decisiones. • Métodos tradicionales de procesamiento de datos han tenido que evolucionar rápidamente (escalabilidad y rendimiento). • A este fenómeno se le ha llamado Big Data. • Referencia principalmente a tres términos conocidos como las 3 Vs: Volumen, Velocidad y Variedad.
Description: