Contexto del proyecto
Proyecto desarrollado para la manipulacion de datos en un entorno de desarrollo en la nube que facilita la colaboración.
Objetivos del proyecto
En el entorno colaborativo, utilizando DataBricks, manipulamos grandes volúmenes de datos distribuidos en múltiples notebooks, Con el fin de estructurar consultas sobre un archivo CSV que contiene información acerca de accidentes de aviones con aves. Este enfoque facilita la creación de modelos de análisis multidimensional.
Tecnologias utilizadas
Se uso DataBricks para el desarrollo del projecto y se uso scala con apache spark ademas de el uso de notebooks interactivos.
Enlaces
-notebooks en DataBricks: Enlace al dataset