Dataset

Contexto del proyecto

Proyecto desarrollado para la manipulacion de datos en un entorno de desarrollo en la nube que facilita la colaboración.

Objetivos del proyecto

En el entorno colaborativo, utilizando DataBricks, manipulamos grandes volúmenes de datos distribuidos en múltiples notebooks, Con el fin de estructurar consultas sobre un archivo CSV que contiene información acerca de accidentes de aviones con aves. Este enfoque facilita la creación de modelos de análisis multidimensional.

Tecnologias utilizadas

Se uso DataBricks para el desarrollo del projecto y se uso scala con apache spark ademas de el uso de notebooks interactivos.

Enlaces

-notebooks en DataBricks: Enlace al dataset