Iniciamos el ciclo integral de Ciencia de Datos, Datos Geo-Espaciales, Aprendizaje Automatizado, en un ambiente BigData con Hadoop y Spark utilizando Python
Esta es una nueva modalidad de los talleres que organizamos con un enfoque 100% practico en nuestros talleres de trabajo en la Colonia Portales.
Los grupos son pequeños, máximo 5 personas, y se imparten en nuestro laboratorio en la azotea (roof) de la colonia Portales con vista panorámica a toda la ciudad!!!
El miercoles 06 de junio 2018 es el primer curso del ciclo integral, en donde se introducen los conceptos básicos de python, jupyter, pandas, geo pandas, y aspectos gráficos con matplotlib y bokeh.
También se introduce el mundo Hadoop y Spark elemental. Se inician servicios Hadoop y suben y bajan fuentes de datos al HFDS.
Enseguida se inician servicios Spark y analizan los RDDs generados a partir de las fuentes de informacion utilizando TRANSFORMACIONES y ACCIONES en Spark
Se analiza el uso de Python para manejo de datos geo-espaciales con Pandas y Geo_pandas en un ambiente Jupyter
El jueves 07 de junio 2018 es el segundo curso del ciclo integral en donde se abordan los temas de Aprendizaje Automatizado en un ambiente Spark con las bibliotecas SparkSQL y SparkML. Se abordan los algoritmos de Aprendizaje Supervisado de regresión lineal, clasificación por regresión logística, KNN, SVD, KMeans con SparkML