Conferencia Magistral

Descripción:

Conferencia Magistral

Tecnológico de Estudios Superiores de Chalco TESCHA

Paradigma por utilizar el software LIBRE respecto al software LICENCIADO en el marco de la productividad y/o riesgo de una empresa

 


Yo RDD (Resilient Distributed Datasets) con la Bujía (SPARK)!!!

Descripción:
Una breve introducción al concepto de Conjuntos Distribuidos Resilientes como una abstracción para ofrecer mecanismos tolerantes a fallas (fault – tolerant abstraction) para el cómputo en memoria en una red (in-memory cluster computing), basada en las enseñanzas y sistemas desarrollados en la Universidad de California Berkeley en el laboratorio AMPLab (Algorithms Machines and People).
 


¿Qué es Big Data?

Big Data, que en el idioma inglés significa grandes volúmenes de datos, hace referencia en la industria de tecnologías de la información, a los sistemas que manipulan grandes conjuntos de datos que cubren las 4 “V”’s.

En la definición tradicional producida por Gartner o el Meta Group en 2001, asocian estas V’s a: el volumen, la velocidad, la variedad y la visibilidad.

Volumen: El creciente volumen de datos generados por las empresas y los nuevos medios tecnológicos es el nuevo petróleo que debe ser extraído y refinado para ser analizado.

Velocidad: Se refiere al tiempo de respuesta que los usuarios desean a cualquier tipo de consulta. Esto es lo que hoy se conoce como velocidad internet, es decir toda consulta en los buscadores modernos se obtiene al instante, buscando en universos inmensos de datos.

Variedad: La variedad hace referencia a la diversidad de los tipos de datos de distintas fuentes que deben ser analizadas.

Visibilidad: Una vez extraídos y analizados, los datos deben ser expuestos al cliente de forma amigable para una correcta toma de decisiones, haciendo “cruces” de fuentes heterogéneas con los cuales se aportan respuestas inusitadas.