En el comienzo de Internet la experiencia de visitar un sitio web consistía básicamente en el consumo de información en formato texto salpicada con algunas imágenes, habitualmente en resolución relativamente baja. Una experiencia que se extendía...
Un poco de historia sobre Spark El proyecto Spark tuvo su comienzo entre los muros de la universidad de Berkeley en California en 2009. En su concepción Spark intentaba demostrar la viabilidad de otro proyecto de la misma universidad, Mesos...
La Analítica es como un banco de ejercicios, uno no se pone en forma solo por instalar uno en el sótano
Rebecca Lieb dixit
Los Problemas de MapReduce Como hemos visto en el post anterior MapReduce se encarga de automatizar el procesado de los datos en paralelo a través de distintos nodos de un cluster gestionando las tareas necesarios para la realización del trabajo...
MapReduce es el modelo de programación utilizado en Hadoop que, básicamente, le hace la vida más fácil a los programadores a la hora de trabajar con grandes volúmenes de datos distribuidos a través de múltiples máquinas que va a trabajar en paralelo...
No todo lo que se puede contar cuenta, y no todo lo que cuenta puede contarse
Albert Einstein dixit