MapReduce y Hadoop: Big Data para gente de Marketing (5)

MapReduce es el modelo de programación utilizado en Hadoop que, básicamente, le hace la vida más fácil a los programadores a la hora de trabajar con grandes volúmenes de datos distribuidos a través de múltiples máquinas que va a trabajar en paralelo dentro de un mismo cluster . Si queremos aprovechar las capacidades de combinar los esfuerzos de varias máquinas en paralelo para realizar nuestra trabajo (job) lo primero que vamos a necesitar es expresar ese trabajo en MapReduce. Hay que entender que MapReduce no es un lenguaje de programación sino un modelo sobre el que se puede programar usando distintos […]

Leer más

Introducción a Hadoop: Big Data para gente de Marketing (4)

Un poco de Historia Como sabrás Apache Software Foundation es un proyecto que recoge distintas iniciativas de código abierto (Open Source) y Hadoop es una de esas iniciativas. El corazón de lo que es hoy Hadoop se inspiró en dos proyectos de Google que tenían su origen en la ambición de indexar el contenido de la WWW en que estaba embarcada la compañía. Los dos proyectos eran: Google File System (GFS), un nuevo sistema de archivo distribuido recogido en una publicación de los ingenieros de Google en octubre de 2003 (Si no has leído el post sobre los sistemas distribuidos […]

Leer más

Sistema de lectura Distribuido

Los Sistemas Distribuidos: Big Data para gente de Marketing (3)

Como ya he explicado en algún post de esta serie una de las limitaciones que han sufrido los analistas de datos en el pasado ha sido la de estar sujetos a la capacidad de procesamiento de sus máquinas. Ni siquiera la famosa ley de Moore ha sido capaz de resolver este problema. Por muy potente que sea el ordenador al que tengan acceso su capacidad de procesamiento siempre es limitada y su escalabilidad prácticamente nula. En este artículo vamos a estar hablando continuamente del Backend y del Frontend, dos conceptos que nos llevan acompañando desde el comienzo de los tiempos […]

Leer más

Data Warehouse y Data Lake: Big Data para gente de Marketing (2):

El mundo de los datos es un terreno pantanoso para aquellos que venimos del mundo del marketing. Uno de temas que a menudo generan un gran número de preguntas es tratar de entender las diferencias entre algunos conceptos fundamentales como los Data Warehouse, los Data Mart y los recientemente llegados Data Lakes. En este artículo voy a intentar describir cada opción con la esperanza de ayudar a aclarar dudas.   Los Data Warehouse y los Data Marts En un mundo donde trabajar con cantidades disparatadas de datos empieza a ser la norma más que la excepción era necesario buscar una […]

Leer más

El Big Data para gente de Marketing (1)

×Disclaimer: Hay muchísima gente infinitamente mejor preparada que yo para hablar de Big Data. Muchos que, como yo, venimos del mundo del marketing, sentimos la inquietud de entender este tsunami pero no resulta sencillo descrifrar sus claves. Si quieres profundizar en el tema la mayoría de la información que está disponible es demasiado técnica y difícilmente accesible para quien no tenga ese background. Soy un voraz consumidor de información y no suelo achantarme ante los retos así que me he propuesto hacer una serie de posts relacionados con este mundo desde mi entendimiento del Big Data con los que compartir […]

Leer más

Entender qué es y para qué sirve un DMP (Data Management Platform)

Uno de los conceptos más esquivos de los últimos tiempos es el del DMP, Data Management Platform o es castellano Plataforma para la gestión de datos. En este post voy a intentar explicar mi manera de entender qué es un DMP y cual es su papel en el ecosistema publicitario. En primer lugar si queremos hablar de la gestión de datos es importante entender a qué llamamos datos. Lo que yo entiendo como datos es toda aquella información (datos) que seamos capaces de recoger sobre cualquier interacción con nuestros consumidores a través de cualquier contexto medible, sea este digital o […]

Leer más

Sobre el Header Bidding Server-to-Server (S2S)

Hace unas semanas explicaba el concepto del Header bidding y su funcionamiento básico. Por hacer un pequeño recap para aquellos que no leyeran el post anterior tan sólo decir que se trata de un proceso de pre-puja (pre-bid) un tanto exclusivo con una selección de partners que el publisher integra en la cabecera de la página (el Header del HTML) . Básicamente el proceso es el siguiente, al cargarse la página se ejecutan las etiquetas de los diferentes partners que hacen una llamada en la que solicitan una puja (bid request) para una impresión, cada partner contesta con su bid […]

Leer más