Uno de los conceptos más esquivos de los últimos tiempos es el del DMP, Data Management Platform o es castellano Plataforma para la gestión de datos. En este post voy a intentar explicar mi manera de entender qué es un DMP y cual es su papel en el ecosistema publicitario.
En primer lugar si queremos hablar de la gestión de datos es importante entender a qué llamamos datos. Lo que yo entiendo como datos es toda aquella información (datos) que seamos capaces de recoger sobre cualquier interacción con nuestros consumidores a través de cualquier contexto medible, sea este digital o no.
Creo que a estas alturas nadie va a discutir que los datos pueden ser un enorme activo para cualquier compañía, pero para ser capaces de convertir esa oportunidad en una realidad tenemos que conseguir dos cosas: una la aplicación de alguna inteligencia al análisis de nuestros datos para definir hipótesis que nos permitan identificar oportunidades, y otra conectar esos datos con nuestras capacidades de activación, es decir, con los diferentes canales que utilizamos para nuestras campañas.
Lass funciones principales de un DMP son las siguientes:
- Recolectar toda la información en un repositorio único idealmente en torno a un identificador único
- Proveer capacidades para la creación de segmentos a partir de la información disponible en dicho repositorio o en combinación con fuentes de terceros
- Proporcionar capacidades analíticas sobre los resultados de las acciones aplicadas a los segmentos para la toma de decisiones
- La capacidad de compartir o conectar los segmentos creados con las plataformas de activación, o dicho de otro modo, nuestros diferentes gestores de campañas.
El DMP como repositorio de datos
En primer lugar hemos hablado del DMP como repositorio de datos ya que, en el fondo, un DMP no deja de ser un data warehouse con capacidad de almacenar grandes cantidades de información procedentes de diferentes fuentes. De hecho los primeros DMPs se montaban sobre bases de datos clásicas como Oracle, es decir, ocupaban un espacio físico en la memoria de un ordenador, a día de hoy los DMPs usan estructuras Big Data en la nube tipo Hadoop, mucho más eficientes para el almacenamiento y procesamiento de grandes volúmenes de datos en tiempo real.
Creo que es interesante entender que los DMPs normalmente tienen la información almacenada en dos modos: el modo de acceso a todos los datos (repositorio) y el modo de acceso rápido a los datos. El motivo por el que los DMPs organizan sus datos de este modo es poder dar cabida a sus dos principales funciones: la primera la capacidad de segmentación sobre todos los datos y atributos y, la segunda una manera eficiente de activar esos datos en cuestión de milisegundos, lo que solemos llamar tiempo real. Este segundo modo se basa en modelos de lectura rápida que permitan dar respuesta a las exigencias de la velocidad de respuesta del tiempo real. Una forma en que algunas soluciones abordan este reto es a través de sistemas de clave-valor (Key-Value Pair KVP), una forma de evitar que haya que indexar la base de datos con el objetivo de mejorar el rendimiento y, por lo tanto, los tiempos de respuesta.
Para conseguir que nuestro DMP sea ese repositorio de nuestros datos contamos con tres formas de enviarle información:
- Subir ficheros con información de nuestros usuarios en un proceso batch (probablemente en un fichero estructurado como un CSV o semi-estructurado como un JSON)
- Incluir etiquetas Javascript en nuestros sitios para empujar información desde el navegador del usuario de manera muy parecida a cómo mandamos información a nuestra analítica web. Si hablamos de aplicaciones móviles en vez de navegadores estaremos hablando no de etiquetas JS sino de un SDK específico que tendremos que usar en nuestra App.
- APIs creadas por el desarrollador para intercambiar información entre servidores (server-to-server) con diferentes plataformas

Cada señal que enviamos al DMP va a estar conectada con un identificador único del dispositivo a través del que ocurre la interacción. Pero la clave no está en la capacidad de almacenar la información sobre el dispositivo. Como ya sabrás cada dispositivo, y cada environment en cada dispositivo, tiene ya sus propios identificadores (cookies, IDFA, direcciones Mac…). El auténtico reto está en ser capaces de conectar cada identificador de cada dispositivo del ecosistema con una persona o mejor dicho el ID de una persona. Ahí es donde los DMPs quieren jugar un papel importante.
Si queremos encontrar un conector entre las distintas señales de distintas fuentes de información tendremos que buscar algún elemento que nos sirva para conectar los identificadores de las distintas fuentes con nuestros clientes. Un ejemplo bastante común para crear el Identificador del usuario es usar el email del usuario anonimizado previamente con una encriptación Hash.

Como explica Kaspersky en su blog “Una función criptográfica hash es un algoritmo matemático que transforma cualquier bloque arbitrario de datos en una nueva serie de caracteres con una longitud fija. Independientemente de la longitud de los datos de entrada, el valor hash de salida tendrá siempre la misma longitud”. Lo importante que necesitamos entender es que las funciones Hash tienen como objetivo transformar los datos de manera que sea imposible volver desde el valor resultante de la función al contenido original, protegiendo así el anonimato de datos que en origen eran PII (Personally Identifiable Information)
En cualquier caso en ausencia de un punto de conexión los DMPs asignarán un identificador único propio con el que mapear los diferentes Ids de los dispositivos de un usuarios. Si quieres entender mejor cómo intentan conseguirlo puedes leer uno de los primeros post que escribí sobre atribución cross-device.
Los Atributos en un DMP
Toda nuestra actividad digital deja un rastro. Cada visita a nuestro sitio web, cada interacción con nuestras campañas, la participación de los usuarios en nuestras redes sociales… genera información (datos). Algunos de esos datos se generan de forma automática sin que tengamos que intervenir, por ejemplo cada vez que un navegador pide información a un servidor para recuperar el contenido de una página web recogemos datos sobre el navegador del usuario que viajan en la llamada (versión del navegador, configuración de idioma, sistema operativo, resolución de pantalla…). Sin embargo cada interacción tiene lugar en un contexto de negocio, contexto que tiene una serie de atributos y son esos atributos los que también vamos a querer guardar en nuestros DMP. Podemos entender los atributos de manera más intuitiva como los metadatos que conocemos sobre un usuario. Pueden ser atributos que nos ayuden a caracterizarle (edad, género, nombre…) o atributos que tienen su origen en una interacción con un contenido o un servicio nuestro (los que se denominan atributos de comportamiento: visita la sección x, compra productos de la categoría y…)
Llegados a este punto digamos que ya tenemos en nuestro repositorio de datos la información sobre las diferentes interacciones de nuestros usuarios y clientes así como un serie de atributos (metadatos) asociados a cada interacción. La siguiente funcionalidad del DMP es proveer capacidades para crear segmentos utilizando esos datos. Para la generación de los segmentos en el DMP básicamente vamos utilizar dos elementos: las reglas a aplicar a los datos (y sus atributos), y la ventana de tiempo sobre la que aplicar dichas reglas. Pongamos un ejemplo, supongamos que queremos crear un segmento de aquellos usuarios que han hecho una compra por un importe mayor a 100 euros, que han comprado productos de la categoría de moda y que han pagado con PayPal. Tendríamos que definir en el DMP la siguientes reglas:
Usuarios con un “Valor de Cesta” > 100 €
AND han comprado “categoría” = Moda
AND “forma de pago” = PayPal
Donde los atributos son Valor de Cesta, Categoría y Forma de Pago y las reglas son mayor que 100 €, es igual a moda y es igual a PayPal respectivamente. Para realizar este sencillo segmento tenemos que haber definido previamente la reglas para luego aplicarlas.
Las capacidades de segmentación del DMP
Para definir cuales son las reglas necesitamos de una capa analítica y está viene en dos sabores. El primero, y más tradicional, es el consumer intelligence: la inteligencia del negocio aplicada al conocimiento de los clientes de la compañía. Se trata de perfiles analíticos que “juegan” con la base de datos de clientes para obtener insights a partir de los que construir los segmentos.
La segunda, más sofisticada y compleja, es la utilización de algoritmos de machine learning que nos permitan identificar patrones que pueden ser no tan evidentes a través de un análisis más tradicional. En cualquier caso el resultado final, por un camino o por el otro, es el mismo, la creación de un segmento. En muchas ocasiones oirás hablar de audiencias en lugar de segmentos pero son términos perfectamente intercambiables. El término audiencia se utiliza generalmente para aplicarlo en el contexto publicitario mientras que segmento tiene su origen en el marketing relacional más tradicional.
Los modelos look-alike
La capacidad de usar algoritmos de matching learning no sólo es importante para descubrir segmentos en nuestros datos, también es clave en la construcción de segmentos de look-alike. En general un modelo look-alike es la aplicación de métodos de segmentación sobre datos de terceros a partir de nuestros propios datos para buscar audiencias incrementales lo más parecidas a nuestros segmentos. En este caso los modelos de look-alike también vienen en dos sabores: caja negra y modelos a medida.
Los modelos Caja Negra son aquellos en los que la “magia” de la definición de la afinidad de la audiencia nos viene dada. En ocasiones, como es el caso de Google/DoubleClick, no podemos elegir el nivel de afinidad y en otros tenemos algo más de control como es el caso de Facebook. En cualquier caso se trata de medidas de segmentación que no proporcionan información transparente sobre la generación de las audiencias look-alike.
Los modelos a medida permiten la construcción de nuestros propios modelos de afinidad con metodologías de análisis estadístico aplicables sobre los datos en bruto disponibles. Muchos DMPs ofrecen herramientas para ver como discriminan los diferentes atributos en nuestra base de datos contra el segmento de partida para ayudarnos a construir los segmentos en función de aquellos atributos con mayor afinidad.
¿Porqué es importante la capacidad de generar segmentos look-alike? fundamentalmente porque es la clave para tener escala en la construcción de las audiencias para nuestras campañas. Nuestros datos de primera partes son probablemente los más valiosos, sin embargo son un recurso limitado. Por ese motivo la capacidad de ampliar nuestras audiencias es una de las principales funciones que le vamos a pedir a un DMP. Hay que tener en cuenta que la afinidad, cómo de parecida es la audiencia a los datos de mi segmento, siempre es enemiga de la escala. Es decir, a mayor afinidad menor será el tamaño de la audiencia. Tendremos que buscar un compromiso que tenga sentido entre afinidad y tamaño de la audiencia para definir la audiencia que usaremos en nuestra campaña. En este sentido puede ser de gran utilidad utilizar diferentes audiencias en función del nivel de afinidad y testar contra el segmento de origen el performance de cada una de ellas.
El segundo elemento sería la ventana temporal sobre la que aplicamos la segmentación, es decir, la ventana de recencia de las señales que hemos recogido. Este es un tema muy relevante al que no siempre le prestamos la atención que merece. Según un artículo del gran Brian Boland en Advertising Age basado en datos de Facebook Atlas en un mismo día la relación entre cookies y personas es bastante estable, más o menos un 93% de las personas se pueden asociar de manera solvente con una persona. Sin embargo transcurridas seis semanas la mitad de las personas que fueron impactadas con la campaña en Atlas lo hicieron a través de más de un dispositivo. Si nuestro DMP realmente es capaz de asociar los identificadores de esos dispositivos con las personas que están detrás la ventana temporal no debería tener un mayor impacto, sin embargo si hablamos de cookies el escenario es completamente distinto.
Lo más inteligente sería realizar un análisis de los caminos a la conversión, sea cual sea el objetivo, como punto de partida. En términos generales ese es el enfoque más sensato de partida, idealmente ese análisis debería bajarse a nivel de segmento para ver las diferencias que puedan existir entre unos segmentos y otros. Tenemos que tener en cuenta que el modelo de atribución que aplicamos en nuestros análisis tendrá un impacto importante en los resultados.
Generalmente un DMP nos dejará retroceder hasta 90 días en el tiempo para construir nuestro segmento, pero, de la misma forma que con la afinidad, parece que tendría sentido hacer tests con diferentes ventanas temporales y comparar los resultados de nuestras campañas.
Para qué usamos un DMP
La última parte de este post, que se está extendiendo más de lo que había pensado, hace referencia a la parte más importante de la utilidad de un DMP, la capacidad que tengamos para conectar nuestros segmentos para la activación o, dicho de otra manera, para usarlos en nuestras campañas.
Uno de los errores más comunes cuando se habla de los DMPs es asociarlos como una solución exclusiva del ecosistema de la publicidad programática. No es que los DMPs no tengan una utilidad en el mundo programático, el problema es que la utilidad de un DMP va más allá de la programática.
El papel de un DMP es en realidad aplicar el conocimiento de nuestros clientes en cualquier capa en la que queramos personalizar el mensaje o la experiencia de un cliente en base a la información de que disponemos de ese cliente o de un segmento de clientes.
Teniendo en cuenta esta ambición de los DMPs la capacidad para conectarse con las diferentes plataformas de activación es un elemento clave que tendremos que considerar a la hora de elegir con cual nos quedamos. Básicamente tenemos tres entornos en los que activar nuestros datos:
Generar una target para una campaña publicitaria
Este es el principal punto de conexión del DMP con el ecosistema programático. Un DMP nos permite compartir una audiencia con uno o varios DSP para buscar en el inventario disponible en los diferentes AdExchanges a esos usuarios e impactarles con un mensaje específico de nuestra marca. Este concepto es el que conocemos comúnmente como remarketing o retargeting. En este punto la principal ventaja del DMP es poder gestionar acciones a través de diferentes DSPs sin perder la capacidad de tener cierto control sobre dos aspectos clave: la frecuencia de impacto añadiendo capacidades cross-device y la capacidad de decidir dinámicamente el importe de la puja de cada impresión adicional sobre un mismo usuario en función de su probabilidad de conversión ponderada por la probabilidad de que acabe hasta el corvejón de nosotros.
Personalizar en contenido de nuestro sitio web, aplicación…
Para mi uno de los aspectos clave del DMP es su capacidad para informarme en cada interacción con un usuario de su perfil conocido para intentar en la medida de lo posible mostrarle contenido relevante. Es evidente que aquí se juntan dos aspectos, uno la capacidad de identificar al usuario a través de su ID y otro tener la capacidad de decidir qué mensajes es el más adecuado para mostrar en esa interacción. En muchas ocasiones el modelo de decisión de esta capa de personalización se limita a un modelo de reglas predefinidas contra un inventario de mensajes finito. Se trata de reglas lógicas del tipo si (IF) el usuario pertenece al segmento ABC, o al 123, o al #$& entonces (THEN) muéstrale la creatividad XYZ.
Compartir datos de nuestras audiencias con otros (sindicación)
Otra oportunidad de los DMPs es la de compartir datos con terceros, lo que se puede convertir en una forma de monetizar los datos de primera parte. Este concepto es en el que se basa por ejemplo las audiencias de segunda parte. Digamos por ejemplo que una marca como L’Oreal tenga información de sus usuarios que puede ser útil para una campaña con uno de sus distribuidores, en ese caso L’Oreal podría compartir esa audiencia con su distribuidor sin perder la propiedad de sus datos con el fin de hacer una acción de co-marketing.