que es dirty data, seigoo

¿Qué es el Dirty Data?

En el apogeo de los sistemas de big data para la personalización tanto de páginas webs como de apps y de publicidad, la existencia de datos falsos es cada día más una fuente de problemas. Hablamos del denominado dirty data: informaciones falsas que proporcionan los usuarios para dar una cierta imagen o bien proteger su privacidad.

¿Qué es el dirty data y qué supone?

Tal como se introducía al inicio del post, se denomina así al conjunto de datos incorrectos, duplicados, incompletos u obsoletos que se mantienen sobre los perfiles de usuarios en las bases de datos de las empresas.

Esta información incorrecta causa estragos en los sistemas de big data que tienen por objetivo perfilar y conocer a los consumidores para ajustar una determinada oferta de servicios o productos.

big-data

¿Por qué existe?

Obviando el motivo más evidente, que es el de facilitar datos falsos con intenciones delictivas, existen varios motivos por los cuales los usuarios facilitan informaciones no fidedignas .

Es de dominio público que los datos condicionan las campañas, la personalización y la inclusión o exclusión en según qué colectivos. Existen usuarios, que al no percibir valor real a cambio de la cesión de sus datos, introducen deliberadamente informaciones erróneas para excluirse o incluirse en grupos objetivo a voluntad.

Análogamente, existe una gran cantidad de usuarios que sienten reticencia a facilitar según qué informaciones que pueden considerar muy privadas a ciertos sistemas. En estos casos, a fin de poder acceder a una campaña donde se les requieran ciertas informaciones, las proporcionan pero falseando las mismas para preservar su privacidad.

En cualquier caso, estamos hablando, según consultoras como Hocelot o Verve, de que prácticamente el 60 % de los usuarios ofrecen al menos un dato incorrecto cuando les son requeridos en Internet.

Decisiones erróneas

No es difícil llegar a esta conclusión. Si un dato en el que se basa una segmentación tiene una fiabilidad baja, la campaña asociada a la misma está llamada al fracaso.

Este es, hoy por hoy, uno de los temas capitales en la definición de campañas de marketing y donde la mayoría de especialistas hacen hincapié. No puede diseñarse una campaña de marketing efectiva sin contar con una fuente de datos fiable y actualizada.

dirtydata

Una user experience pobre

El concepto user experience es una máxima en nuestros días. La experiencia que debe ofrecerse al usuario final es la piedra angular de cualquier estrategia tanto de marketing como de fidelización.

No es difícil deducir que si la información de la que se dispone acerca de un usuario final es incorrecta, la probabilidad de ofrecerle una experiencia no adecuada es alta. Esto puede generar consecuencias negativas para cualquier negocio.

Incremento de costes

Un dato falso en un sistema avanzado de gestión de perfiles, campañas o simplemente de envío de pedidos en una tienda online puede ocasionar una pérdida significativa de tiempo y de recursos, es decir, incrementar los costes.

Un lead falso, un envío incorrecto o un target erróneo en una campaña de marketing, por poner unos ejemplos, se traducen directamente en una reducción directa del ROI de cualquier campaña. En otras palabras, obliga a invertir mucho más para conseguir lo mismo.

Pérdida de ingresos

No solo los costes se ven afectados por estos datos incorrectos. Una campaña mal dirigida en tiempos de alta personalización puede hacer que el usuario al que se haya dirigido la misma tenga una reacción de rechazo, provocando su pérdida como cliente.

En este caso, lo que se produce es una pérdida potencial de ingresos. Si el usuario afectado era ya un cliente entonces, la pérdida ya no es potencial sino real.

Los datos que proporciona la empresa especializada Experian Data Quality son muy relevantes: el 77 % de las empresas, en su informe, dicen perder un 12 % de ingresos netos por culpa de datos falsos o inexistentes.

big data dirty data

El dirty data es enemigo del big data y las campañas de personalización

Combatir el dirty data

Tecnología

La mejor y única solución para combatir este tipo de informaciones incorrectas es la llamada depuración de datos. Depurar los datos significa cotejarlos constantemente, buscar fuentes de datos externas y hacer un seguimiento exhaustivo de los mismos.

Este es un campo donde el uso de soluciones de inteligencia artificial puede aportar mucho. Este tipo de tecnología permite identificar patrones con la lectura masiva de datos de varias fuentes para dar niveles de fiabilidad a los datos.

Confianza y valor añadido

Cuando hablamos de datos falsos, la primera palabra que debe venir a la mente es confianza. El motivo por el cual se proporcionan datos falsos es, principalmente, falta de confianza. En este punto, si se quiere disponer de datos fiables de clientes, la clave es establecer relaciones de confianza y valor añadido con los mismos.

Demostrar profesionalidad en la gestión de los datos, atención personalizada y puntual y salir de las técnicas de bombardeo constante con información no relevante. Deben ofrecerse soluciones en el momento correcto y al usuario específico. Cualquier otra opción generará dirty data

¿Y tú que opinas?

Sin comentarios

Añadir un comentario