¿Qué es el Big Data? II

¿Qué tiene de especial el Big Data?

Tratar gran cantidad de datos es algo que desde siempre se ha hecho en informática, entonces… ¿Qué tiene Big Data que lo haga diferente a todo lo anterior? ¿Un simple aumento de tamaño puede provocar un cambio tan importante? ¿Y ese cambio tecnológico, además, implica consideraciones éticas de importancia? Pues sí, el tamaño importa, y mucho, y las consecuencias que tiene tener más información y poder tratarla con más velocidad son importantísimas.

El uso de Big Data permite a los investigadores descubrir cosas en los datos que, utilizando los medios de almacenamiento y análisis anteriores, hubieran necesitado invertir muchísimo más tiempo para encontrarlas. Además, el aumento de la información procesada permite descubrir patrones que, utilizando un menor número de muestras, hubieran pasado desapercibidos. Esto tiene, por lo tanto, importantes consideraciones éticas.

cabinet-157891_640Pongamos un ejemplo: supongamos que una persona tiene una determinada enfermedad y no quiere que eso se sepa. Aparte de mantenerlo en secreto en su vida personal, tiene que tener muy en cuenta de en dónde está esa información guardada, para no permitir que se divulgue (ficheros sanitarios, informes, expedientes, etc.). Controlando ambas cosas, el secreto permanece, en principio, a salvo. Si mediante Big Data podemos llegar a saber dicho dato de esa persona sin acceder ni a sus pensamientos ni a los contenedores de información donde ese dato está guardado, de alguna manera nos estamos saltando el derecho a la privacidad que tienen las personas en lo que respecta a su salud. Es decir, estaríamos utilizando la técnica Big Data para, sin ninguna consideración por nuestra parte, acceder a una información que ni ética ni legalmente nos está permitido conocer.

Un ejemplo de esta situación concreta se describe en un artículo de Duhigg (2012). A un técnico en tratamiento de datos se le hizo directamente la pregunta: “Queremos saber si una cliente está embarazada, incluso si ella no quiere que lo sepamos… ¿Puedes hacerlo?” La pregunta, por supuesto, la motivaba un importante interés económico para la empresa (unos grandes almacenes que no citaré). Las parejas que acaban de tener un hijo son un objetivo clave de las campañas de marketing por dos motivos: en primer lugar tienen que comprar un montón de cosas nuevas, asociadas al nacimiento; por otra parte, están tan ocupados y en cierto modo sobrepasados por las circunstancias, que ello hace que cambien sus hábitos de consumo, dejando de comprar en los comercios específicos del barrio, tiendas pequeñas y sectoriales, para pasar a hacer sus compras en grandes almacenes generalistas, donde pueden comprar de todo y además mucho más rápido. Sin embargo, como los registros de natalidad son públicos, todas las empresas saben cuándo una pareja ha tenido descendencia. Saberlo antes que los demás sería la clave del éxito; por eso, la empresa deseaba saber exactamente cuándo una mujer estaba en su segundo trimestre de embarazo, para así poder hacerle llegar una campaña publicitaria personalizada, aprovechando el momento en el que la mayoría de las parejas comienzan a comprar cosas específicas para su situación, como vitaminas para ella, ropa y complementos para el bebé, etc.

Los hábitos de consumo pueden dar más información de nosotros de lo que pensamos. De hecho, en este caso concreto, los técnicos de la empresa pudieron encontrar 25 productos que, si se analizaba su consumo en conjunto, podían dar con bastante fidelidad incluso el momento del parto. Esta información, sin embargo, no podía utilizarse sin más, pues podía darse el caso de que cuando los clientes descubrieran que la cadena de tiendas sabía cosas de ellos que no les habían contado, podían sentirse muy incómodos (como poco). Utilizar el conocimiento de cuándo una mujer se había quedado embarazada y había dado a luz podía ser muy útil desde el punto de vista del marketing, pero desastroso desde el punto de vista de las relaciones públicas. Por ello, la empresa decidió enviar la publicidad de los artículos relacionados con la natalidad de una forma encubierta, entremezclados con otros artículos al azar, intentando hacer creer así al cliente que la selección de productos que se le presentaba era meramente casual. Si los clientes supieran de verdad cuánto saben los grandes almacenes a partir de sus hábitos de consumo, lo considerarían una intromisión imperdonable en su vida privada, algo a todas luces inconveniente y poco ético.

Encierro_personal[1]La suspicacia no es lo único que se puede despertar en el receptor de esa publicidad, en algunos casos puede darse una situación incluso más desagradable; como cuenta el mismo Duhigg en una entrevista posterior a su primer artículo, las mujeres que sufren un aborto antes de llegar a dar a luz siguen recibiendo una publicidad que más que serle útil lo que hace es recordarle con pesar el trauma que acaba de vivir. Este tipo de circunstancias ocurre porque cuando Big Data encuentra un determinado patrón, aunque el margen de error es pequeño, existe, y en él caben los sentimientos de muchos seres humanos. Big Data nos dice qué les pasa o en qué piensan el 90% de las personas que siguen un determinado patrón de comportamiento; las personas que conforman el 10% restante serán consideradas como las demás, aunque eso sea un error. En todo caso, de lo que trata Big Data es de poder y de dinero, no de sentimientos. La empresa hizo muchos esfuerzos por descubrir las dianas de su campaña de publicidad, las embarazadas, porque había un interés económico claro en saberlo. No pusieron el mismo empeño en descubrir cuándo una mujer había sufrido un aborto para dejar de enviarle su publicidad, porque ello no les reportaría un beneficio económico similar.

La utilización de las técnicas de Big Data pueden, además, ahondar la brecha económica que tienen que superar las minorías desprotegidas, acentuando su discriminación. Durante la pasada crisis de las “subprime” en EE. UU. algunas compañías agrupaban clientes asociándolos a lo que denominaban “ghetto loans”, una referencia clara a su origen afroamericano. Si bien discernir el origen cultural de un grupo de personas para hacerles objeto de campañas publicitarias adaptadas a sus sensibilidades es correcto, separar las personas por su color, máxime cuando se hace para negarles la opción de recibir crédito, es claramente un comportamiento racista y discriminatorio, no solo falto de ética sino también pernicioso para la sociedad, pues hace todavía más difícil prosperar a quien más difícil lo tiene de partida.

En conclusión, si a nuestros hábitos de compra sumamos las páginas web de internet que visitamos, cuántas veces hacemos click en determinados controles, con qué frecuencia usamos nuestro teléfono, nuestra tarjeta de crédito, etc. la información que se puede obtener de todo ello es tan completa, que podemos tener la seguridad de que lo que nosotros consideramos nuestra “vida privada” está dejando de serlo. Es evidente, por lo tanto, que no basta con tener la capacidad técnica para obtener una determinada información, es también necesario un código ético que permita saber cuándo se están cruzando determinadas “lineas rojas” que no se deben traspasar.

Un comentario en «¿Qué es el Big Data? II»

  1. Pingback: ¿Qué es el Big Data? | El sitio de Ho Tse Chu

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *