Problemas éticos de las decisiones basadas en datos.
Cuando tomamos una decisión basada exclusivamente en el análisis de datos caemos en el error de no considerar otro tipo de perspectivas en la toma de decisiones. Si nos fijamos exclusivamente en lo que estadísticamente es mejor para obtener un beneficio inmediato en nuestra decisión, podemos caer en el utilitarismo de hecho, obviando las consecuencias tanto éticas como económicas que nuestra decisión puede tener.
Pongamos un ejemplo: a partir de los datos económicos, laborales, etc. un banco puede recibir en sus análisis a futuro el consejo de abandonar un determinado país, pues eso sería lo más conveniente desde el punto de vista económico, según los datos analizados. Sin embargo, la persona encargada de tomar la decisión puede finalmente decidir que el banco siga operando en dicho país, teniendo en cuenta que abandonar a sus clientes en momentos de penuria económica les impediría seguramente volver a recuperar su confianza una vez la crisis haya pasado. Y en esos momentos, para el banco puede ser más importante mantener la implantación en un país en el que tradicionalmente está bien considerado, que huir de él hacia áreas económicamente más boyantes. La decisión tendría, por lo tanto, una consideración ética y económica con una visión a más largo plazo que la obtenida a partir del mero análisis de la coyuntura económica. Vemos, por lo tanto, que los indicadores estadísticos permiten obtener información valiosa a la hora de tomar decisiones, pero hacerlo exclusivamente guiados por ellos es éticamente incorrecto. Los seres humanos vivimos en sociedad, y las decisiones que tomemos tienen que tener en cuenta también la visión “social” que se va a tener de nosotros una vez que las tomemos.
Es por lo tanto imprescindible actuar con una ética fundada en valores más que en hechos, ponderando en su justa medida lo que el análisis de datos nos revela. Es muy importante a su vez incorporar dichos valores al quehacer profesional de todos los trabajadores y directivos de la empresa que capta y gestiona la información, creando así un código de conducta propio en el tratamiento de los datos. La responsabilidad social de las empresas que gestionan el Big Data es muy grande, tan grande como la incertidumbre y malestar que podría generarse en la sociedad si ésta se sintiera continuamente espiada.
Otro error muy común cuando se analizan datos es considerar que cuando dos cosas ocurren simultáneamente ello implica que hay relación causa-efecto entre ellas. Este error, muy conocido y evitado en el mundo científico, no es tan fácilmente percibido por profesionales no versados en el método científico o la filosofía del conocimiento. Cuanto más cantidad de datos analicemos más correlaciones espúreas de este tipo saldrán a la luz. El abuso de la investigación de datos puede llegar a darnos una visión errónea y totalmente infundada acerca de un determinado tema. Por ejemplo, el análisis de datos puede llevarnos a la falsa conclusión de que las personas nacidas en febrero tienen mayor número de accidentes de tráfico que las nacidas en otra época del año. Si una compañía de seguros empieza a variar el precio de sus pólizas en función de la fecha de nacimiento del conductor del vehículo, estará cometiendo un grave error, a pesar de lo que digan los datos estadísticos.
La razón es sencilla: no podemos dar a priori como válida una correlación estadística entre datos si entre ellos no hay ningún otro tipo de relación. Veamos esto con otro ejemplo: si las personas que conducen en un determinado país o provincia tienen más o menos accidentes, ello está relacionado con la seguridad de su red de comunicaciones, la edad media del parque de vehículos, la formación necesaria para obtener el permiso de circulación, etc. Es decir, la correlación estadística nos sirve para indirectamente obtener una visión de la influencia de todos esos factores en la producción de accidentes en un determinado área, y por lo tanto podemos ponderar económicamente el seguro de accidentes que se necesita en función de esos datos. En este caso, el estudio estadístico sí que tiene sentido y permite la toma de decisiones. Al no haber absolutamente ninguna relación entre tener un accidente y la fecha de cumpleaños del accidentado, cualquier inferencia estadística que relacione dichos datos está condenada al fracaso, por mucho que estadísticamente parezca que está justificado.
Finalmente, incluso si existe una relación de confianza entre el usuario/cliente y la empresa, se hace necesario establecer algún tipo de relación contractual expresa, una aceptación consciente y válida por parte de la persona que va a ser rastreada de que van a obtenerse datos de su actuación. La última normativa europea sobre aceptación explícita de “cookies”, reflejada en el art. 2 de la LSSI que autoriza la instalación de las mismas a condición de que los usuarios “hayan dado su consentimiento después de que se les haya facilitado una información clara y completa sobre su utilización”, es un paso en esta dirección. Sin embargo, la forma mecánica y muchas veces inconsciente en la que se realiza dicha aceptación devalúa el efecto contractual de la misma. Además, la ley obliga a todas las páginas por igual, tanto a las que meramente captan información de navegación para ser utilizada en la propia página web, como a las que recopilan absolutamente todo lo que hace el usuario para crear un perfil que posteriormente va a ser guardado, analizado y explotado (la única diferenciación que hace la LSSI es acerca de la captura de datos de carácter personal algo que, como ya hemos visto, el Big Data lo puede obtener sin la colaboración del usuario). Estos dos aspectos, el automatismo del usuario y una legislación generalista, van en contra de considerar realmente como un contrato válido la aceptación del usuario así establecida.
Conclusiones.
La utilización de técnicas de rastreo y caracterización a partir de los datos recopilados durante la actividad en internet es una actividad que claramente necesita de un código ético durante su realización, que evite discriminaciones, abusos y sufrimientos gratuitos a las personas. Dicho código ético tiene que tener en cuenta los principios de privacidad, confidencialidad, transparencia e identidad.
La posibilidad de acceder a información privada mediante el uso de Big Data implica que los procedimientos de recopilación, almacenamiento y análisis deben de ser transparentes para el usuario objeto del rastreo, debiendo éste en todo momento saber no solo que se le está observando sino también para qué. Claridad, simplicidad, diseño orientado a la privacidad y confianza que genere intercambio de valores son principios éticos a seguir en el diseño y utilización de las aplicaciones.
Utilizar Big Data para discriminar a las personas por su raza, sexo o religión debe de estar tan prohibido como lo está normalmente para cualquier otro tipo de actividad pública. El perfeccionamiento de la técnica no tiene que implicar la relajación del control ético sobre la misma sino todo lo contrario, cuanto más información se obtiene, mayor importancia tienen que tener las consideraciones éticas en la utilización de dicha información.
La toma de decisiones basada solamente en el análisis de los datos puede llevar a errores graves, producto de la ética utilitarista de acto que una actuación así promueve. La incorporación de valores éticos tanto al funcionamiento de las empresas como a su proceso de toma de decisiones, es absolutamente indispensable. Incorporar dichos valores como un código de conducta propio de la empresa aumentará el capital social de la misma, generando un clima de confianza en la relación entre las empresas e instituciones que utilizan la tecnología Big Data y la sociedad, algo evidentemente beneficioso para ambas partes.