Este es un tema de gran importancia ya que numerosas empresas, grupos, consultoras publicitarias, partidos políticos, agencias gubernamentales, clubes deportivos, bancos, industrias, ejércitos, espionaje, etc. han centrado en el análisis de datos una especie de brújula con indicaciones precisas sobre el camino a seguir aunque las cosas no son tan simples.

Los datos se pueden obtener de casi todas las actividades humanas, tabular, interpretar,… sin embargo, se cometen sesgos importantes en este proceso, por lo que, finalmente, por muchos datos obtenidos y análisis realizados, aparecerán errores, a veces muy significativos.

En primer lugar, el sesgo sociocognitivo, es decir, cómo diferentes culturas, idiomas y ubicaciones geográficas producen diferentes formas de ver las cosas, incluso dentro del mismo campo práctico. Esto afecta en primer lugar al profesional de la programación, ingenieros, informáticos, etc. Por ejemplo, el ingeniero formado en los Estados Unidos tiene patrones de comportamiento que están predeterminados por el marco social de su país, sus leyes, costumbres, sistema educativo, mercado laboral e innumerables condiciones de vida. En este «ecosistema cognitivo y relacional» diseña sus productos, ya sean hardware o software, pensando en un mercado formado por individuos que tienen patrones de comportamiento social similares. Pero sus invenciones o productos tendrán que comercializarse en un mercado mucho más grande, ya que las empresas están orientadas a las ganancias. Por lo tanto, pensamos en un mercado potencial que ahora llamamos «global», internacional, sin tener en cuenta que estos productos están diseñados por «mentes estadounidenses», con el consiguiente riesgo de fracaso.

Se puede objetar que las grandes multinacionales, digamos Coca Cola, Nike, IBM… desarrollan productos que tienen éxito en los mercados internacionales. Sí; pero hasta cierto punto. Aquí entramos en un problema sobre la globalización económica y el crecimiento en las ventas, un binomio con el que no estoy de acuerdo.

El ingeniero de nuestro ejemplo puede pensar incluso teniendo en cuenta este mercado global y supuestamente único, diseñando algoritmos complejos con la intención de llegar al mayor número posible de clientes potenciales. Aun así, el sesgo cognitivo y cultural está ahí. Aun así, las posibilidades de fracaso son altas.

Otro ejemplo, la red social más extendida en el planeta en estos momentos es Facebook y sus filiales Instagram y WhatsApp. Prácticamente en cualquier parte del mundo podemos ver legiones de personas que se conectan a estas redes sociales, o las tienen en sus smartphones aunque no las utilicen. Sabemos que el negocio de tales invenciones es recopilar información, procesarla, venderla y, de paso, vigilarnos. En otras palabras, el cliente es el producto. También, paralelamente, la empresa matriz, hoy llamada Meta, multiplica su negocio vendiendo publicidad. ¿Hasta qué punto se puede sostener el negocio de esta empresa tecnológica en el tiempo? Posiblemente esté alcanzando su máximo crecimiento. ¿Por qué? Hay varios factores a considerar; pero uno de ellos es el sesgo cognitivo, ya que Facebook nació en un entorno occidental, limitado, y aunque ha crecido exponencialmente y se ha ido reinventando añadiendo nuevas funcionalidades, esto no implica que su dominio en el ámbito de las redes sociales sea absoluto. La gente busca lo que es cercano y familiar, lo que no viola su idiosincrasia cultural, su forma de vida y estilo. Facebook era influyente en ese momento, ahora ya no lo es tanto. De ahí que la supuesta saturación de las redes sociales no haya impedido que aparezcan y crezcan enfoques similares pero con un diseño más «sociocognitivo», como la polémica red TikTok y su rápida expansión.

Esto en lo que respecta al desarrollo de productos. En el ámbito del consumo, el problema es mayor, como bien saben los publicistas.

La globalización económica fue un salvavidas inicial para muchas empresas que vieron cómo su área geográfica más cercana estaba saturada y podían expandirse hacia otros mercados. Muchos economistas incluso dijeron que los usos y las formas de consumo estaban estandarizados en todo el mundo. Lo que parecía válido en Los Ángeles o Nueva York también debería ser válido en cualquier ciudad del planeta. En definitiva, pensaban,  el consumo es consumo. y todos somos consumidores. Ley de vida.

¿Ha sido así? Claramente no. Muchas empresas fracasaron en su estrategia de expansión internacional. Otras se hundieron y terminaron desapareciendo por haber destinado todos los recursos a esa estrategia. Los anunciantes fueron los primeros en darse cuenta de que un producto, por ejemplo una marca de pantalones de mujer, no tiene la misma aceptación en una ciudad u otra, incluso dentro del mismo país. Así, segmentaron el mercado para refinar y optimizar sus campañas publicitarias. Pero no fue suficiente. La gente, como ya he dicho, busca lo que es cercano y familiar, y termina siendo conservadora a la hora de modificar los hábitos de vida.

Siguiendo con el ejemplo de Facebook, no es lo mismo el norteamericano que utiliza la red social en su país que el senegalés que la utiliza en el suyo. La red funciona igual en ambos países, funciona igual en todo el mundo; pero los usos son diferentes. Sus ejecutivos evidentemente se dieron cuenta de esto. Y modificaron el algoritmo para hacerlo más sensible a la sensibilidad de cada país, sin poder detener la caída de los usuarios habituales.

En segundo lugar, el sesgo de vulnerabilidad aplicado a la conducta de mujeres y hombres que producimos datos manipulados para proteger nuestra privacidad. Por ejemplo, la mentira constante  entornos virtuales … Sí, las aplicaciones y algoritmos que los soportan están diseñados para obtener información fiable incluso sin darnos cuenta; no obstante, ¿estamos seguro de ello? De ser así, podríamos haber previsto, por ejemplo, redes sociales como TikTok y anticipar limitar su influencia. No ha sido así.

Todos somos vulnerables y las nuevas tecnologías nos lo recuerdan siempre. Los humanos tenemos una memoria limitada. Cualquier navegador de Internet, sin embargo, tiene una capacidad casi ilimitada para buscar y recordarnos cosas. Todo queda registrado y procesado. Esto puede ser tan aterrador que un ciudadano bien informado se preocupa por estas posibilidades tecnológicas que nos hacen la vida más fácil pero también nos controlan. En estas circunstancias, cada vez más personas buscan garantías de protección en todos los ámbitos de su vida, incluido el digital. O quizás más digital que todas las demás áreas, como la protección del hogar o la integridad física personal. Algunas aplicaciones están diseñadas para eludir el seguimiento informático y ofrecer pistas falsas, además de eclipsar las geolocalizaciones. Existen navegadores de Internet que impiden cualquier tipo de seguimiento, ocultan direcciones IP, etc.

Somos mentirosos por naturaleza. Tratamos de protegernos con mentiras. Algunos más que otros. Los políticos y los gobiernos mienten casi compulsivamente. Esto no es nuevo. Por  tanto, cuando inadvertidamente proporcionamos información que obtienen de nuestras aplicaciones y usos en Internet, ya intentamos engañar y mentir. Es lógico e incrementaremos nuestra protección con datos falsos. Las grandes empresas tecnológicas tienen cada día más dificultades para obtener datos confiables. De esto se deduce que la ciencia de datos tiene que evolucionar hacia sistemas proactivos capaces de identificar estas vulnerabilidades, lo cual no es un asunto fácil, por cierto.

En tercer lugar, el sesgo ideológico. Afecta más a los partidos políticos y a los gobiernos. Las empresas multinacionales también tienen el mismo problema. Y los consumidores reflejan este sesgo con demasiada frecuencia.

La ideología y -por extensión- la religión, pueden distorsionar el trabajo con datos, al menos en países con democracias consolidadas. Este no es el caso en países como China, con una presencia abrumadora del Estado en la vida de sus ciudadanos.

La ideología y la religión contaminan los datos, pueden enmascarar una realidad, ya que reflejan aspectos subjetivos y añaden incertidumbre y error. No olvidemos que al menos el 85% de la población mundial tiene algún tipo de creencia religiosa.

He ofrecido una breve descripción de tres tipos principales de sesgo que deben tenerse en cuenta en la ciencia de datos; pero no solo, ya que estos sesgos atraviesan las prácticas habituales en muchas disciplinas humanísticas, estructuran comportamientos sociales e individuales y juntos agregan incertidumbre. Un análisis ético que es necesario en las sociedades democráticas también puede surgir de ellos, incluso sabiendo que los estándares éticos no serán aplicados por todos los gobiernos y empresas. En otras palabras, las reglas del juego tecnológico son diferentes dependiendo de quién participe, un asunto del que hablaré en otro artículo.

Por JL Nava

Docente. Mis intereses de investigación: Antropología y economía médicas, bioética y desarrollo social. Realizo consultoría en el ámbito de la edición científica. Edito libros y escribo prosa poética. ............................................................................................

Deja una respuesta