En la nueva era del conocimiento que se abre ahora, el big data —es decir, la disponibilidad de datos a lo grande (a lo inmenso, por mejor decir)— y los sondeos de opinión se necesitan mutuamente. Han de ir, forzosamente, de la mano. Si esto no resulta tan obvio como debiera, se debe sin duda al inadecuado entendimiento general de lo que los sondeos realmente son y a la fe tan ciega como difusa, por parte de algunos, respecto de lo que el big data, por sí solo, puede conseguir.

Los sondeos de opinión nacieron con la intención de contribuir a un mejor conocimiento de los valores, emociones, actitudes y opiniones de los ciudadanos: es decir, de los factores más susceptibles de moldear y encarrilar su comportamiento. El objetivo era captar y medir, de forma regular, el pulso social —en expresión de Gallup—, es decir, las evoluciones del estado de ánimo colectivo. No fueron concebidos para predecir comportamientos, sino para describir las predisposiciones ciudadanas a actuar en un sentido u otro. Su objetivo es arrojar luz sobre los climas de opinión que puedan existir, y obrar como una especie de brújula que indique la dirección del sentir colectivo. (Este es, por cierto, el único sentido posible de los sondeos preelectorales, por más que hayamos todos condescendido, con errónea ligereza, a falsear su función concediéndoles un valor predictivo que solo de forma muy aproximada y tangencial pueden llegar a tener).

Por su parte, el big data se aparece como un nuevo El Dorado: una tierra de incalculable riqueza informativa. Nunca, antes, ha existido una masa de información tan abrumadoramente masiva (y, además, en permanente y exponencial crecimiento) sobre prácticamente todos los aspectos de la vida. Nosotros mismos la vamos creando, tan constante como inadvertidamente, con las continuas pistas que vamos dejando sobre nuestros gustos, intereses o incluso salud cuando utilizamos Internet (Google, Amazon, Twitter o Facebook) o la ahora menos glamurosa pero ya universal tarjeta de crédito. Toda esta información, considerada antes exhaust data, es decir, datos desechables y sin mayor utilidad aparente, constituye en realidad, en su prácticamente inabarcable magnitud, una mina informativa de inimaginable riqueza sobre la vida social. Requiere únicamente ser excavada y desvelada. Y de ahí la actual pujante eclosión del data mining (minería de datos) y de los algoritmos, equivalente hipersofisticado, en este contexto, al clásico instrumental minero (plano, pico y pala). Falta tan solo el casco, con luz incorporada, y el canario (por si hay grisú), que es lo que al equipamiento pueden aportar los sondeos de opinión.

Incluso los más alambicados algoritmos, si carecen de “la luz desde dentro” que, sobre los factores moldeadores de los comportamientos, aportan los sondeos, solamente conseguirán generar información “externa”. Pueden establecer infinitas correlaciones (muchas de ellas sin duda esclarecedoras, otras ambiguas o desconcertantes y otras pura y simplemente carentes de sentido), pero renunciando siempre a explorar las causas subyacentes. Da igual, se ha llegado a decir: “¿Para qué molestarnos en averiguar por qué la gente hace lo que hace? (…) Con la suficiente cantidad de datos, los números hablan por sí solos” (Chris Anderson,’The End of Theory‘, 2008, online). No es cierto: los números nunca hablan por sí solos, nunca son autoexplicativos.

Schönberger y Curlier (‘Big Data. La revolución de los datos masivos’; 2013, Turner) han vuelto recientemente, de forma más prudente, a esta misma idea: con el big data el objetivo no será ya indagar el porqué de los comportamientos, sino la miríada —visible o latente— de asociaciones existentes entre estos. Con eso será suficiente. Pues no. Aunque el big data llegara algún día a equivaler a “todos-los-datos-posibles-existentes”, nos seguiría faltando algo esencial para su mejor comprensión y, con ellos, de la vida social: la percepción directa —no deducida— del mundo de las motivaciones y de las causas.

Tim Harford, en un equilibrado balance de los pros y ontras de este nuevo tiempo (‘Big Data: are we making a big mistake?’, FT Magazine, marzo de 2014) nos advierte: “Big Data have arrived, but the insights have not”. O lo que es igual, estamos avanzando inmensamente en términos de información disponible, pero no de forma paralela en cuanto a capacidad de comprensión de lo que esta pueda significar.

En uno de sus textos más citados, Pascal distingue entre lo que designa como “espíritu de geometría” y “espíritu de finura”. Cabe entender por el primero la solidez y el rigor; por el segundo, la sagacidad y la perspicacia, sobre todo frente a la ambigüedad (y por ende, frente al cambio, que es lo más difícil de modelizar). El propio Pascal señalaba que ambos se complementan y necesitan: sin la adecuada solidez, la perspicacia deriva fácilmente en mera ocurrencia; el rigor, falto de sagacidad, conduce a espejismos o a la oscuridad. Por ello, big data y sondeos de opinión, adecuadamente entendidos y readaptados en cuanto haga falta, ni rivalizan ni son incompatibles; en realidad, se complementan y potencian.