Sei sulla pagina 1di 5

Hacete amigo de la Big Data - Esteban Magnani

Los gures del Big Data dicen que si se cruzan datos suficientes todo sera predecib
le. El poder de los datos masivos combinados con inteligencia artificial ya ha d
emostrado que puede prever el comportamiento humano y modificarlo. Google puede
vaticinar el prximo xito cinematogrfico: saben que trece bsquedas relacionadas con u
na nueva pelcula se traducen en una entrada vendida. Sensores en medios de transp
orte "adivinaran" qu pieza ser la prxima en romperse. Hay un lmite para asignar tareas
a los algoritmos? La educacin? La gestin democrtica? El periodista especializado Est
eban Magnani advierte los peligros y recomienda amigarse con las estadsticas.
En la famosa serie de ciencia ficcin conocida como Fundacin , el cientfico, escritor,
qumico, divulgador (y ms) Isaac Asimov apoya la trama sobre la psicohistoria, una
ciencia ficcional capaz de predecir el futuro de la sociedad aunque no los compo
rtamientos individuales. La idea se inspira de las frmulas que permiten conocer v
erdades estadsticas como el comportamiento de una masa concreta de gas pese a la
imposibilidad de prever el comportamiento de cada molcula. Lo que se obtiene es u
na suerte de verdad estadstica comprobable.
Para que funcione, la psicohistoria requiere dos condiciones: que se aplique sob
re gigantescas cantidades de seres humanos y que esos humanos desconozcan sus co
nclusiones. Quienes vean el futuro tendrn la irreparable tentacin de modificarlo:
de hecho, eso es lo que ocurre en Fundacin, donde el protagonista intenta reducir
la etapa de caos de treinta mil aos prevista por sus anlisis a solo mil.
Y entonces? Lleg el momento de la psicohistoria? Se ha logrado reunir, procesar y ex
plotar los datos suficientes como para leer el futuro y operar estadsticamente so
bre l? El poder de los datos masivos (o Big Data) combinados con una inteligencia
artificial que aprende por prueba y error han dado pruebas de su capacidad tant
o para prever el comportamiento humano como para modificarlo: ya se utiliza para
ofrecer productos solo a potenciales compradores, disputar una agenda meditica y
tambin para influir en las elecciones. Las manipulaciones mediticas, la publicida
d a gran escala e indiferenciada pese a todos sus xitos para generar compras, vot
os y climas sociales, parecen torpes intentos primitivos comparadas con lo que e
st llegando.
Estadstica mata entendimiento
Google, Facebook, Amazon, entre otros, comprobaron hace ya mucho el poder de los
datos y sobre ellos montaron un meterico imperio en una dcada y media. Otros como
Microsoft o Apple, fundados sobre otros modelos, timonearon presurosos sus barc
os hacia la nueva tierra prometida.
Algunos ejemplos ya son conocidos: Google Translate, lanzado en 2006, se dedic a
la dificultosa tarea de traducir todo lo que le dieran. La corporacin no contrat a
miles de lingistas y traductores, sino a ingenieros (en su mayora monolinges), par
a que crearan algoritmos. Estas frmulas basadas en rdenes lgicas son la base de la
inteligencia artificial cuya caracterstica principal es su capacidad de aprender
por medio de prueba y error para mejorar sus resultados. Para comenzar se los al
iment con miles de libros (acumulados a travs de Google Books, por cierto) en dist
intos idiomas. Los algoritmos comenzaron no solo a entender cmo se remplazaba cada
palabra en otro idioma, sino tambin a ver cmo esas relaciones variaban segn el cont
exto: obviamente estas frmulas no entienden lo que hacen, o hablan los idiomas que
traducen, pero logran mejorar constantemente sus resultados gracias a la fuerza
bruta de las estadsticas. Al soltar ese algoritmo en la selva de la red y pregunt
ar si las traducciones sirvieron o no a los usuarios, es solo cuestin de tiempo h
asta que el sistema mejore lo suficiente.
bigdata_izquierda_3
Otro: Amazon, cuya primera innovacin fue la posibilidad de vender libros online,
tambin comprendi a tiempo el valor de los datos acumulados. Una de las vetas que e
ncontr en sus discos duros fue la de sugerir nuevos productos a los clientes en b
ase a sus compras anteriores. En un primer momento contrat a especialistas en lit
eratura, pero cuando comenz a utilizar algoritmos las ventas mejoraron y se hicie
ron tan fcilmente escalables que los egresados de letras debieron partir junto co
n los traductores remplazados por Google.
La lengua, con sus reglas particulares es (o era) uno de los campos ms difciles pa
ra que las frmulas matemticas pudieran aportar algo y, de hecho, an hoy las traducc
iones distan de ser perfectas y confiables. En otros campos con variables comple
jas pero finitas, como el ajedrez, hace aos que las computadoras vencen a los gra
ndes maestros. En marzo de 2016 el algoritmo de Google AlphaGo dobleg y dej perple
jo al gran maestro de Go Lee Se-dol: ese juego milenario era considerado una bar
rera para las computadoras debido a su complejidad. Segn el maestro, el programa
jug un partido perfecto, algo que no es de extraar porque estaba alimentado por mi
les de partidas y jugando con Se-dol sigui aprendiendo. Una vez ms, solo era cuest
in de tiempo. Y ser cada vez menos: los procesadores aumentan su velocidad.
Los gures del Big Data sealan que si se cruzan suficientes datos todo parece posib
le: las historias clnicas de todos los pacientes del planeta podran encontrar patr
ones capaces de, por ejemplo, descubrir interacciones medicamentosas puntuales e
imposibles de detectar por un solo mdico o en un hospital. Un relevamiento perma
nente de las empresas de transporte con sensores dispersos en un colectivo adivin
aran qu pieza ser la prxima en romperse y reducir accidentes y gastos. Los ejemplos p
odran seguir: los autos que se manejan solos sern, tarde o temprano, ms seguros que
los manejados por humanos; las grillas de electricidad administrarn los recursos
de la mejor manera para no desperdiciar nada; la distribucin eficiente de bicicl
etas en la ciudad y ms.
Ciencias Sociales
Hay un lmite para seguir asignando tareas a los algoritmos? Cul es? La educacin? La ge
tin democrtica? La respuesta es incierta y tal vez el significado mismo de esas mi
smas palabras cambie con la intervencin del Big Data y la inteligencia artificial
. Como explica el alemn y Doctor en Comunicacin Martin Hilbert en una excelente en
trevista reciente: [La disponibilidad de Big Data] convirti a las ciencias sociale
s, de las que siempre se burlaron, en la ciencia ms rica en datos. [ ] Nosotros nun
ca tuvimos datos, y por eso nunca funcionaban las polticas pblicas. Y de la noche
a la maana, el 95% de los sujetos que estudiamos pas a tener un sensor de s mismo 2
4 horas al da. Los bilogos siempre dijeron eso no es ciencia, no tienen datos . Pero
ellos no saben dnde estn las ballenas en el mar. Hoy nosotros s sabemos dnde estn las
personas, pero tambin sabemos qu compran, qu comen, cundo duermen, cules son sus ami
gos, sus ideas polticas, su vida social .
Google puede vaticinar el prximo xito cinematogrfico: saben que en promedio cerca d
e trece bsquedas relacionadas con una nueva pelcula se traducen en una entrada ven
dida. Facebook conoce cunto tiempo dedicamos a leer noticias polticas o memes de g
atos, adems de a qu hora lo hacemos y si preferimos los gatos que postea algn amigo
en especial. Esos datos se usan para mantenernos cmodos, interesados y, sobre to
do, generar millones y millones de dlares en avisos: las corporaciones 2.0 son, e
n realidad, agencias de publicidad que utilizan los datos que les brindamos para
vender espacios en el costado de nuestra pantalla a los avisadores. El flujo de
visitas, adems, se mantiene no porque produzcan atractivos contenidos como debe
hacer (costosamente) un medio tradicional, sino que somos los supuestos usuarios
quienes los generamos. Y lo hacemos gratis. No tienen aviones, fbricas, minerale
s o soja. Qu tienen que les permite obtener ganancias comparables a las de Exxon,
Chrysler o AT&T y sus estructuras monstruosas? Datos y la capacidad de analizarl
os.
Aunque no los veamos, los datos estn en todos lados si uno es suficientemente gra
nde y puede procesarlos. En 2004 Walmart comenz a explotar activos acumulados a l
os que nunca haba prestado atencin: el registro de sus ventas de los ltimos aos. Par
a eso contrat a un equipo especializado en Big Data que gener algoritmos capaces d
e buscar correlaciones entre datos propios y otros disponibles. Por ejemplo, al
contrastar sus ventas con las condiciones meteorolgicas descubri que ante la amena
za de huracanes aumentaban sus ventas de pilas y Pop-Tarts, una suerte de galleta
s rellenas. Aunque ni Walmart ni sus ingenieros tengan idea de por qu ocurre, col
ocan las Pop-Tarts en la cabeza de la gndola cada vez que hay amenaza de huracane
s.
Resultados, no hiptesis. Los por qu , si a alguien le interesan, quedarn para despus: m
ientras tanto la validez del algoritmo se mide en dinero. Y tambin en votos (que
tambin se traducen en distribuciones ms justas o menos justas del dinero).
Tocar la realidad
El deseo de conocer, modificar y controlar el comportamiento social ha existido
durante siglos. El desarrollo de un mercado de masas, la expansin de la democraci
a y el voto, la planificacin sanitaria o de transporte, entre otras cosas han for
zado a la implementacin de recursos ms precisos a la hora de medir e influir sobre
el comportamiento de la sociedad.
Las muestras sobre las que trabajaban las encuestadoras, los publicistas y hasta
algunos medios de comunicacin estn pasadas de moda: hay suficientes datos como pa
ra endurecer los anlisis alimentndolos de Big Data. Redes sociales como Facebook o
Twitter permiten conocer los intereses de millones de personas en tiempo real,
a qu estmulos responden, cundo se conectan, con quines interacta y ms. Al cruzar esa e
norme cantidad de datos con las que tienen, por ejemplo, las tarjetas de crdito o
los resultados electorales, se puede medir casi todo: En los barrios donde gana
la derecha leen ms noticias sobre motochorros? Quienes buscan vacaciones baratas s
on los mismos que sacan pasajes? A dnde van? Cundo? Pagan en cuotas? Queremos saber el
perfil de los que circulan por el frente de nuestro negocio? Podemos comprrselo
a Google, que almacena el recorrido de los celulares con Android que pasan por l
a puerta.

El Dr. en Informtica y Director Ejecutivo de la Fundacin Sadosky, Esteban Feuerste


in, coincide en que la informtica est convergiendo con las ciencias sociales: Hay u
na visin nueva que nutre la rama cuantitativa de las ciencias sociales. Hay ms int
ers por entender lo que hacemos los informticos con el Big Data , explica el tambin p
rofesor de la UBA. La informtica es una disciplina transversal. Siempre tuvo que t
rabajar con otros. Ahora en particular es tan rico, nuevo y productivo lo que pu
ede dar el Big Data, que es necesario trabajar todos juntos: informticos, fsicos,
socilogos, diseadores grficos, estadsticos. Hay un ida y vuelta .
Con esa cantidad de datos se pueden hacer cruces o, mejor an, encargar a un algor
itmo que haga cruces automticamente para encontrar tendencias y correlaciones. De
esta manera, las experiencias subjetivas de ser tienden a aplanarse en perfiles ms
fciles de manipular: bien (mal) usado puede ser una poderosa arma. Uno de los pr
imeros en comprender y usar con decisin el poder de esos datos para ganar eleccio
nes fue Barack Obama en la campaa presidencial de 2008. En EE.UU. no solo es opta
tivo votar sino que tambin es necesario empadronarse previamente. El equipo de Ob
ama clasific a los usuarios de las redes sociales de acuerdo a las posiciones polt
icas que revelaban sus amigos para reconocer a 3,5 millones de potenciales votan
tes demcratas no empadronados. Luego estudiaron sus intereses especficos y se tune
aron las propuestas que vera cada uno en Facebook: leyes de gnero para las feminis
tas, propuestas verdes para los ecologistas, retirada de Afganistn para los pacif
istas y as. El nivel de precisin de esta campaa result muy superior a los tpicos afic
hes con candidatos sonrientes que no pueden decir nada por miedo de espantar a q
uien piense distinto. En vez de un catch all ( toma todo ), lo que hizo Obama fue ms bi
en un catch each ( tomar a cada uno ). Finalmente el equipo de Obama determin que al me
nos un milln de sus targets se registr para votar. Aunque es incierta la incidencia
real de la campaa digital o saber quines votaron finalmente, se puede ser generoso
en las presunciones. Obama gan por menos de cinco millones de votos en todo el p
as y en Estados como Florida, clave para la victoria gracias al particular sistem
a electoral estadounidense, la diferencia con su oponente fue de menos de setent
a mil.
Donald Trump aprendi de su oponente y mand a analizar los perfiles, pero lo hizo c
on todos los ciudadanos en condiciones de votar. Con la informacin disponible pud
o saber qu noticias generaban ms respuestas (engagement en la jerga 2.0) y su equi
po de campaa se dispuso a usarlas sin ningn tipo de prurito tico o desagrado por la
s mentiras lisas y llanas (Post-truth, posverdad). Con informacin aportada por Fa
cebook, construyeron perfiles estadsticamente confiables de cada ciudadano. Trump
necesitaba encontrar sus potenciales votantes tal como lo haba hecho Obama ocho
aos antes, pero a una escala muy superior. Para lograrlo contrat a Cambridge Analy
tica, una empresa britnica que asesor a Ted Cruz hasta que renunci a la interna. Pa
ra su nuevo cliente, la consultora especializada en Big Data, no cre el cinturn oxi
dado de Michigan o Wisconsin pero s detect el potencial de votos republicanos. El s
iguiente paso fue dedicarles un mensaje especfico a cada uno: Por ejemplo, si Trum
p dice estoy por el derecho a tener armas , algunos reciben esa frase con la imagen
de un criminal que entra a una casa, porque es gente ms miedosa, y otros que son
ms patriotas la reciben con la imagen de un tipo que va a cazar con su hijo. Es
la misma frase de Trump y ah tienes dos versiones, pero aqu crearon 175 mil. Claro
, te lavan el cerebro. No tiene nada que ver con democracia. Es populismo puro,
te dicen exactamente lo que quieres escuchar , explica Hilbert.
En una entrevista a Barack Obama publicada en octubre de 2016 en la revista Wire
d, el entonces presidente de los EE.UU. mencionaba a los autos que se manejan s
olos como ejemplo de las problemticas de dar demasiado poder a los algoritmos: La
tecnologa ya est ac. Tenemos mquinas que pueden tomar muchas decisiones rpidas capace
s de reducir drsticamente los accidentes, mejorar el trfico, y resolver cosas como
las emisiones de carbono [ ] Pero, cules son los valores que vamos a embeber en eso
s autos? Si para salvar a un peatn, el auto debe embestir una pared, debera hacerlo?
Se trata de una decisin moral. Y quin decide esas normas? , se preguntaba. La intelig
encia artificial tiene supuestos e ideologas. Est lo que se llama sesgo algortmico:
ciertos sitios, dependiendo del perfil de quien est mirando, ofrecen trabajos peo
res. El algoritmo, al tratar de lograr el mejor matching y mayor probabilidad de t
erminar en una contratacin, elige ofertas de trabajos peores a esos segmentos de
negros o mujeres por los datos le dicen que eso es lo que ocurre , explica Feuerst
ein. Para el informtico esa es una de las principales preocupaciones respecto del
uso del Big Data.
Estamos realmente tan lejos de la psicohistoria? Los socilogos y los encuestadores
seguirn el camino de los traductores y los licenciados en letras para ser remplaz
ados por ingenieros carentes de por qu ?
La psicohistoria
Los algoritmos son bilardistas, solo les importa alcanzar el resultado embebido
en su cdigo. Prueba y error: si fallan lo intentan de nuevo. Resultan ideales par
a las esferas tambin resultadistas del marketing o buena parte de la poltica. Por q
u alguien compra Pop-Tarts antes de un huracn? Hay causalidad, efectos colaterales
o simple casualidad? No es relevante. Los algoritmos no buscan hiptesis: nadan en
la superficie de la empiria. Se puede decir entonces que hacen ciencia?
En la segunda edicin de su obra ms famosa, Philosophi Naturales Principia Mathemati
ca, Newton respondi lo que todos se preguntaban al leer la primera versin: qu hace f
uncionar a la gravedad? No he sido capaz an de descubrir la razn de estas propiedad
es de la gravedad al analizar los fenmenos y no hago hiptesis . El tema no era menor
: la gravedad era una forma de accin a distancia, un fenmeno al borde de la brujera
que alejaba por igual a racionalistas y religiosos. Por qu planetas, manzanas y p
ersonas responden por igual a leyes matemticas en cualquier parte del universo? Dnd
e estn escritas esas leyes? En cada partcula? El remate, Hypotheses non fingo , qued gr
abado en la historia. Si hubiera esperado entender el por qu de la gravedad para
difundir sus leyes an estaramos esperando: el gravitn, la hipottica (si, hipottica) p
artcula mediadora de la gravedad, an no ha sido detectada.
bigdata_derecha_7
La psicohistoria permaneci en el reino de la ficcin desde su nacimiento en los aos
sesenta. Las ciencias sociales siguieron siendo especulativas, blandas o como se
las quiera llamar. An disciplinas tradicionales como la sociologa que permanentem
ente intentan introducir la realidad en sus anlisis haciendo encuestas muestran s
us lmites de prediccin tras cada eleccin. Otra de las vctimas habituales de los inte
ntos de endurecer a las ciencias sociales ha sido la economa, sobre la cual se han
creado modelos matemticos que dicen ms sobre la correlacin de fuerzas entre ideologa
s que del comportamiento real de los mercados y el capital.
En la ltima dcada desde algunos sectores de las ciencias sociales se ha puesto nfas
is en las verdades estadsticas: por ejemplo la sociofsica se basa en la mecnica est
adstica, las matemticas usadas por los fsicos para modelar sistemas demasiado compl
ejos como para prever todas las interacciones individualmente. Algunas de las nu
evas disciplinas aplanan la sociedad para poder analizarla y, de ser posible, di
rigirla. El Big Data y la inteligencia artificial, sin prestar atencin a la epist
emologa, dan al menos algunas de las respuestas que el mercado natural de las cienc
ias sociales necesita.
El problema no es solo epistemolgico o de categoras: todo indica que estamos const
ruyendo una sociedad en la que el poder de influir a los dems est (an ms) concentrad
o, en manos de quienes pueden almacenar, comprar y procesar los datos. Miradas c
omo la Hiptesis Ciberntica explican que gobernar ya no es tanto imponer o legislar
como coordinar racionalmente los flujos de informaciones y decisiones que se pro
ducen espontneamente en el cuerpo social . Google y Facebook son -cada vez ms- tecnolo
gas de gobierno ocultos bajo su apariencia de redes sociales hechas por la gente . S
on la herramienta perfecta de la biopoltica foucaultiana devenida cada vez ms una
antomo-poltica que accede por fibra ptica a la intimidad de cada individuo para ges
tionar los flujos de informacin que construyen las subjetividades. Este rgimen tot
alizante e invisible depende de introducir cada vez ms gente en la arena digital,
donde puede operar sin ser vistos.
Donde antes se hablaba de la necesidad de una multiplicidad de voces, ahora hay
que pensar en marcos mucho ms complejos para regular el descontrol de los datos,
protegidos por una supuesta neutralidad de la red. Acaso sea an posible. Esa nece
sidad no surgir de los algoritmos que repiten lo que ya se sabe sino de quienes p
uedan dar un paso hacia atrs y proponer alguna alternativa un poco ms deseable.

Potrebbero piacerti anche