El amor en tiempos de Facebook

Ayer estuve en una charla de Carlos Duik en el NXTP Labs. Carlos es Data Scientist para Facebook, pero desde el vamos desconfía del “hype” de Big Data y cuenta su historia personal. Hizo su licenciatura en Computación Científica en Exactas, de allí pasó a un doctorado en Princeton, y a un post-doc en Rutgers. Su historia en Facebook es reciente, y ganó reconocimiento por el estudio de enormes cantidades de datos en Facebook buscando nuevas tendencias y grafos sociales, a partir de la actividad de los propios usuarios.

El gráfico muestra uno de estos resultados sobresalientes: cómo decae la actividad online en Facebook al pasar el estado de un usuario de “soltero” a “en una relación”. Suena razonable, hay actividades más interesantes que postear en esa transición. Qué tan significativa es la muestra? Enorme. Cuál es su validez estadística? Muy buena, aún asumiendo que se trabaja sobre lo que declara el usuario de Facebook. Cuál es el futuro de estas investigaciones? Carlos no aclara que todo esto es data ex-post, y que lo más importante es modelizar y armar modelos predictivos. Ejemplos del arte: la psicohistoria de Asimov, o los precogs de Tom Cruise. Usar toneladas de información preexistente para adivinar, de alguna manera, el futuro. O más sencillamente, que puedas recibir un mail que te diga “de acuerdo a tu actividad en Facebook, te estás por separar, pues tu comportamiento se parece al de esta muestra que…”. Impresionante, no? El impacto de los negocios que se podrían armar con esto es enorme.

Twitter no es ajeno a esta búsqueda. La tiene más fácil: textos más cortos y contundentes, hashtags que ordenan, y un volumen de datos similar al de Facebook pero mucho más conectado a fenómenos volátiles o de corto plazo. El mejor ejemplo de esto fue en el lejanísimo 2010 cuando se logró correlacionar menciones de estrenos de cine en Twitter como predictores de venta de tickets, y por lo tanto, del éxito de una película. Este paper pionero llevo un título muy “hypero” como Predicting the future with social media y tiene como coautor Bernardo Huberman, otro argentino que hace R&D en el Social Computing Lab de HP.

Volviendo a la charla de Carlos Duik, hubo un momento donde se preguntó cuál es el futuro de estas técnicas. O mejor dicho, cuál es el “hype del hype”. Las dos temas en auge son el  Análisis Semántico -donde se interpreta el humor de una población de acuerdo a la interpretación que se haga de cadenas de texto- y el llamado Deep Learning  -programación en redes neuronales que van aprendiendo de manera casi autónoma-. En ambos casos la robustez del algoritmo -donde el truco es detectar ironías, o interpretar un dado contexto cultural- impacta en el tiempo que se tarda en procesar petabytes de información: de segundos a meses.

Se hablaron muchos otros temas (privacidad, cómo hace Facebook en la gestión de rostros, qué van a hacer con Oculus o con M2M, etc) pero me quedo con esto: la belleza de millones de datos que permite modelar un sentimiento actual o un comportamiento futuro, y la paradoja de que la gente de Exactas sea capaz de predecir el amor.

 

2 Comments

  1. Siempre tenemos el viejo problema de cómo afecta al futuro la predicción del futuro… del tipo “tal acción va a subir, según los expertos…”

    Un abrazo.

  2. Hola Roberto. Tenés razón, en la bolsa esto es chamuyo e influencia pura. Pero en el arte es más interesante y algo de esto aparece en el “Fundación e Imperio” de Asimov, donde Hari Seldon, que va dejando pistas para el futuro, trampea un poco con esta habilidad. En Facebook por ahora no creo que logren cambiar el comportamiento de la gente con revelarlo…

Deja un comentario

Your email address will not be published.

*

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>