Tag: BigData (page 1 of 3)

La fantástica ilusión de usar datos incorrectos

analytics vs data governance

Hace unos cuantos meses acepté el ofrecimiento de diseñar y dictar cursos sobre Data Science y Analytics para una gran consultora global. La audiencia no estaba definida -desde técnicos informáticos hasta gerentes de negocios, pasando por data scientists-. Esta amplitud me provocó dudas sobre el contenido. Tenía mucha información recopilada en varias vidas pasadas como Físico, profesional de Telcos, Consultor y Presales para varias empresas del exterior, Director de Ventas, y “generador de trainings” en los últimos tiempos. Tras alguna reflexión y consultas me decidí por no codear en “R”, contar algo de historia (Bayes, Hollerith, Galileo, Turing, Vonnegut, etc), explicar los algoritmos y modelos más usados, abrir el juego y estimular la capacidad de dar respuestas basadas en data con los Problemas de Fermi. Sobre todo incluí muchos casos de uso de unas diez industrias: contar qué es lo que funciona y qué no. La vuelta de tuerca es que diseñar estos cursos me hizo pensar acerca de lo que realmente funciona en la transformación digital de las empresas.

Leer más

Galileo, Saturno y el “bias” de la información

Era verano en el año 1610 en Pisa. Galileo había logrado en pocos meses mejorar un telescopio holandés, negociar un cargo casi eterno con la Universidad de Pisa y tentar un mecenazgo de los Medici. Soñaba con las lunas jovianas recientemente descubiertas y quería ver más allá. El reciente trabajo de Kepler sobre los movimientos planetarios (áreas iguales en tiempos iguales) estaba en su cabeza.

Leer más

La falacia de las tecnologías sencillas

alphazetta wein picture

Hace unos diez días asistí en Viena a una reunión con el board de Alphazetta. El corolario de la reunión fue el Global Analytics Summer Camp, con una decena de oradores muy importantes. Fue un evento-boutique con solo unos 60 asistentes,  puro contenido y reflexiones, absolutamente desprovisto de humo marketinero o intenciones comerciales demasiado directas. Hago un resumen de las mejores 4 ó 5 charlas.

Leer más

Las cajas chinas de Cambridge Analytica

APkDTLx

Déjenme reconstruir el asunto en orden cronológico, y usar el tiempo presente, aunque esto comenzó en 2013. O tal vez antes, cuando todos decidimos confiar y ceder los datos.

Una consultora boutique, Cambridge Analytica (CA en adelante), contrata científicos de datos para construir modelos sobre datos que aún no tiene. El CEO de esta compañía, Alexander Nix, está muy bien conectado, incluso con gente que acerca fondos a la campaña de Trump. Es un “etoniano”, un sujeto de la más elegante clase intelectual británica.

Leer más

El nuevo arte del diagnóstico

mj17-aiblackbox1

Hoy estaba terminando de diseñar una charla sobre Machine Learning en el ámbito de la Salud. Es ese momento donde usualmente tiro la mitad de las transparencias y trato de concentrarme en lo importante. Qué es lo esencial?

  • Big Data y Analytics ya están, de algún modo, en el vertical Health. Los KPIs del paciente, la idea de una mejor gestión en salud con una integración de datos. Tal vez ese “emprolijamiento” haya llegado tarde, pero existe.
  • Soy un poco escéptico acerca de los esfuerzos colaborativos como Patients like me, porque se mezclan causas nobles con inyecciones enormes de capital a cambio de datos y experimentación. Atado a esto está la cuestión de la privacidad de los pacientes. iCarbonx está invirtiendo hace un año 600 millones de dólares en esto.
  • Los “wearables” pusieron de moda que el propio paciente controle algunos indicadores, pero de un modo fashion. Las verdades a medias de Fitbit son conocidas. Apple está reinventando este concepto con el lanzamiento del iPhone 8 y el iWatch 3, con la idea de que con un par de start-ups y sensores puede atacar lateralmente el mercado (sin mucho diálogo con la FDA) y anunciar que “un celular es el monitor perfecto de la salud”. Será una cuestión de branding y absolutamente debatible.
  • Está de moda hablar de Machine Learning y en particular de Deep Learning aplicado a salud. Para ayudar al médico en el diagnóstico, para hacer más eficiente la telemedicina o simplemente para ser más eficiente. En países como China (debido a la polución) o India (no hay oftalmólogos) Google se está metiendo con mucha fuerza. Imaginemos: cada año mueren en China 600 mil personas debido al cáncer de pulmón.  Es la población de Mar del Plata, cada año.
  • Cada vez que hablamos de esto surge el efecto Skynet. Un algoritmo decide quién tiene cáncer y quién no? Y cómo funciona el algoritmo? Bueno, cada vez hay menos talento como para entender los algoritmos. Es el mismo problema con la regulación de los automóviles automáticos (sin conductor). No existen reguladores que entiendan inteligencia artificial. Con los algoritmos en medicina sucede lo mismo: se prueba que acierta más que el humano, pero no se entiende bien cómo. Cuanto más poderosa es la inteligencia artificial, más opaca se torna. Estamos como en la figura, tanteando con una puntita un cubo negro. Sobre esto, tres frases que me gustaron mucho:
    • Podemos construir estos modelos, pero no sabemos cómo funcionan.
    • Qué tan bien nos bancaremos que estas máquinas sean impredecibles e inescrutables?
    • Es parte de la naturaleza de una AI que solo en parte de ella exista una lógica definible. Parte es intuición.
    Por qué el gap entre médicos y data-scientists? No deben existir dos profesiones más distintas en cuanto a los skills valorados y a las capacidades de comunicación. Habrá gran demanda de profesionales a mitad de camino, donde imagino más bien al que tiene background científico estudiando histología y anatomía para entender las imágenes. Finalmente, el tema es el cáncer. Laboratorios, FAMGA (sobre todo Google), y start-ups (Enlitic, Infervision, etc) están buceando allí. Esto va a conducir a algunas preguntas cómo qué es, finalmente la enfermedad y por qué en algunos casos hay metástasis y en otros no. Parece una banalidad pero no se sabe mucho. El “AI NOW report” tiene un capítulo dedicado exclusivamente a la salud. Hay un premio de un millón de dólares puesto en Kaggle para quien muestre un avance significativo en este rubro, a partir de solo dos mil imágenes.

    Ya es tarde y aún sigo tirando slides y chequeando datos. Me quedo pensando en que las nuevas AI (las poderosas, las de Deep Learning) son parte racionales y parte intuitivas. Me pregunto qué otra cosas es la mente humana sino exactamente eso. Espero que la parte intuitiva me ayude más que la otra en esto de ir “podando” charlas.

    Leer más

Relinearización de la TV

Night-King

Cada tanto me llegan noticias de los nuevos OTT, como ecos de un planeta distante. Son voces autorizadas, de gente que está en la industria hace años, y para quienes el streaming no es una novedad. Para ellos hay demasiados cambios juntos, como si metiéramos el contenido en una licuadora y saliera todo disparado hacia cualquier lado: Una verdadera “relinearización” sobre la cual no tengo traducción (tal vez la “TV ampliada” de Gustavo Mónaco). La pregunta es la de siempre: “Cuál es la mínima inversión en contenidos y plataformas que garantiza en un mercado X un dado impacto en esta Nueva TV?”.

Leer más

Older posts