borges taxonomias

Hay dos temas que me resultan particularmente interesantes. Uno de ellos es la información, y en particular, el efecto del exceso de información en los individuos. El otro es el “taggeo” o etiquetación de la información. En la intersección entre ambas cuestiones crece el asunto de la metadata, en particular aquella de los contenidos de video. Esto tiene absoluta vigencia en la medida en que crece el negocio de VOD y su pequeña ecología de plataformas, formas del negocio y standards tecnológicos.
En el fondo el problema de la metadata es humano. La forma de catalogar y definir algo es absolulatamente imperfecta. No obstante, poseemos el deseo del catálogo óptimo: de objetos, archivos, átomos o bits. Este deseo nunca se concretará. Borges tenía una respuesta a esto. En su “Idioma analítico de John Wilkins”, Borges enumeraba a los animales del emperador con sutil ironía y falsa ingenuidad: los catalogaba como pertenecientes al emperador, embalsamados, amaestrados, “que se agitan como locos”, etc. Borges se ríe de nosotros en estas páginas. Más adelante resuelve el misterio, advirtiendo al lector que “no hay clasificación del universo que no sea arbitraria y conjetural. La razón es muy simple: no sabemos qué cosa es el universo.”
Aceptemos que pueden evitarse ambigüedades. Supongamos además que el término metadata no es ambiguo, pues no está estictamente referido a la “información sobre la información” (que sería una tautología) sino a “información sobre el contenido”, y que en particular hablaremos sobre metadata referida a contenido de video.

Hace poco salió a la luz un excelente artículo (gracias a @Nebul2 por esto) donde BeBanjo y Red Bee Media, dos referentes del mercado de contenidos, brindan claves sobre metadata. Lo que sigue es un resumen de ese artículo en español, sazonado con ejemplos y con mis propias opiniones.

1 – Qué es la metadata? Es la descripción de un video, tan sólo eso, y puede brindarse tanto en forma técnica como en forma editorial. La primera suele hallarse en formato texto, indicando cuál es el contenido, tamaño, duración, audio, compresión, ID. La segunda se ofrece a través de imágenes o de un trailer se cuenta de qué se trata el contenido. Esto se usa en EPGs o interfases de todo tipo, como en los ejemplos de la figura tomados para “House of Cards” para Netflix e IMDB.

metadata editorial

2 – Cuál es el standard más común? No lo hay. De hecho muchas compañías siguen usando la información de la conocidísima base de datos de series y películas, IMDB, debido a la inexistencia de standards de metadata. Esto nos da la pauta del camino que falta por recorrer.

3 – Un ejemplo claro de metadata técnica es el siguiente. No es más que un vector de datos, referidos al video y al audio con que el “asset” fue procesado.

ejemplo de metadata

4 – Hay algún avance hacia un standard técnico? Debería haberlo, pues de otro modo la ecología de proveedores de contenido, agregadores, y operadores tendrán costos mayores de procesamiento. Lo más parecido a un standard es el desarrollo realizado por DPP (Digital Production Partnership) que brinda alguna guía en torno a los campos esenciales a usar. DPP es un consorcio sin fines de lucro, fundado por BBC, ITV y Channel 14, por lo que de momento es más influyente en la producción y distribución de contenidos en diversas plataformas del Reino Unido. Puede hallarse más información en el siguiente PDF sobre metadata técnica.

En el próximo post se exhibirán otros avances y ejemplos en torno a la metadata, en particular, cómo se los ve en un sistema y qué tan cerca está del CDN.