X

Las claves del uso de big data en la industria audiovisual

Cada vez es más frecuente la alusión al uso de datos masivos por parte de las empresas digitales. ¿Por qué se trata de un fenómeno relevante en la industria de los servicios de TV online?

Las claves del uso de big data en la industria audiovisual

14/07/2019 12:01

Hace apenas tres años circuló bastante por Internet, especialmente por la caja resonante que es Twitter, un artículo en el que el periodista José Soto Galindo ofrecía detalles minuciosos acerca de su consumo familiar en una plataforma audiovisual. En la nota, publicada por el diario mexicano El Economista, Soto contaba que “Netflix sabe que, cuando en casa nos enganchamos con una serie de televisión, nuestro consumo es obsesivo, casi demente. Sabe que de lunes a viernes (…) miraremos la pantalla de manera compulsiva hasta entrada la madrugada”.

El testimonio del periodista no provino de un control personal acerca de su historial de navegación en el catálogo del servicio de televisión online (también definible como Televisión Over The Top o TV-OTT para describir que utiliza la Red como medio de distribución por medio de la tecnología de streaming) sino que fue producto de un informe que le cedió después de una larga espera el mismo proveedor. Lo llamativo de esta anécdota, más allá de saber que a la familia Soto le gustan las maratones televisivas trasnochadoras, es que trasciende a un cliente y se trata, más bien, de una muestra individualizada de una práctica masiva en la que Netflix tiene vasta experiencia.

Al igual que muchas compañías digitales, la antigua tienda de video por correo postal devenida en prestador de TV-OTT es, en su esencia, lo que se conoce como una compañía data-driven, es decir una empresa cuyas decisiones operativas giran en torno a los datos. Pero, ¿de qué forma es posible que los datos sean la pieza conductora en el engranaje de una máquina que, en teoría, funciona por y para la creación y distribución de contenidos audiovisuales? ¿Qué tipo de datos reúne y cuál es su utilidad? La respuesta a estos interrogantes comienza con un concepto al que se menciona mucho en publicaciones geek o especializadas en tecnología y otro tanto más en medios generalistas. Se trata del big data,  un anglicismo que por básica traducción sugiere una enorme cantidad de datos pero cuyas implicancias reales no resultan tan simples y tienen mucho que ver con la híper personalización en la oferta de los contenidos.

 

Personalización de los covers de la serie Stranger Things para distintos perfiles de usuario. Fuente: Netflix.

 

QUÉ ES EL BIG DATA. Aunque las alusiones a este fenómeno son relativamente nuevas en ámbitos ajenos al campo de la informática, ya desde hace algunos años distintos sectores prestan atención a los gigantescos volúmenes de información que se producen en la Red y el modo en el que su crecimiento se aceleró en el último lustro. De acuerdo con Forbes, los 3.700 millones de personas que estuvieron conectadas a Internet durante 2018 produjeron la ininteligible suma de 2.5 quintillones de bytes por día. Otro aspecto más sorprendente aún: el 90% del total de la información albergada en Internet se generó tan solo en los tres últimos años, según la Unión Internacional de Telecomunicaciones. 

Según Forbes, los 3.700 millones de personas que estuvieron conectadas a Internet durante 2018 produjeron la ininteligible suma de 2.5 quintillones de bytes por día.

A partir del auge masivo de las redes sociales y las cada vez más frecuentes inquietudes acerca de los algoritmos capaces de medir cada acción dentro de los sitios web y las apps y su relación con la publicidad, campañas políticas y sistemas de vigilancia estatales, el tema ingresó en la agenda mediática y cada vez es más recurrente encontrarse con noticias acerca del uso de big data por parte de las empresas digitales. En general, existe cierta preocupación acerca de cuán transparente es el uso que hacen estos actores de la información privada de los usuarios y cuán provechoso les puede resultar el vínculo transaccional producido en el intercambio de datos por acceso gratuito a sus contenidos. También qué sucede cuando no se trata de sistemas gratuitos sino de pago, como la mayoría de los servicios de TV-OTT.

Como se dijo antes, se interpreta que el concepto en cuestión hace referencia a grandes cantidades de datos. Sin embargo, el quid de la cuestión radica en saber de qué tipo de información se trata, quiénes la producen y de qué modo resulta útil para las compañías audiovisuales.

Mediante el paulatino pero incesante crecimiento de la cantidad de personas conectadas a Internet, la recaudación de información es gigantesca. A pesar de esta idea popular de que las conexiones y el almacenamiento de los datos tienen lugar en un lugar místico y etéreo conocido como “la nube”, lo cierto es que se trata de operaciones más bien terrenales. Son los seres humanos quienes generan cantidades ingentes de datos cada vez que hacen doble click en una imagen de Instagram, sondean un destino vacacional en el buscador de Google o califican con tres estrellas la última temporada de Billions en Netflix

Ahora bien, la recolección de información no se restringe solamente a acciones concretas como los historiales de navegación y las interacciones en redes sociales. También incluye aspectos acerca de los usuarios como los registros de información personal relacionada con compras online, interacción con otros servicios (por ejemplo, la suscripción a un diario digital a través de un perfil en una red social), geolocalización, tipo de conexión, entre otros. 

 

Son los seres humanos quienes generan cantidades ingentes de datos cada vez que hacen doble click en una imagen de Instagram, sondean un destino vacacional en el buscador de Google o califican con tres estrellas la última temporada de Billions en Netflix.

 

No obstante, por más grande que sea el rejunte de información, en su estado puro carece de gran valor. Como sostuvo en 2016 Tod Yellin, vicepresidente de Producto de Netflix, en una entrevista para Big Think, “big data es una enorme montaña de basura con pequeñas gemas preciosas enterradas en su interior”. En ese sentido, es menester para las compañías data-driven hacer minería para encontrar las piedras preciosa que, en teoría, sirven para interpretar muy pormenorizadamente los gustos de sus audiencias. 

Es menester para las compañías data-driven hacer minería para encontrar las piedras preciosa que, en teoría, sirven para interpretar muy pormenorizadamente los gustos de sus audiencias.

ALCANCES. Sin la intención de adentrarse demasiado en los aspectos teóricos del tema, es preciso mencionar que existe un proceso más o menos estandarizado denominado ETL, al que recurre cualquier empresa interesada en la gestión de big data. El nombre proviene de la formulación inglesa extract, transform and load, que se traduce como la tarea de extracción, transformación y carga.

Este protocolo técnico sobre el manejo y procesamiento de los datos se encuentra atado a las estrategias y objetivos particulares de cada empresa. Por ejemplo, en el caso del sector audiovisual depende de variables como el tipo de contenidos (de producción propia o de terceros), las plataformas de distribución y las fuentes de financiamiento (suscripción, publicidad o un modelo mixto). 

En síntesis, durante el proceso de ETL cada compañía establece criterios específicos en relación a su negocio central y al tipo de sistema de gestión de big data que tenga disponible. Las decisiones y orientación de las estrategias en este circuito se conocen como business intelligence, porque enlaza las deducciones obtenidas a partir de las experiencias de los usuarios y la proyección de mejoras o nuevas directrices capaces de satisfacer demandas puntuales.

 

Fuente: elaboración de la autora.

 

A propósito del caso Netflix, resulta atendible que los resultados obtenidos a través de procesos en los que se utiliza big data no solo orientan a los equipos encargados de la interfaz de la plataforma (en aspectos como qué imágenes funcionan mejor, qué géneros exhibir, la segmentación del catálogo por región, entre otros) sino que también son clave a la hora de generar contenidos originales. Como señala la columna izquierda del gráfico, son varios los aspectos que se tienen en cuenta para perfilar mejor las producciones del sello de la compañía.

En suma, dentro de las principales cualidades del big data se encuentran la capacidad de procesar, homologar y someter a análisis grandes volúmenes de datos de distinto tipo a una velocidad antes inimaginable. Por otro lado, la capacidad predictiva de los sistemas aplicados en estos procesos otorga elevados niveles de concordancia con los gustos y las tendencias de comportamiento de las personas.

Sin embargo, no se debería perder de vista que, pese a la existencia de algoritmos súper poderosos, la conducta humana no es absolutamente predecible. De lo contrario, no se cancelarían anualmente cientos de shows supuestamente predestinados al éxito.