IA, machine learning y el botón “Make movie”

Por Yeray Alfageme, Business Development Manager en Optiva Media an EPAM company
En los últimos años, quizá en la última década ya, el uso de lo que comúnmente se llama inteligencia artificial o más correctamente algoritmos avanzados de análisis, incluyendo aprendizaje automático o machine learning se ha generalizado desde el mercado de consumo hacia el entorno profesional. La sofisticación de este tipo de técnicas ha llegado a aplicaciones como el enfoque o incluso el reconocimiento y sustitución de objetos en la escena.
¿Qué es la IA?
Siempre es controvertido el definir la inteligencia artificial de una manera objetiva. Y es que incluso definir la inteligencia es una ardua tarea, pero intentémoslo. Un algoritmo de inteligencia artificial básicamente es un programa que realiza determinadas operaciones consideradas más propias de la inteligencia humana. Con lo que, ¿qué es la inteligencia humana? Pues según Oxford Languages la inteligencia es la capacidad de la mente que permite aprender, entender, razonar y tomar decisiones y formarse una idea determinada de la realidad. Poco ayuda esto a nuestro objetivo con lo que pongamos un ejemplo.
A la hora de decidir dentro de una escena, por ejemplo, donde colocar el punto de enfoque, intrínsecamente se analiza la escena y sus componentes y se decide el papel de ellos dentro de la historia que se está narrando, colocando y modificando el punto de enfoque dentro de la misma. Este proceso intuitivo a la hora de enfocar y complejo a la hora de explicar puede ser realizado por un algoritmo que realice dicho análisis y decida modificar la óptica para ofrecer el punto de enfoque deseado. Esto es inteligencia artificial: analiza, interpreta y decide realizar una operación en función de una situación dada. Y esto tiene numerosas aplicaciones en nuestra industria.
Decidimos nosotros, no la máquina
El ejemplo del foco llegó hace ya tiempo a cámara e incluso móviles con capacidad de cálculo suficiente para realizarlo. No confundir con el auto-focus, no es lo mismo. El foco automático no analiza la escena ni decide cambiar el foco de lugar proactivamente, solo sigue unos parámetros concretos y no tiene en cuenta nada más, por eso es tan odiado por cualquier profesional que se precie. Nosotros decidimos qué hacer con nuestro plano, no la máquina.
Sin embargo, cuando a estos automatismos aplicamos técnicas más avanzadas que nos ayudan a una mejor composición y al final calidad de nuestro contenido las reticencias no son tales, sobre todo viendo el resultado. Otra aplicación de este tipo de técnicas es, ya adentrándonos en la postproducción o edición, la sustitución o inclusión de objetos en una escena. Algo realmente tedioso ya que requiere tratamiento de la imagen fotograma a fotograma y, en muchas ocasiones, no es tan sencillo realizarlo.
Esta ardua tarea para cualquier editor y postproductor que se precie no lo es tanto para un algoritmo que reconozca cierta silueta, forma o patrón de un objeto, lo siga, y lo vaya sustituyendo fotograma a fotograma a lo largo de la escena. Lo que para nosotros serían horas para un algoritmo son segundos. Y esto no solo tiene implicaciones en el proceso de postproducción, pero también en el rodaje en si mismo.
Si no tenemos que esperar a un día despejado con bonitas nubes para viajar a la localización a rodar con todo nuestro equipo la flexibilidad que se gana y el evidente ahorro de costes en todo el proceso es significativo. Que esto no nos lleve al extremo de rodar en cualquier circunstancia y retomar la peligrosa frase de “esto se arregla en postpo” porque sería un graso error.
Pero tener la posibilidad de mejorar nuestra escena rodada eliminando ese avión que pasa por el cielo en el S. XV o el reloj en la muñeca del actor interpretando a un personaje histórico es real y la calidad obtenida no es para nada amateur. Es decir, no hagamos uso de las nuevas posibilidades que la IA nos ofrece solo para ahorrar, es sería demasiado burdo, pero mejoremos nuestro contenido con ello.
Más allá del retoque de imagen
Otra de las grandes aplicaciones de la IA es el reformateado. Y no se entienda esto solo como un escalado de la imagen si no como un cambio por completo del formato de esta. Si disponemos de un algoritmo que no solo “infle” la imagen para añadir más definición interpolando píxeles, si no que interpreta la secuencia y es capaz de añadir lo que falta respetando el espíritu del original se nos abren posibilidades como la de poder pasar un contenido de 4:3 a 16:9 sin las odiadas pilar boxes.
El coloreado de imágenes antiguas también es un campo en el que la IA ha penetrado y que realiza una gran labor, en este caso en estrecha conjunción con la operación manual. Digamos que se colorea manualmente un fotograma y, a partir de este, el algoritmo es capaz de extrapolar el resto de los colores de la secuencia, insisto siempre respetando el original. Si este proceso no se realizara automáticamente llevaría, como antaño, horas y días de trabajo para unos pocos segundos o minutos de material. De nuevo no hablamos solo de costes, si no de un mejor resultado en menos tiempo.
Menos es más
Y por último creo que cabe destacar un campo que no tiene tanto que ver con el contenido si no con el análisis de este, los metadatos. A cualquier rodaje se va con, al menos varios terabits de almacenamiento disponible por lo que pudiera pasar porque no es raro generar 1000, sí no me he equivocado, mil veces más contenido bruto del que luego realmente se va a usar en la edición. Y esto no solo es un problema de almacenamiento si no de catalogación y luego de búsqueda y uso de ese material. Hay demasiado.
Pero si permitimos a un algoritmo el realizar la búsqueda adecuada dentro del contenido esto se puede minimizar y simplificar bastante sin riesgo de perder material adecuado. Y no pienso solo de catalogar correctamente el material y buscar mediante palabras clave no. Me refiero a la posibilidad de que el algoritmo analice la escena, vea la composición de esta y, gracias a su aprendizaje automático, sepa distinguir entre una toma correcta o no, ya sea técnicamente respecto a exposición o enfoque, como a la acción propiamente dicha.
Esto que siena a ciencia ficción es técnicamente posible y, si no queremos borrar nada del contenido que hemos grabado porque nos da miedito al menos permitamos recibir ayuda a la hora de elegir el material a usar en nuestra edición, Es muy probable que las tomas que el algoritmo haya catalogado como 5 estrellas, por ejemplo, sean las mejores disponibles. ¿Os imagináis el tiempo que esto ahorra en la sala de edición? Incluso se podría realizar varias versiones del mismo contenido con un esfuerzo ínfimo.
Vayamos más allá
Y de este último paso a dar el salto al mágico botón “Make a movie” no hay un abismo tecnológico, tan solo mental. Hace ya unos años usé una simple App, no diré la marca por motivos obvios, a la que yo le dejaba las fotografías y vídeos hechos con mi sencillo móvil y ella era capaz de analizarla, elegir las mejores secuencias, mezclarla y añadirle música para sincronizar la composición con el ritmo de esta en minutos. El móvil se calentaba un poco, pero eso era todo.
Evidentemente esto banalizando mucho el concepto y sé que el uso que yo hacía de esta herramienta era muy sencillo y en un entorno controlado: vídeo familiares musicales de vacaciones. Nada del toro mundo. Pero sí es cierto que hasta que la descubrí yo dedicaba horas a editar esos vídeos y, ¿sabéis qué?, en el 90% de los casos no toco la edición automática que realiza el algoritmo, y a mis espectadores, familia y amigos, les encanta.
En este controlado entorno añade más valor el poder disponer del contenido editado rápidamente, con todo el material y con un acabado bueno y bonito, aunque no óptimo que el mejor de los resultados, que en muchos casos yo tampoco proporcionaba porque no soy un editor de vídeo, lejos estoy de ello de hecho.
Hoy en día no se me antoja tan lejano el mismo concepto en nuestro ámbito profesional. Quizá no en todos los entornos, seguro que no en ciertas composiciones en las que la emoción, la intrahistoria o el tipo de edición se salgan de lo prestablecido, y es aquí done lo realmente excepcional se crea, pero en el 90% de los casos lo veo factible e incluso adecuado.
¿Por qué una persona debe estar horas y horas en un ambiento monótono y repetitivo realizando la misma tarea una y otra vez con un contenido similar para editar, el corte, la noticia o la pieza dada siguiendo los parámetros establecidos? ¿Por qué esto no lo puede hacer nuestro amigo el algoritmo y esta persona dedicarse a tareas más humanas como pensar en la siguiente historia, formato o emoción que transmitir al espectador? Ese es el valor añadido de la IA, no el mero ahorro de costes
Conclusión
La IA o el machine learning no debemos concebirlo como una amenaza a nuestro trabajo o industria, nada más erróneo sería hacerlo. Es algo que ya esta aquí y que sus aplicaciones cada vez van a ser mayores y más extensas y su avance es inexorable con lo que el que se ponga delante se va a llevar un golpe. Siempre habrá el que la use solo para ahorrar costes. Eso es como usar una navaja suza solo para cortar pan, casi un insulto a la herramienta, pero es inevitable.
Si realmente hacemos uso de este avance como se merece, encargado a las máquinas el realizar tareas mecánicas y permitiendo a las personas volver a realizar tareas humanas nos daremos cuenta de que el potencial que tiene va mucho más allá y todos nos beneficiaremos de ello.
Aquí se han expuesto solo alguno ejemplo, incluso ideas felices, de por donde vamos y donde podemos llegar, pero dudo que nada de lo planteado aquí no esté ya o vaya a estar encima de la mesa o al menos en el roadmap de muchos fabricantes e innovadores miembros de nuestro mercado.
El cambio es un riesgo, pero si abrazamos ese cambio en lugar de rechazarlo todo será más fácil.