HomeEn portadaLa inteligencia artificial y las empresas de radiodifusión

La inteligencia artificial y las empresas de radiodifusión

Por Luis Sanz, Consultor Audiovisual

Las empresas de radiodifusión son entidades que se han visto afectadas en gran medida por la evolución de la tecnología en los últimos cien años. Desde las primeras emisiones de radio hasta la Ultra Alta Definición, la transformación tecnológica ha sido continua. Hasta la aparición de la digitalización y la informática, las empresas de radio y televisión producían y emitían sus productos apoyados en herramientas físicas y el trabajo de los profesionales. Para producir las señales de audio y vídeo, analógicas por supuesto, se disponía de máquinas, cada vez más sofisticadas, pero que necesitaban de la operación de personas para poder funcionar. Nada era automático.

La digitalización de las señales de audio y vídeo supuso una revolución en la producción de programas. Hubo que sustituir las herramientas analógicas por otras digitales con las que se mejoró sensiblemente la calidad del audio y el vídeo producidos, pero seguía siendo necesaria la manipulación completa de las máquinas por personas, y eso se mantuvo hasta que aparecieron la informática y sus capacidades de programación, con lo que se conseguía cierta autonomía de las herramientas, controladas por personas, pero compartiendo las acciones. Algunas operaciones se podían programar para que las hicieran las máquinas, reduciendo el trabajo de las personas. El software y el desarrollo de algoritmos habían supuesto la última revolución tecnológica en las empresas de radiodifusión, hasta que llegó la inteligencia artificial.

Ciertamente, hace ya varios años que en el campo audiovisual se dispone de herramientas informáticas con las que automatizar procesos que hasta entonces tenían que ser realizados por personas. Son procesos de carácter repetitivo o de análisis sencillo. Las primeras herramientas se aplicaron a temas como el subtitulado de contenidos, la catalogación de contenidos archivados o la transcripción de voz a texto. La automatización de estos procesos mediante algoritmos ha liberado a los profesionales de redacción y documentación de tediosas tareas, disponiendo de más tiempo para dedicarse a sus funciones principales, entre las que están la comprobación y validación personal de los resultados que ofrecen las herramientas.

Estas tareas automáticas se pueden considerar, sin duda, de inteligencia artificial, ya que son tareas inteligentes que no realizan personas, pero sus acciones están programadas, no tienen capacidad de producción propia.

A finales de 2022 y a lo largo del año pasado 2023, apareció la inteligencia artificial generativa, que supone que los algoritmos pueden analizar la enorme cantidad de datos disponibles en Internet, interactuar con las personas, contestando a sus peticiones y generar respuestas, con la capacidad de aprender y mejorarlas, de acuerdo con las correcciones que se le hagan. En una palabra, tienen capacidad de generar productos, lo que no había ocurrido hasta el momento.

Pretendemos, en dos artículos, conocer el pasado, presente y las ideas de futuro del uso de la inteligencia artificial en varias empresas de radiodifusión. En este primer artículo, hemos contactado con las siguientes cuatro organizaciones: Radiotelevisión Española (RTVE), Corporació Catalana de Mitjans Audiovisuals (3Cat), Radio y Televisión de Andalucía (RTVA) y Castilla-La Mancha Media (CCM). Profesionales de las mismas nos han hecho saber sus experiencias en relación con la inteligencia artificial (IA).

 

RTVE

Con la participación de Víctor Sánchez (Director de Operaciones de TVE), Pere Vila (Director de Estrategia Tecnológica de RTVE) y Virginia Bazán-Gil (Directora del Archivo RTVE).

 

 

Análisis del lenguaje de signos

La primera aplicación considerada como IA se hizo para el personal de emisiones que analizaba las imágenes del canal 24H. Cada segundo captaba un frame y comprobaba si había lenguaje de signos, es decir, si dentro del cuadro había un recuadro con una persona haciendo lenguaje de signos, lo contabilizaba y hacía informes de accesibilidad. Todavía sigue operando. Se llevó a cabo con la Universidad Politécnica de Cataluña y la tecnología se desarrolló por la empresa UGIAT.

También se firmó un convenio firmado con la Universidad de Vigo, grupo de investigación Atlantic por el que RTVE cede contenidos de su archivo para desarrollar un traductor de lenguaje de signos a audio y texto.

 

Archivo

En 2017 RTVE inició una cátedra con la Universidad de Zaragoza y desde ella se lanzaron varios proyectos centrados en Big Data e IA aplicada a los archivos media. Una de las primeras actividades de la cátedra fue hacer un estudio de mercado de las distintas soluciones comerciales existentes para la generación automática de metadatos, analizando contenidos, y especialmente se centraron en la transcripción de audio a texto.

En 2018 se convocó un concurso para metadatar automáticamente los contenidos para archivarlos y nos planteamos que el gran objetivo tecnológico era que fuéramos capaces de utilizar esa tecnología con independencia del proveedor que nos la facilitara, trabajando en la nube y condicionando la prestación del servicio a la calidad y a la evolución de la propia tecnología, de tal forma que si la calidad no cumplía nuestros estándares el contrato se acababa y, si la tecnología mejoraba, le podíamos pedir al adjudicatario que incorporara las mejoras. El primer concurso lo que hizo fue preparar ARCA, nuestro gestor documental, y que una vez que el trabajo concluyera, pudiéramos contratar otros servicios, lo que implicaba adecuar el modelo de metadatos, los flujos de trabajo, etc. El objetivo del archivo era metadatar 11.000 horas en un año.

 

 

Este primer concurso se adjudicó a la compañía VSN, que integraba tecnología de Etiqmedia para el análisis de audio, y Microsoft Azure para el análisis de vídeo. Se trabajó entre 2021 y 2022 para el Archivo de RTVE, fundamentalmente en el archivo fílmico, que tenía el material más antiguo, además de otros archivos de vídeo de centros territoriales y contenidos de los años 80 y 90. El trabajo se terminó con resultados interesantes y, durante el mismo, dimos formación a todos los trabajadores del archivo, involucrando a todo el personal en el proceso, sin imponer un cambio de tecnología, hablando con ellos para que se implicaran personalmente. La acogida fue buena, no hubo rechazo y, dado el éxito, más tarde, cuando finalizó el primero, y solapado con él, se lanzó otro concurso para analizar 40.000 horas de contenidos. En este caso, se adjudicó a la compañía NexTReT, que integra soluciones de IA de Ugiat Technologies. En estos momentos está en producción. La Figura 1.1 muestra un ejemplo de metadatado para archivo.

Por aquella época, apareció la inteligencia artificial generativa, con grandes modelos de lenguaje, que suponía un cambio tecnológico espectacular y lo que hicimos fue adecuar el nuevo pliego del concurso al nuevo escenario tecnológico, ajustando las expectativas, el número de horas, pidiendo nuevas funcionalidades que antes no existían, como traducción automática, descripción de escenas en lenguaje natural, resúmenes automáticos, segmentación semántica, etc. El concurso adjudicado ya está en producción e integra todo lo nuevo en ARCA. También el adjudicatario desarrolló una interfaz intermedia de validación de la calidad controlada por los documentalistas.

Por ejemplo, si tenemos el vídeo de una rueda de prensa posterior al Consejo de Ministros, la aplicación segmenta todos los temas tratados, transcribe automáticamente a texto las intervenciones, hace reconocimiento facial si hemos aplicado el modelo correspondiente y hace el resumen, y todo ello se integra en el archivo.

Es importante destacar que no solo hemos realizado el cambio técnico de innovación tecnológica, sino además todo el cambio cultural. Se ha integrado la IA en el trabajo diario, dejando al documentalista la capacidad de decidir cuándo aplicarla. Para ello, se ha hecho una apuesta importante por la formación.

 

Subtitulado

En relación con los Informativos de TVE, se puso en marcha el subtitulado de las conexiones de los centros territoriales. La tecnología de IA fue aportada por Universidad Carlos III de Madrid. Se decidió que se trabajara en la nube y, además, como todos los subtitulados eran a la misma hora, que cada motor en cada comunidad autónoma fuera diferente y la estructura de datos se atuviera a su lengua e idiosincrasia. Ahora ya está trabajando con el subtitulado bilingüe en los centros de comunidades con otra lengua oficial además del castellano y todavía se está perfeccionando. La Figura 1.2 ofrece un ejemplo de subtitulado del centro de Galicia.

 

 

Motor de Recomendaciones personalizadas

En 2018 se adjudicó a la UTE Konodrac-NexTReT, un sistema de recomendaciones basadas en IA para la OTT de RTVE, ahora RTVE Play. A mediados de 2023 se terminó el proceso que contempla todos los contenidos archivados por RTVE, más de un millón. La plataforma facilita un Big Data accionable que, mediante algoritmos propios de recomendación de contenidos, basados en inteligencia artificial, facilita y recomienda los contenidos más adecuados a cada usuario de forma automática.

El motor de recomendaciones cataloga automáticamente los contenidos en diferentes dimensiones; por un lado, según el metadato de categorías o taxonomías asociadas a los contenidos y, por otro, según los patrones de consumo de los usuarios.

Con las reglas de recomendación de los diferentes indicadores almacenadas en el motor de búsqueda, realizando una sola consulta se alcanzan las listas de recomendación ordenadas para un usuario concreto a partir de la combinación de sus características personales, su contexto, sus acciones, etc. La figura 1.3. muestra un resultado concreto de recomendación.

 

 

IA y la generación de imágenes

En TVE estamos empezando a explorar cómo se puede utilizar la IA para generar imágenes en promociones.  Hay tres aspectos: el puramente técnico en el que estamos nosotros, en paralelo se han lanzado las cuestiones legales de su uso y, finalmente, está la cuestión ética que tenemos que tener en cuenta como empresa pública.

Técnicamente, ya hay compañías como Adobe que tienen integrado en sus aplicaciones base, plug-ins de IA y nosotros nos beneficiamos de ello. Por ejemplo, AVID ya nos ha dicho que en su próxima actualización va a integrar IA. Veremos cómo funciona y decidiremos su utilización, en su caso. En paralelo, está nuestra iniciativa de crear un producto propio o adaptar alguno del mercado a nuestra forma de trabajar, como lo hemos hecho con las aplicaciones del archivo o del subtitulado en informativos.

 

RtveIA.es

El pasado año 2023, con el recurso de la IA, se produjeron todos los contenidos informativos de las elecciones municipales, autonómicas y generales, dirigidos a todos los pueblos de España de menos de 1.000 habitantes (4.900 pueblos). A partir de los datos electorales se generaron varios textos, formando una noticia, con titular, con entradilla, con párrafos sobre la participación, los resultados, los posibles pactos, los nombres de los alcaldes y con gráficos. Además, se sintetizaron las voces de la transcripción de texto a voz para internet y para Alexa. En la Figura 1.4 se puede observar el contenido correspondiente a Trévelez. El concurso que se sacó fue adjudicado a Narrativa, con una aplicación en la que detrás corre ChatGPT. La parte del audio se generó con una startup española, Monoceros, con la que se generaron tres voces para las elecciones. La IA generativa se utilizó para redactar los textos, pero no se dejó a ChatGPT por libre, sino que se le entrenó durante meses con datos de años anteriores y lo que nos ofrecía era analizado por periodistas para que los textos tuvieran el tono, la medida y la templanza de los textos de televisión española. Esta aplicación fue premiada en la feria IBC 2023.

Portal rtve2030.es

RTVE ha puesto en marcha el portal rtve2030, con las herramientas de IA. El proyecto ha consistido en analizar continuamente el contenido de lo que se emite en algunos programas de actualidad de RTVE y, a partir de unas ontologías, se mide cuántos minutos se está hablando de los Objetivos de Desarrollo Sostenible (ODS). Esta tecnología viene desde hace años de la Universidad Carlos III de Madrid. Durante dos años se midieron las referencias a los dos ODS que tenían más palabras y ontologías. Salió bien y se sacó un concurso para analizar y medir el contenido relacionado con los 17 objetivos de los ODS. El concurso se adjudicó a la Fundación Salvador Soler Mundo Justo. En la Figura 1.5 se puede observar una búsqueda determinada.

 

 

Hiperia

Una de las más relevantes aplicaciones de la IA realizada por RTVE ha sido HIPERIA, creada para un programa musical de Radio 3 Extra. HIPERIA se considera el primer contenido audiovisual creado íntegramente con inteligencia artificial. Es un avatar (Figura 1.6) que presenta el programa, en el que la IA generativa es utilizada por el guionista del programa, que le pide hacer el guion a ChatGPT y luego lo analiza para ver si está correcto. A partir de ahí generamos la voz, que es nuestra, y todos los movimientos. Estuvo funcionando el año pasado (esta aplicación fue finalista en los premios IBC 2023).

Para la generación de la imagen se utiliza Lexica, un buscador de imágenes generadas por la aplicación Stable Diffusion, y para los movimientos la tecnología es de Heygen. Ahora estamos preparando el HIPERIA 2, con una presentación más elaborada que la anterior, ya que hay nuevas herramientas que lo permiten. Se pretende que se vea como un avatar, no como un humano, tanto físicamente como en la voz. Se le está dando vida en tres dimensiones y seguramente se le ponga un chatbot, para que se le pueda preguntar.

 

 

Iveres

Iveres (identificación, verificación y respuesta) tiene como objetivo combatir la desinformación interesada y es un proyecto que RTVE presenta para verificar noticias. Usamos la IA para detectar informaciones falsas, tanto de texto como de audio o vídeo. Para ello, estamos trabajando con varias universidades, la Autónoma de Barcelona para el contenido científico, la de Granada realiza análisis de voz mediante un modelo que establece si una voz es buena o es falsa; la Politécnica de Cataluña distingue si una imagen es real o no y la Carlos III aplica ontología y herramientas para manejar todos los datos que generan los demás. Tiene que estar acabado a finales de este año.

 

Monitoreo de contenidos

Hemos desarrollado con IA, una aplicación de monitoreo de contenidos, utilizando ChatGPT, para dar resúmenes de noticias de prensa a corresponsales de RTVE en diferentes ciudades del mundo. En cada caso, el corresponsal elige los periódicos y ChatGPT hace un dossier de prensa de las noticias importantes de cada uno, evaluando su calidad, que se envía al corresponsal. También se generan para la dirección.

 

Administración

Se está empezando a trabajar con ChatGPT en pruebas de soporte a departamentos administrativos; por ejemplo, en la gestión de contratos y convenios, que se reúnen en un repositorio común al que se pueden hacer preguntas de gestión. También se está trabajando en una aplicación para la defensora del espectador, que recibe cada mes varios centenares de correos, para analizarlos, seleccionarlos, clasificarlos, resumirlos y preparar informes para el Consejo de Administración.

 

Cambio cultural

Hay una cuestión de fondo para abordar la introducción de la IA en RTVE. Como hemos señalado en el caso de los fondos documentales, lo difícil no es la tecnología, que lo es, sino el cambio cultural en la empresa. Hay tecnología de IA que no utiliza IA generativa y que no genera problemas de tipo legal (derechos que no tienes, datos que no puedes compartir, etc…), pero con la IA generativa la situación es diferente, en algunos casos no debe haber problemas; por ejemplo, en Hiperia el guionista utiliza ChatGPT para la redacción de resúmenes del contenido del programa, pero el guionista lo repasa, lo revisa y lo comunica, no genera problemas a la organización. Sin embargo en otros casos, como en el de gestión de contratos, la IA no es generativa, pero a lo mejor los contratos, según la ley europea tienen que estar en unos servidores en Europa y ahí ya podríamos tener un problema legal. En otros casos de generación de contenidos de audio y vídeo se pueden generar conflictos, hay que tener mucho cuidado, sobre todo en una empresa pública como RTVE.

 

Formación

Para la utilización de herramientas de generación de imágenes como Midjourney y Stable Diffusion se están planteando talleres explicativos acerca de las posibilidades que ofrecen para grafismo y otros departamentos. Todavía no se usan corporativamente.

3Cat – CCMA

Con la participación de Natalia Prats (Directora d’Infraestructures Digitals i Tecnològiques), Rául Menéndez (Cap del Departament de Producció y Gestió de Continguts) y Alberto Alejo (Cap del Àrea de Enginyeria).

 

Los inicios

Empezamos en el 2010 con la tecnología de Verbio, en el subtitulado de los Telenoticies en directo, para hacerlos accesibles al público con diversidad funcional. También se realizaba la audio-descripción de los títulos y de los textos que aparecían sobreimpresos sobre la imagen, para contextualizar y poder señalar a las personas que salían en la imagen y localizarlas en el fotograma.

Verbio realiza el procesamiento del lenguaje natural y se puede considerar una vertiente inicial de IA.

 

Servicio de catalogación

Dentro de la corporación CCMA se creó en 2019 una comisión interdisciplinar con técnicos y personal de catalogación, indexación y documentación para ver qué aplicaciones había en el mercado para la transcripción de audio a texto. Se estudiaron soluciones de IBM Watson, de Google, de Microsoft y soluciones nacionales como Etiqmedia. Poste-riormente, se realizó un concurso que se adjudicó a Etiqmedia y, en 2021, después de la pandemia, se empezó con esta empresa un trabajo de transcripción de los audios que se emiten por la radio y archivarlos en el gestor de media (MAM) con la transcripción asociada, etiquetado para catalogación y NER (reconocimiento de entidades nombradas en el texto) para determinación de las entidades, por las que buscar al realizar una noticia.

Etiqmedia es la plataforma con la que se sigue trabajando actualmente. En el fotograma del uso de la aplicación (Figura 2.1) podemos ver su funcionalidad: a partir del vídeo o del audio se obtiene la transcripción que llamamos de “time code” a frase, se marca en el vídeo el time code donde se produce esa frase y así se consigue que, picando en el texto, se vaya a la parte del vídeo donde se está diciendo ese texto y viceversa, moviéndonos por el timeline del vídeo, picando en un fotograma, enseña el texto de lo que se está diciendo. Es muy potente para periodistas y documentación. También se puede ver el reconocimiento de la persona dentro de la imagen, como se observa en esta otra imagen (Figura 2.2), que es un resultado de laboratorio realizado desde el área de ingeniería. Se entrena al sistema vectorialmente con todos los rostros y, cuando se produce la coincidencia vectorial, localiza al personaje y nos dice cuánto tiempo ha aparecido en el vídeo. El laboratorio que se realizó desde el área de ingeniería de reconocimiento de rostros está basado en tecnología Deepface.

Toda la información generada se guarda en el gestor de contenidos al servicio de la redacción y documentación.

En la parte baja de la aplicación se aprecian tres columnas: lugares, organizaciones y protagonistas, con otro etiquetaje que también obtiene la aplicación a partir del texto. Hay dos conceptos: descripción de la imagen y descripción del tema. Que aparezca una persona en una imagen no implica que se esté hablando de esa persona, por ello, hay una descripción de la persona en la imagen y una descripción temática del texto de lo que se está hablando de la persona. Lo mismo ocurre con las sobreimpresiones, la aplicación recoge el texto impreso—por ejemplo, los créditos del programa—, y actúa como OCR, reconociendo los caracteres del texto impreso de la imagen.

 

 

 

Archivado automático

En 2021 se puso en marcha el archivado automático también con Etiqmedia, solicitado por el departamento de documentación, ya que recibía muchos archivos que solo tenían audio y trabajar con solo audio para hacer búsquedas o encontrar dónde se ha dicho algo concreto en un audio determinado es muy complejo porque obliga a escuchar el audio, por lo que se decidió proceder a automatizar todo el flujo de trabajo, empezando por lo que se emite en la radio, se decide lo que es relevante y la aplicación lo transcribe de la misma forma que se hace con el audio de los vídeos, de forma que se tenga el NER y el timecode a frase, para navegar en el reproductor de audio y realizar cortes según las necesidades de redacción. Todo se archiva automáticamente y se puede aprovechar para el circuito de publicación del 3Cat, nuestra OTT. El flujo de trabajo se observa en la Figura 2.3.

Toda la ayuda que ofrece la IA de Etiqmedia permite que los periodistas y documentalistas sean más eficaces y tengan más tiempo en centrarse en sus cometidos, redactar y documentar, sin tener que dedicarse a las tediosas labores de búsqueda y etiquetaje. No obstante, deben realizar tareas de revisión de los resultados de las acciones automáticas que hace la IA, y de entrenar y supervisar el sistema y las actualizaciones de los algoritmos, ya que la tecnología no es perfecta y produce errores, por ejemplo, en la transcripción. En resumen, es una gran ayuda en estos departamentos, pero también incorpora tareas que antes no se realizaban.

 

 

Nube de palabras

A partir de un laboratorio, dentro del departamento de ingeniería, se realizó en 2021 una experiencia con IA, aplicada al programa del debate a la presidencia del Parlament. Más tarde, en 2022, se repitió en el programa del debate a la presidencia del Fútbol Club Barcelona.

Mediante la tecnología de spaCy, junto con la plataforma corporativa de Big Data, se utilizó procesamiento de lenguaje natural para extraer de cada candidato que estaba interviniendo en directo, frase a frase, después de su transcripción, qué palabras estaba utilizando más, verbos, personas, entidades, organismos, etc. Todos estos términos aparecían como una nube de palabras categorizadas al lado del candidato, apreciándose la importancia de cada una en el discurso. Todo el proceso se realizaba con un decalaje de solamente 2 minutos desde la pronunciación de la frase (Figura 2.4).

Esta información, en tiempo real, permite a la redacción del programa evaluar la calidad de cada discurso y confrontarla entre los candidatos (figura 2.5), con lo que se enriquece el programa de debate.

 

 

IA generativa

Cuando descubrimos la explosión de la IA generativa en 2023, empezamos a considerar la generación de títulos, resúmenes y etiquetados automáticos e iniciamos el estudio de la puesta en marcha del denominado ‘asistente periodístico’, una especie de copiloto que ayuda al periodista a partir del cuerpo de la noticia que él redacta, y le propone un título, un resumen y un etiquetado. Para ello, es necesario contar con herramientas de IA generativa y vimos que nos podíamos aprovechar de la liberación que estaba haciendo OpenAI, permitiendo el acceso a modelos complejos de lenguaje, como ChatGPT y creando una interfaz humana para dialogar con el modelo.

El asistente periodístico fue uno de los primeros casos de uso de IA Generativa, sobre el que se han hecho pruebas de diferentes LLM-Large Language Model (ChatGPT, LLAMA2, Mixtral), pero sigue en un ámbito de experimentación.

En 3Cat se ha creado una comisión interdisciplinar para hacer un uso responsable de la IA. Otros medios del extranjero ya lo vienen haciendo, como la BBC, que ha desarrollado una guía de uso de la IA.

En la corporación hemos empezado a dar estos pasos, por la preocupación que tenemos del uso que se hace de los datos cuando salen hacia ChatGPT, perdemos el rastro, no sabemos qué pasa con esos datos, adónde van, qué datos no deberían subir nunca y todo lo relacionado con la ética, la privacidad, los derechos de autor. Todo esto se está trabajando en la comisión de la IA responsable.

Uno de los temas que más preocupa de ChatGPT es que no es el mejor escenario para subir los datos y, por ello, nuestra idea es tener un modelo propio, no solo porque no queremos que se pierda el rastro de los datos, sino porque también queremos tener un asistente periodístico con un estilo basado en el corporativo, de 3Cat, tal y como trabajamos las noticias, desde la vertiente de la redacción de informativos, deportes y programas y, a día de hoy, ChatGPT no lo permite, ya que es un modelo generalista y nosotros queremos trabajar con un modelo que se haya entrenado con nuestras noticias y cumplir dos escenarios: uno es que sea capaz de ser un asistente cuya respuesta de título, resumen y etiquetaje de la noticia se base en nuestro estilo y, el otro, que esté dentro de nuestro perímetro de empresa, es decir, que los datos no salgan hacia afuera. En caso de que queramos trabajar con un partner tecnológico que sea un arrendatario («tenant») del dato que garantice su seguridad, privacidad y que no salga de su perímetro y que esté dentro del ámbito de la legislación de la Comisión Europea. También estamos colaborando con el BSC dentro del CIDAI, con la Universidad La Salle, o empresas catalanas como Ugiat. En resumen, estamos buscando alguna empresa que nos permita desarrollar una IA para el asistente periodístico, con las premisas comentadas, y que ayude, asista y proponga al periodista, pero nunca le sustituya, dejándole la opción de utilizarlo o no, a su juicio.

 

Asistente periodístico

En concreto, lo que buscamos con el asistente periodístico lo visualizamos en las Figuras 2.6, 2.7 y 2.8. En la figura 2.6 vemos, a la izquierda, una pantalla del gestor de contenidos donde la redacción digital redacta las noticias del informativo. A la derecha se listan las acciones relacionadas con el asistente y la IA: año 2023/2024 en donde se centra el ámbito temporal del desarrollo del asistente, integración completa para que sea transparente para la redacción dentro de su flujo de trabajo, obtención automática del resumen, la sinopsis y la entradilla de la noticia, el NER, con el reconocimiento de entidades que también se etiquetan, el etiquetaje SEO y temático con las palabras clave para posicionar mejor en los buscadores y finalmente que se ofrezcan contenidos de otras noticias relacionados con la actual que se encuentren en el sistema, por si al periodista le puede interesar para enriquecer la noticia.

 

 

La figura 2.7 es un ejemplo de la propuesta de contenido generativo: a la izquierda, la noticia real humana, escrita por la redacción, y a la derecha lo que se obtendría con la IA generativa: el título, la entradilla / sinopsis, el etiquetaje y las etiquetas NER. Con esta ayuda, el periodista se tiene que centrar en redactar el cuerpo de la noticia, sin perder el tiempo en preparar todo lo que le genera el asistente con la IA.

 

 

Donde se ve más claramente el valor añadido que va a suponer el asistente periodístico, es en el etiquetaje. En la figura 2.7 el redactor, debajo de la redacción de la noticia, ha colocado dos etiquetas: migraciones e Italia, que son las únicas que ahora se encuentran en el archivo para búsquedas posteriores. El asistente va a obtener y proponer muchas más etiquetas, temáticas y NER, dando mucha más accesibilidad a esta noticia para futuros usos en la redacción en la búsqueda en el archivo.

En la figura 2.8 podemos observar otro potencial de la IA generativa. Es la posibilidad que va a tener la redacción de pedir al asistente que proponga diferentes títulos de la noticia. Puede ofrecer un título neutro, sería el titular “por defecto” con la ventaja de disponer de un modelo propio con nuestra guía de estilo. También se le podrá pedir que ofrezca un título SEO para mejorar el posicionamiento o para móvil, etc.

 

 

Esperamos que antes de que termine 2024 dispongamos de un asistente periodístico propio para ofrecer a la redacción de informativos, deportes y programas.

 

Motor de recomendaciones

Hace unos cinco años lanzamos un sistema de recomendación de contenidos (figura 2.9), que se enmarca más en el concepto de Big Data que de IA, pero sí se pusieron algunos algoritmos relacionados con el aprendizaje automático para mejorar las recomendaciones que se ofrecen a cada persona.

3Cat recomienda a personas registradas. El acceso a los contenidos 3Cat es gratuito y universal, pero en caso de que alguien quiera registrarse, puede disponer de esta funcionalidad de personalización y recomendación, entre otras muchas que mejoran la experiencia de usuario.

Se hacen recomendaciones de vídeos concretos que pueden ser de un programa (un capítulo concreto) o un documental, película, etc. Hay dos conceptos incluidos en este sistema de recomendaciones, el descubrimiento y el ver en continuidad.

 

 

Texto a voz

El otro importante proyecto que queremos culminar en 2024 en relación con la IA generativa es el de Texto a Voz.

Pretendemos disponer de una voz sintética nuestra, identitaria, corporativa. Ahora estamos trabajando con voces sintéticas comerciales, con soluciones de Amazon Polly y Microsoft Azure, para disponer de una voz sintética capaz de pronunciar correctamente el catalán, con la intención de hacer más accesibles nuestros productos de texto. Por ejemplo, en la imagen de la noticia que hemos visto antes, podría haber un icono de altavoz, que al actuarlo hiciera la lectura, reproduciendo el título, la entradilla resumen y el cuerpo de la noticia, para facilitar la información a las personas con dificultad de lectura o que no pueden leer en ese momento y puedan conocer la noticia por voz.

Aunque todavía no está tomada la decisión final, de momento, estamos utilizando la solución de Amazon Polly. Pasamos un texto de una noticia y escuchamos cómo nos la devuelve con la voz. Están participando el departamento de lingüistas y el área de accesibilidad. Se trabajan diferentes voces y se analiza en cada voz, siguiendo unos criterios, cómo de cercana está de la voz humana y si suena bien al oído.

La idea final es disponer de una voz sintética propia, en versiones masculina, femenina e infantil, si es posible y que, dependiendo del contexto de lo que se tenga que narrar, se use una u otra.

 

Otros usos de la IA

La política de la corporación es no prohibir el uso de las aplicaciones de IA, sino potenciar su utilización de forma responsable. Tenemos un inventario de las aplicaciones y su uso, y vamos abordando los retos que cada una de ellas nos plantea a través de la Comisión ética para el uso de la IA.

En el departamento de ingeniería, a nivel técnico, hay personas que usan ChatGPT para resolver dudas o resolver cuestiones de programación. Otros departamentos también usan ChatGPT como asistente para cuestiones o situaciones diarias donde necesitas más información sobre un tema, por ejemplo.

También se usan otras herramientas de generación de imágenes como Dall-E o Midjourney en algunos departamentos como el de promo o diseño o incluso en el departamento técnico. Este último las utiliza para poner imágenes de apoyo en presentaciones; en lugar de hacerlo como antes e ir a internet y buscar imágenes, que en general tienen derechos, ahora, se le pide la imagen a Dall-E y se usa libremente. Por ejemplo, las imágenes de la figura 2.10 han sido generadas por Dall-E. Es un procedimiento muy eficaz. Para lo mismo, sirven otras aplicaciones de IA generativa con Midjourney, Stable Difussion o Runwayml, que se utiliza en el departamento de postproducción.

Otra aplicación de IA generativa es Copilot. Es un asistente de programación para los técnicos. En la propia herramienta que se utiliza para programar, el programador puede hablar con Copilot y pedirle, por ejemplo, que haga una tabla que contenga todos los meses del año, que sea numérica y que en cada mes incluya algo concreto. Se le pregunta en lenguaje natural, como un comentario dentro del texto y el asistente genera el lenguaje de programación, en el que te apoyas para teclear más rápido. Así se aumenta la productividad de los programadores.

Hemos hecho pruebas de concepto desde el área de ingeniería con Tabnine dentro de nuestros entornos de programación para facilitar la tarea a los programadores. También hemos probado con Github Copilot, que es muy potente. Se dedica a rastrear toda tu fuente de código y es capaz de proponerte líneas basándose en el estilo de programación que has utilizado en tu base. Es como tener a un programador entrenado en tu organización, al que has entrenado con tu código, no con uno desconocido, con lo que puedes tener controlado el perímetro de actuación y así no hay fugas.

Hay otra aplicación muy nueva que se llama Happy Scribe. La quieren utilizar desde el departamento de digital, para su uso en piezas de vídeo cortas en las que hay audio con mucho ruido de fondo y es difícil discriminar la voz de una persona. Happy Scribe te permite tener el subtitulado de lo que está diciendo la primera persona, aunque haya música o ruido de fondo, y puede hacer creatividades con las letras del subtítulo, haciéndolas más dinámicas.

El interés por la implantación del uso de la IA va creciendo en todos los departamentos de la corporación. Por ejemplo, en recursos humanos quieren utilizarlo cuanto antes para los procesos de selección.

 

Incidencia laboral

Conscientes de la responsabilidad que conlleva ser un medio de comunicación público, el Consejo de Informativos, por ejemplo, se plantea cómo va a afectar la implantación de la IA en el futuro profesional y la estabilidad de los periodistas. La incorporación de herramientas de soporte basadas en IA les ha hecho ver que, por el contrario, la IA va a permitir que los periodistas puedan dedicarse más intensamente a su trabajo de redacción, al dedicar la IA a las tareas menores no creativas.

 

Informaciones falsas

Por último, están las posibles informaciones falsas (fake news) generadas por la IA, tanto en contenido textual, como en el audio y el vídeo que ofrecen. En la corporación se insiste en que siempre hay que validar los contenidos antes de publicarlos, incluso varias veces; siempre tiene que haber una vertiente humana, al final. Las noticias que vienen de las agencias externas, sobre todo extranjeras, ya vienen validadas por sus propias organizaciones, por lo que debemos poner la atención en los contenidos generados por la corporación, sobre todo en las imágenes generadas por la AI.

La posición de la corporación ha sido, a través de la comisión de la IA responsable, informar y formar a toda la organización, incluso con la publicación de notas en el portal interno, de cómo se tienen que interpretar y revisar los contenidos que entran. Respecto a los contendidos que salen, hay dos posturas en la comisión; una aboga por firmarlo todo con el aviso de que “este contenido ha sido generado con IA” y la otra propone que en algunas ocasiones no se avise, previa la validación humana del contenido.

 

RTVA-CSRTV

Con la participación de Pedro Espina Martínez, Director Técnico de la Agencia Pública Empresarial de la Radio y Televisión de Andalucía (RTVA).

 

En el año 2022 se comienza la implantación del servicio de plataforma digital integrada de edición, emisión y archivo contratado por Canal Sur Radio y Televisión, S.A. a Telefónica Soluciones de Informá-tica y Comunicaciones de España, S.A.

Como parte de esta, se incluye un gestor documental de Etiqmedia que permite el análisis de la media y su posterior catalogación automática mediante herramientas de inteligencia artificial (IA). También permite el reconocimiento automático del habla para obtener una transcripción completa del audio a texto con alta tasa de acierto; la segmentación del audio de diferentes hablantes, la segmentación de voz, silencio, música y voz más música; la segmentación y catalogación del vídeo en planos y escenas; la detección y reconocimiento de caras y objetos en imágenes, etc. Esta herramienta se utiliza en el departamento de archivo y documentación. Se muestran imágenes de la aplicación en las figuras 3.1 y 3.2.

En 2023 se comienzan a utilizar otras herramientas de IA como soporte a las labores de gestión documental, como la producción de borradores iniciales o la elaboración de resúmenes utilizando ChapGPT, Humata o Perplexity. Se trata de herramientas desarrolladas por empresas externas, en este caso, utilizadas en la dirección técnica y que todavía no han comenzado a integrarse en aplicaciones propias, haciéndose un uso manual por personal de la dirección técnica. Las herramientas se utilizan por personal cualificado, ingenieros fundamentalmente, y se aplican en la propia dirección técnica y en el archivo.

Empresarialmente, dado que el uso es todavía reciente e incipiente, no se ha observado gran impacto en la organización, más allá de una mejora en la productividad. La implantación de dichas herramientas vino acompañada de una formación en su uso y en una metodología de productividad adecuada.

RTVA y CSRTV están comprometidos con la lucha contra la desinformación, sea a través de fake news o de deep fakes, dada la labor de servicio público que tiene encomendada. Se trata de un problema reciente, complejo y de importancia e impacto creciente; por un lado, requiere de regulación, cuestión sobre la que ya se ocupa la Unión Europea, y por otro lado requiere de investigación y desarrollo tecnológico para facilitar la identificación de los contenidos generados por IA que pretendan confundir a la audiencia. Además, se requiere concienciación ciudadana sobre el problema y sus riesgos, labor con la que se compromete RTVA/CSTV conforme recoge el apartado 13 del artículo 13 de la Carta de Servicio Público de la RTVA para el sexenio 2024-2029, publicada en el BOJA nº 247, el pasado 28 de diciembre de 2023.

También se incluye en el artículo 20 de la citada carta el compromiso de los medios de Canal Sur con la divulgación de las actividades económicas, productivas y de innovación sobre inteligencia artificial.

Por su parte, el apartado 3 del artículo 4 de la carta recoge el compromiso de la utilización de nuevas tecnologías digitales y nuevas funcionalidades emergentes, como las de IA, adaptadas a la producción, explotación y gestión empresarial de los servicios audiovisuales con responsabilidad y compromiso ético, con fines de no reemplazo y con objeto de incrementar la eficiencia y eficacia en la prestación de los servicios para optimizar el rendimiento de sus actividades y actuaciones prestacionales.

El apartado 5 del artículo 7 de la carta recoge el compromiso de potenciar la utilización de soluciones tecnológicas de IA, realidad virtual, extendida y aumentada, así como la oferta de servicios de “televisión conectada”.

Estos compromisos se recogen también en el contrato-programa suscrito entre el Consejo de Gobierno de la Junta de Andalucía y la RTVA para el período 2024-2026, como desarrollo inicial de la carta. Dicho contrato-programa se publicó en el BOJA nº 245 el 26 de diciembre de 2023, recogiendo su cláusula tercera dichos compromisos, contando con una unidad propia e interna denominada “Canal Sur Comprueba”.

 

Castilla La Mancha Media

Con la participación de Jesús Sánchez Villalba, Director Técnico de Castilla La Mancha Media.

 

Nuestro trabajo en relación a las aplicaciones de inteligencia artificial es en este momento muy escaso, en concreto solo estamos utilizando estas herramientas en grafismo y en la radio.

No es que en CMM no creamos que el trabajo y la colaboración con las herramientas IA no es un tema interesante; estamos seguros de que a medio plazo estas herramientas serán parte importante de los procesos de producción. El problema que tenemos en CMM es que los recursos técnicos y humanos son relativamente escasos y no son suficientes para investigar.

Estamos trabajando en dos áreas con herramientas IA. Por un lado, trabajamos en grafismo en la generación de algunos fondos elaborados con varias aplicaciones de IA; por ejemplo, el año pasado produjimos un cuento de Navidad en un teatro de la ciudad de Toledo y la escenografía de esta representación se realizó con aplicaciones IA.

La imagen siguiente (figura 4) se ha creado con IA, utilizando las aplicaciones típicas Dall-E, Adobe Sensei y Fronty.

La otra utilidad que le estamos dando a la inteligencia artificial es el uso de aplicaciones de texto a voz, empleadas en la radio para hacer podcast y simular la voz. La aplicación de texto a voz que estamos utilizando es Lovo.

De momento no tenemos más experiencias con la IA, esperamos este año poder disponer de recursos, sobre todo humanos, para poder ensayar y generar nuevos contenidos, aprovechando estas nuevas aplicaciones.

 

 

Grup Mediapro impuls
Vizrt lanza Viz Virt