Tres formas de acelerar la producción y entrega de contenido usando IA

Las soluciones de inteligencia artificial en la nube y aprendizaje automático (ML) continúan transformando y acelerando prácticamente todos los aspectos de la creación y distribución de contenido. A medida que estas tecnologías crecen en fuerza y ​​sofisticación, brindan un nuevo nivel de precisión, eficiencia, cumplimiento y ahorro de costos para las operaciones de transmisión.

En pocas palabras, las soluciones de inteligencia artificial utilizan tecnología informática para descubrir, extraer o generar metadatos, o datos que proporcionan información sobre otros datos. Con el tiempo, la tecnología de aprendizaje automático aprende automáticamente sobre el contenido de los metadatos y lo que representan.

De acuerdo a Al automatizar el proceso de adquisición de metadatos para grandes volúmenes de contenido, estas tecnologías reemplazan los exigentes procesos manuales y ahorran a las organizaciones de medios incontables horas de trabajo manual. Los operadores pueden usar herramientas de IA y ML para tomar mejores decisiones, flujos de trabajo de transmisión más rápidos y eficientes en cada etapa del proceso de contenido, desde la adquisición y contribución hasta la postproducción, distribución, cumplimiento y verificación. (Consulte la Figura 1 a continuación).

Flujo de trabajo de Digital Nirvana

En este artículo, analizaremos más de cerca los casos de uso principales de las tecnologías de IA y ML en las industrias de medios y entretenimiento, junto con ejemplos de aplicaciones reales de estas tecnologías en grandes empresas de medios.

Caso 1: Nuevas eficiencias efectivas en la adquisición y contribución de contenido

En una operación de medios típica que produce contenido para servicios de transmisión o transmisión, la fase de adquisición de contenido puede ser un obstáculo importante, a menudo ralentizado por el gran volumen de contenido sin procesar que proviene de diversas fuentes para recopilar mensajes en el campo. Luego, depende del equipo de producción verificar manualmente el contenido y seleccionar las piezas de audio y los segmentos necesarios para una historia específica.

Hasta ahora, ha sido un proceso en gran parte manual que requería un valioso tiempo del personal de producción para verificar el contenido e identificar segmentos valiosos, junto con tomas etiquetadas con sello de tiempo para un uso posterior más fácil.

Las relaciones de escaneo de 10: 1, 20: 1 o más son comunes en el mundo actual de la producción de medios. ¡Un programa de una hora con una relación de escaneo de 10: 1 genera fácilmente 600 minutos de contenido sin procesar! Es fácil ver por qué los métodos manuales obsoletos de recepción y procesamiento de activos son simplemente insostenibles en las operaciones de medios aceleradas y controladas en el tiempo de hoy.

Ejemplo del mundo real: proporcione búsqueda de contenido instantánea mediante códigos de tiempo y metadatos

Esta operación de medios es el sitio de entretenimiento en línea líder en los Estados Unidos, conocido por su formato de contenido corto enfocado en Hollywood. La velocidad y la eficiencia son extremadamente importantes para esta empresa, ya que se ha ganado una reputación como fuente de información sobre Hollywood y las celebridades.

La empresa adoptó recientemente un sofisticado proceso de conversión de texto a voz (STT) en la nube para optimizar la generación de subtítulos y acelerar la producción de contenido terminado.

Si bien los subtítulos son la aplicación principal de la empresa para STT, los productores han visto una oportunidad atractiva para aplicar tecnología para mejorar el proceso de adopción de contenido. Gran parte de la operación de video sin procesar entrante no está escrita, entrevistas en gran formato con poco contexto o conocimiento actual del material. En lugar de desplegar personal para verificar y registrar el contenido manualmente, la operación ahora decide ejecutarlo a través del mismo proceso STT. Esta tecnología de IA genera casi instantáneamente una transcripción altamente precisa de todas las palabras habladas en el video, junto con metadatos y líneas de tiempo. Al editar un video para una historia, los productores pueden buscar la transcripción para encontrar rápidamente el contenido relevante necesario para el trabajo terminado.

Caso de uso 2: tiempo de afeitado fuera de la posproducción

Los subtítulos automatizados son otra aplicación de procesamiento de IA poderosa y cada vez más común que aprovecha el poder y la flexibilidad de la tecnología de nube STT. Con las nuevas plataformas OTT que ingresan al mercado a una velocidad vertiginosa, el requisito fundamental es la capacidad de generar subtítulos compatibles que cumplan con las pautas de estilo únicas de cada plataforma de entrega. Los subtítulos cerrados están sujetos a reglas específicas dictadas por la plataforma de transmisión y sus grupos objetivo y áreas geográficas.

Al incorporar el proceso de subtítulos en sus operaciones existentes, la producción de medios puede reducir los costos y aumentar la productividad de los equipos internos de postproducción en un orden de magnitud. No es raro ver una mejora de la eficiencia del 40% o más en comparación con los métodos de subtitulado convencionales. Debido a que las tecnologías STT actuales se han entrenado en miles de millones de palabras y miles de horas de datos que representan una amplia gama de idiomas, dialectos y acentos, los motores STT generan transcripciones y subtítulos que son notablemente precisos. Las funciones de detección y corrección ortográfica de los oradores aumentan la precisión y reducen aún más el tiempo necesario para los ajustes y correcciones manuales posteriores. Además, las funciones de traducción le permiten localizar rápidamente subtítulos y subtítulos para otras áreas y plataformas de entrega.

En un flujo de trabajo típico, el STT crea una transcripción indexada en el tiempo que se puede mostrar junto con los medios, junto con herramientas para editar texto y agregar pistas visuales, etiquetas de música y etiquetas de orador. A medida que el operador acelera el proceso de edición de texto, la transcripción corregida se convierte automáticamente en subtítulos sincronizados en el tiempo de acuerdo con los parámetros definidos en el preajuste definido por el usuario. El archivo de subtítulos revisado y finalizado se puede exportar a varios formatos estándar de la industria, cada uno de acuerdo con pautas de estilo específicas para cada plataforma de entrega.

Ejemplo del mundo real: entrega de subtítulos compatibles en múltiples plataformas OTT

La misma fuente popular de noticias en línea descrita anteriormente necesitaba ofrecer contenido de alto valor adaptado a estándares específicos y pautas de estilo multiplataforma OTT, incluidas transcripciones multilingües y subtítulos cerrados precisos y con el formato adecuado. Además, la empresa necesitaba mantener una rotación de entrega muy ajustada, no más de 90 minutos desde el momento de la adquisición hasta que se publica el contenido.

Gracias a la tecnología en la nube de STT, este proveedor de contenido puede permanecer en la ventana de entrega y sobrescribir automáticamente el contenido con una precisión del 90% o más. Con acceso a herramientas en la ventana de edición de transcripciones, como el reproductor multimedia integrado con video sincronizado con texto, los operadores pueden editar texto rápida y fácilmente. Cuando la aplicación se completa, exporta la salida STT completa a través de la integración de API en un entorno MAM de terceros como un archivo adicional. El archivo STT actúa como una rica fuente de metadatos e informa a los productores y editores de la plataforma OTT dónde encontrar el contenido de mayor valor en el menor tiempo posible.

Además, el proveedor de contenido puede cumplir con los requisitos de varias plataformas OTT para la entrega de transcripciones y subtítulos en varios idiomas. En cuestión de segundos, el módulo STT puede traducir subtítulos a un idioma secundario y mostrar la versión traducida en una ventana de edición separada para su revisión y corrección. La empresa también puede importar archivos de subtítulos existentes de contenido antiguo para su traducción y distribución multilingüe, y mantener los códigos de tiempo de control originales sincronizados con el contenido de origen para facilitar la edición.

Caso de uso n. ° 3: garantizar la calidad del contenido, el cumplimiento técnico y una experiencia de usuario óptima en el momento de la entrega

El flujo de trabajo de transcripción / subtitulado basado en inteligencia artificial está estrechamente relacionado con el monitoreo y el registro de cumplimiento basado en metadatos, que graba de forma nativa video en vivo, audio y todos los metadatos asociados desde cualquier lugar de la cadena de producción. Al capturar todo el contenido de transmisión y OTT, junto con todos los subtítulos y subtítulos en diferentes formatos y en varios idiomas, este sistema verifica la presencia y precisión de los metadatos necesarios en el punto de distribución. El contenido grabado y archivado proporciona una rica fuente de información para la colaboración y evaluación en toda la organización. Las capacidades en la nube de AI, como la transcripción STT y el reconocimiento de video, permiten a los operadores encontrar contenido rápidamente y beneficiarse de la información de los medios.

Ejemplo del mundo real: supervisión del cumplimiento en una red mundial de noticias las 24 horas

Esta red principal estaba buscando use subtítulos para generar transcripciones de programas de transmisión y hacer que estén disponibles para descargar en su sitio web. La red también quería habilitar la búsqueda de titulares para que sus equipos legales y de ingeniería pudieran encontrar rápidamente contenido de alto valor, generar clips y exportar activos para cumplir con los requisitos de la FCC y la ADA.

La solución de registro y monitoreo captura todos los metadatos asociados con el contenido de la red de transmisión, incluidos los datos de volumen, mensajes SCTE, DOLBY AC-3, registros de tráfico operacional y programado, marcas de agua audibles y datos de clasificación. La función de anotaciones permite a los usuarios generar anotaciones, etiquetas y frases que se indexan en el tiempo de acuerdo con el video grabado. Todos los metadatos, ya sean extraídos, calculados o importados, se indexan con precisión en el video. Esta integración entre los medios y los metadatos proporciona a los operadores una visión general perfecta de toda la transmisión y OTT.

Total

Si bien la generación de transcripciones y subtítulos basada en STT es uno de los ejemplos más utilizados de tecnologías de IA y ML, el cielo es un límite para la creación y distribución de contenido para estas aplicaciones. Además de STT, las compañías de medios están introduciendo microservicios en una nueva era, como clasificación de contenido, inteligencia de video, detección de anuncios y detección automática de logotipos, objetos, rostros y cambios de escena. Se pueden realizar oficinas editoriales, producciones de entretenimiento y deportes en vivo, oficinas de correos y otras operaciones de medios acelerar los procesos críticos, reducir los costos y mejorar la eficiencia. Estas características permiten un registro y comentarios inteligentes e instantáneos sobre la calidad y el cumplimiento del contenido, una mejor ubicación de las emisoras para cumplir con los requisitos reglamentarios, de cumplimiento y de licencia para el monitoreo de subtítulos, decencia y publicidad.

En última instancia, el éxito en el competitivo entorno de los medios de comunicación de hoy y de mañana radica en la capacidad de crear y entregar el contenido más compatible y de la más alta calidad en el menor tiempo posible. Las mejores herramientas de IA y ML son capaces de integrar, automatizar y organizar funciones críticas, como la generación de subtítulos, en el flujo de trabajo general de transmisión.

[This is a contributed article from Digital Nirvana. Streaming Media accepts vendor bylines based solely on their value to our readers.]

Cubiertas de transmisión

Habilite JavaScript para ver comentarios basados ​​en Disqus.

Artículos relacionados

Escalado basado en IA como clave para la entrega rentable de contenido 4K UHD

La resolución basada en súper IA puede brindar a los espectadores una experiencia de visualización UHD impresionante desde una fuente de 1K.

Estado del aprendizaje automático y la IA 2019

En eventos como la boda real y la Copa del Mundo, el aprendizaje automático y la inteligencia artificial pasan a primer plano.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *