Gestión de archivo documental y audiovisual en Canarias, ¿qué aporta el Machine Learning?

Total menciones: comparativa de impacto Alcaldes de Fuerteventura, últimos 7 días entre el 19 Marzo 2020 y 25 Marzo 2020
26 marzo, 2020
Comunicación corporativa en Canarias: científicos de datos y big data para gabinetes de prensa alimentados por IA
8 junio, 2020
Mostrar todo

Gestión de archivo documental y audiovisual en Canarias, ¿qué aporta el Machine Learning?

53 Millones

Se han logrado avances notables en los últimos años en machine learning o aprendizaje automático. Hablando en términos generales, el aprendizaje automático utiliza colecciones de ejemplos para entrenar software con el objetivo de reconocer patrones y actuar de acuerdo con ese reconocimiento.

Muchos de los avances pronosticados más célebres combinan el aprendizaje automático con diversas formas de robótica y «visión por computadora» (realmente, una amplia gama de imágenes y otros sensores ambientales), especialmente en aplicaciones como automóviles, camiones, barcos, drones autónomos o dispositivos militares.

Existen tres impulsores para la introducción del aprendizaje automático: reducir los costos al eliminar a los humanos (vehículos autónomos), superar las capacidades humanas (juegos) o hacer cosas que no se pueden lograr hoy en la escala deseada con costos aceptables (vigilancia ubicua).

Algunas aplicaciones donde el aprendizaje automático ha llevado a avances que son muy relevantes como la traducción de un idioma a otro; transcripción de texto impreso o escrito a mano a representación de computadora (a veces llamado reconocimiento óptico de caracteres) o la conversión de palabras habladas a texto.

Igualmente notable ha sido el avance en la clasificación de imágenes por su contenido (por ejemplo, encontrar imágenes que contienen perros o enumerar todos los objetos que el software puede reconocer dentro de una imagen); y, como un caso especial específico e importante de identificación de imágenes, reconocimiento facial humano. Todos ellos son aspectos clave de cara a la gestión de archivos documentales y audiovisuales.

El caso del contenido de los medios audiovisuales

Para el contenido de los medios audiovisuales es crucial traducir imágenes sonidos en movimiento en palabras de una manera eficiente y rentable. Se está desarrollando métodos automáticos basados en el lenguaje para gestionar, acceder y publicar contenido digital preexistente y producido originalmente en las industrias creativas.

Uno de los objetivos de la empresa canaria MMI Analytics es poder explorar y explotar sus archivos audiovisuales, dado que es la empresa pionera en Canarias desde 1992, y cuenta con un archivo digital que data de 2002. Ante la falta de metadatos en el contenido, se ha creado un equipo de desarrollo en los últimos seis meses que utiliza tecnologías de inteligencia artificial (IA) para realizar la extracción automática de metadatos para lograr este objetivo.

Hay tres áreas de trabajo de especial importancia en la labor de esta empresa, que pretende extender a otras organizaciones y empresas en Canarias que gestionan este tipo de bancos documentales:

1) El reconocimiento facial: para realizar el reconocimiento facial, los documentalistas crearon una base de datos de figuras públicas. Los resultados del reconocimiento facial están integrados en el sistema de gestión de activos digitales. Esta extracción automática de metadatos ayuda a los documentalistas durante el proceso de indexación y hace que los usuarios finales puedan buscar datos en la interfaz de búsqueda.

2) La búsqueda visual: permite buscar caras, puntos de referencia u objetos similares a partir de una imagen o imagen determinada. Permite una exploración y explotación poderosas del contenido audiovisual al encontrar imágenes similares no descritas o encontrar imágenes con problemas de derechos.

3) Clasificación automática del contenido mediante clasificadores personalizados, que pueden entrenarse con objetos o características de puntos de referencia. La primera implementación la llevan a cabo los documentalistas que están creando un clasificador deportivo, para clasificar e indexar automáticamente las colecciones deportivas antiguas para las que no hay metadatos disponibles.

Se planean varios usos nuevos, como la trazabilidad del uso de archivos y la identificación del hablante. Lo que esta empresa ha aprendido es que las tecnologías de IA realmente pueden ayudar en el objetivo de abrir los archivos extrayendo metadatos automáticamente, enriqueciendo archivos heredados y dando visibilidad al contenido de archivo.

El uso de herramientas de código abierto abre también posibilidades de colaboración con otras organizaciones como son archivos de programación (emisoras de televisión o radio), museos audiovisuales y archivos audiovisuales nacionales o regionales, archivos académicos y universitarios, archivos temáticos y especializados -que tienen un alto grado de especialización (tema, localidad, periódico cronológico, tipo de película, formato de video o audio, grupos culturales, disciplinas académicas o áreas de investigación)- y grandes colecciones.