sábado, 15 de diciembre de 2007

Hacia una indexación automática del contenido visual



La enorme extensión social de la fotografía digital y la sobreabundancia de fotografías, está promoviendo la aparición de grandes avances en el software destinado al tratamiento de la imagen. Se han realizado investigaciones sobre indexación automática muy interesantes y los progresos en los programas de reconocimiento de formas y colores son increíbles.
La historia de este tipo de aplicaciones empezaría en 1957 cuando Frank Rosenblat inició el desarrollo de Perceptrón, un modelo de red neuronal que podía reconocer patrones gráficos. En 1986 Robert Hecht-Nielsen lleva adelante el sistema Counter-propagation que estaba especializada en la comprensión de imágenes y en 1989 Kunihito Fukusima crea el sistema Neocognitrón. En los 90 aparece el sistema Quality Plus, creado por la empresa HNC, destinado al ámbito de la inspección de calidad de productos basada en la imagen. Ya en el 2002, Jesús Robledano nos anunciaba la existencia de un programa informático denominado RetrievalWare Image Server, elaborado por Excalibur Technologies, que usando técnicas de redes neuronales era capaz de indexar y recuperar imágenes mediante colores, figuras y texturas (1)



Actualmente nos encontramos que Google, el buscador más usado y popular de Internet, nos ofrece la posibilidad de buscar imágenes a través de su interficie de búsqueda básica. Si realizamos una consulta Google nos da una serie de resultados en función del nombre del fichero y la relevancia de la palabra clave en el documento virtual. Últimamente, sin embargo, parece que Google con el objetivo de mejorar la pertinencia en la recuperación está explorando otros ámbitos más interesantes. En este sentido, Google se plantea la adquisición de Riya , una empresa que ha creado un software experimental capaz de identificar formas geométricas, tonos e incluso rostros de personas . La versión beta de Riya es accesible y permite subir tus fotos personales. Si, por ejemplo, introducimos una imagen con la cara de un familiar determinado y catalogamos dicha fotografía con el nombre del pariente, todas las imágenes que colguemos posteriormente se catalogarán automáticamente y cuando realizemos búsquedas por el nombre de nuestro familiar la base de datos nos ofrecerá todas aquellas instantáneas donde aparezca el rostro del conocido. Evidentemente Riya tiene márgenes de error importantes y aún deberemos esperar para que dicho software sea eficaz al 100%. De todas formas, parece que se están dando pasos que nos aproximan cada vez más a la indexación automática del contenido de las imágenes.

En el ámbito de la información audiovisual, Lorenzo Vilches ya planteaba en el 2001 la necesidad de que la investigación caminase hacia la configuración de bases de datos inteligentes, que tuvieran detrás sistemas de indexación automáticos capaces de registrar grandes cantidades de información. Concretamente, el autor mencionado afirmaba que dicha investigación tiene como objetivos un sistema de indexación basado en la duración del plano visual de la escena como unidad de segmentación, el establecimiento de un sistema de identificación automática de elementos espaciales, temporales y actoriales de una secuencia informativa audiovisual, el establecimiento de códigos automáticos de indexación en soportes digitales en el momento de la emisión de la información y de la post-producción publicitaria, la creación de un sistema de reconocimiento facial para identificación de profesionales de la información televisiva y de personajes de la noticia, y en general, de todos los actantes de un espot publicitario, la creación de un sistema de identificación de los espacios de la información y escenarios de la publicidad y la creación de un sistema de reconocimiento de los diversos parámetros temporales utilizados en la producción y la emisión (2). Esto se planteaba en el 2001 y la idea fundamental era el aprovechamiento de las tecnologías avanzadas de la información para mejorar los sistemas de recuperación en los archivos de imágenes (en este caso audiovisuales) en todos sus sentidos.
En todo caso, es importante señalar que todavía son sistemas muy restringidos, debido a la complejidad que significa la extracción de temáticas en imágenes que presenten un alto grado de abstracción.

(1) Para realizar esta breve historia de los sistemas automáticos viuales hemos usado la obra: Jesús Robledano Arillo. El tratamiento documental de la fotografía de prensa: sistemas de análisis y recuperación. Madrid: Archiviana, 2002, p. 146.
(2) Lorenzo Vilches. Anàlisi: Quaderns de comunicació i cultura. Núm. 27, 2001 , p. 142-143