01 diciembre 2014

Nuevo software de reconocimiento de imágenes que mejora mucho las búsquedas en Internet


Investigadores crearon un programa de inteligencia artificial que usa fotos para localizar documentos en Internet con una precisión mucho más grande que la lograda hasta ahora por cualquier otro sistema comparable.

El nuevo sistema, que fue probado sobre fotos y está ahora siendo aplicado a videos, muestra por primera vez que un algoritmo de aprendizaje automático para el reconocimiento de imágenes y la búsqueda de información relacionada es lo bastante preciso y eficiente como para mejorar de modo notable las búsquedas online de documentos a gran escala. El sistema usa datos de píxeles en imágenes, y potencialmente en video, en vez de solo texto, para localizar documentos. Aprende a reconocer los píxeles asociados con una frase de búsqueda mediante el estudio de los resultados de motores de búsqueda de imágenes basados en texto. El conocimiento obtenido de estos resultados puede ser entonces aplicado a otras fotos sin etiquetas o descripciones, produciendo resultados de búsqueda de documentos más precisos.

Sergio Rodríguez Vaamonde de Tecnalia, en Zamudio, Bizkaia, País Vasco, España, Lorenzo Torresani, del Dartmouth College en Hanover, New Hampshire, Estados Unidos, y Andrew Fitzgibbon, de Microsoft Research Cambridge en el Reino Unido, diseñaron y probaron este sistema que extrae información semántica de los píxeles de las fotos en las páginas Web. Esta información se utiliza para enriquecer la descripción de la página HTML usada por los motores de búsqueda para la obtención de documentos.

Los investigadores probaron su metodología usando más de 600 solicitudes de búsqueda en una base de datos de 50 millones de páginas web. Seleccionaron el motor de búsqueda para obtención de texto con el mejor rendimiento y lo modificaron para que hiciera uso de la información semántica adicional extraída por su método a partir de las imágenes de las páginas web. Constataron que esto producía una mejora del 30 por ciento en la precisión, en comparación con el motor de búsqueda original basado exclusivamente en texto.

No hay comentarios:

Publicar un comentario