the edge of chaos

lunes, abril 07, 2008

El Futuro de la Web: Búsqueda multimedia

Sin duda, hacer un blog en vivo es mucho más difícil de lo que pensaba, y tuve que abandonar la idea si no quería acabar con un buen dolor de cabeza. Ahora, un par de días después voy a tratar de seleccionar lo más interesante de lo visto en el workshop.

Ha sido uno de los temas centrales ya que se han presentado proyectos europeos dentro de CHORUS, entre ellos SEMEDIA (Yahoo), RUSHES (tid), MESH (tid), SAPIR , VITALAS, AIM@SHAPE, TRIPOD y PHAROS. Los diferentes proyectos cubren los temas centrales de la búsqueda multimedia y de la producción de contenidos multimedia tanto para profesionales como para usuarios. SEMEDIA, al menos la parte de Yahoo se centra en Flickr donde están haciendo cosas como las de abajo. De algunas de ellas pudimos ver demos:
  • Minería de uso: las imágenes de Flickr tienen el mayor número de visitas en las primeras 48 horas después de su publicación
  • Minería de etiquetas: asocian categorías semánticas de Wordnet a las etiquetas de Flickr y tratan de mejorar el uso de las nubes de etiquetas (Roelof van Zwol) .
  • Modelos de recuperación que permitan usar las anotaciones del contenido generado por usuarios, buscando asociaciones entre etiquetas (Vanessa Murdock).
Casi todos los proyectos se centraban en temas de anotación de contenido (anotación del usuario, uso de metadatos de cámaras, geolocalización del contenido) y en como usar ese contenido e incluso razonar con él. Algunos como AIM@SHAPE iban más allá, hasta el uso de la anotación para la generación de escenas 3D.
Respecto al consumo de información multimedia me llamó la atención el proyecto de resumen automático de video dentro de MESH. Relacionado con el resumen de video está AV-RSS, una propuesta para facilitar la distribución de video dentro de los formatos de sindicación y que permita hacer una visualización previa semejante (en espíritu) a lo que se pretende en Vid2RSS.
Por último, SAPIR se centró en los problemas de escalabilidad para la multimedia. De la charla de Pavel Zelula me pareció muy interesante una transparencia que relacionaba resultados y arquitectura de escalabilidad que trataré de recuperar. Además, descubrí que ha desarrollado una librería de similitudes métricas MESSIF.

viernes, abril 04, 2008

El futuro de la web

Por primera vez en la historia de este blog vamos a empezar a escribir en directo, desde Soldeu, en Andorra. ¡acaba de empezar FoWS'o8 (Future of Web Search)!. Se trata de un workshop organizado por Yahoo! Research Barcelona que se encuentra en su tercera edición. Este año la mayor parte de las charlas van a tratar temas de búsqueda en contenido multimedia y el resto se centraran en temas especializados de búsqueda como el uso de anotaciones semánticas, la búsqueda de respuestas y la búsqueda desde moviles.

La primera charla de la mañana la está impartiendo Wessel Kraaij que después de introducir las principales diferencias entre la búsqueda de información textual y la búsqueda en contenido multimedia. Ha pasado ha hacer un repaso de los principales motores de búsqueda multimedia (You Tube, Yahoo Video, Blinkx , Dabble... ) y otros servicios relacionados como bibliotecas digitales y servicios de recomendación. Después ha pasado a introducir los diferentes tareas que se han planteado en el contexto de TRECVID y de los retos que plantea realizar una evaluación realista. Entiendo que en parte los problemas van en dos sentidos, por un lado el uso de colecciones realistas y por el otro el hecho de que la anotación de videos es costosa, por lo que ha comentado algunas soluciones en el contexto de la Web 2.0, como el uso de juegos de anotación como ESP.

La segunda charla corre por parte de Julien Law-To de Exalead que ha presentado las herramientas de búsqueda de la compañía que incluyen 6 idiomas y donde están integrando reconocimiento de voz y transcripciones para buscar en video.

Y ahora acaba de empezar la charla de Jan-Erik Solem que es el fundador de Polar Rose, una startup sueca de búsqueda de imágenes que aún se encuentra en beta privada. La compañía se centra en la Búsqueda de Personas pero sobre imágenes. Usa tecnología de reconocimiento facial para centrarse en las caras y reconocer a las personas junto con etiquetado por parte de los usuarios. Además parece que están trabajando en extender la búsqueda de imágenes a algo más temático usando una especie de diccionario de subimagenes creado a partir de clusters. En cualquier caso, el servicio que ahora ofrecen parece interesante, por ejemplo en la web se pueden buscar fotos y hay una ordenación cronológica que, por ejemplo, puede ser útil en servicios como la listawip.