the edge of chaos

jueves, septiembre 25, 2008

Evri en open beta

Image representing Evri as depicted in CrunchBaseImage via CrunchBase A través de AltSearchEngine leo que Evri, otro buscador semántico, ha pasado de beta privada a beta pública. El servicio de Evri permite realizar búsquedas de nombres propios para los que genera un grafo con entidades relacionadas que ayudan en la exploración del tema y en la navegación por los resultados. Para ello hace uso principalmente de reconocimiento y clasificación de nombres propios. Incluye también desambiguación de nombres, lo que permite elegir entre los diferentes conceptos asociados por ejemplo a "Raphael".

Además, Evri realiza extracción de relaciones entre diferentes entidades así como de "acciones" o verbos comunes asociados a la entidad de búsqueda. Usando esta información es posible restringir los resultados como en la búsqueda facetada.

Finalmente agrega informacion de la Wikipedia, videos e imágenes ademá de los resultados textuales. Especilamente la integración de Wikipedia recuerda a la de Powerset.

La búsqueda esta limitada a los nombres propios que se encuentran en el índice y aunque limitada, es dificil encontrar un tema relevante que no se encuentre representado. La clasificación de entidades es bastante precisa si bien a veces la granuralidad no es la más adecuada como en el caso de Yahoo.

Aunque el grafo de entidades es vistoso en una primera impresión, en mi opinión no cumple su objetivo de ayudar a la exploración cuando se usa más exhaustivamente, ya que está limitado a entidades demasiado evidentes. Sin embargo, si puede ser interesante como complemento o widget de blog, algo que ya ofrecen con la salida de la beta pública.

Por último, queda algo más que explorar el Evri Garden ( se apuntan a los labs, showroom, etc... ) que proporciona una interfaz mucho más compleja y no restringida a las entidades presentes en la ontología.

Os dejo unos links relacionados y patrocinados por Zemanta...
Reblog this post [with Zemanta]

Etiquetas: , ,

viernes, junio 20, 2008

Zervicios Zemánticos

An example of both Zotero and OpenURL referrer in action on a Wikipedia article that uses citation templates with embedded COinS tags. In this example, Zotero is displaying the references it can retrieve. The OpenURL referrer is responsible for the Find in a library links.Image via WikipediaRecientemente a traves de Twine he descubierto algunos nuevos servicios semánticos, de ellos los dos que más me han llamado la atención son curiosamente dos que empiezan por Z, Zotero y Zemanta.

El segundo de ellos lo estoy utilizando actualmente para escribir este post, simplemente para ver la utilidad del concepto. Sin embargo, parece que Zemanta no funciona aún como servicio multilingüe sino que lo hace solo para el inglés. Aún así ya me ha ahorrado unos minutos en localizar las URLs de los dos servicios y me ha descubierto que incluso Zotero ya tiene página en Wikipedia. También la imagen es sugerida por el servicio aunque la precisión y utilidad de las imágenes es menor. De todo ello lo menos útil de momento son los artículos relacionados. Al menos parece que el post esta quedando más vistoso, ¿o no?

Por otro lado, la primera de las aplicaciones Zotero, aún no la he puesto en uso pero parece que tiene todo lo bueno de JabRef y de Google Notebook juntos, así que habrá que darle una oportunidad. Mas en post futuros...






Zemanta Pixie

Etiquetas: , , ,

viernes, mayo 30, 2008

El santo grial de la búsqueda semántica

Reseño aquí un artículo de RWW sobre búsqueda semántica que repasa las estrategias de los principales jugadores en este plano como son Hakia, Powerset y Freebase así como Search Monkey, el nuevo servicio de Yahoo.

Como ya es típico, contraponen la búsqueda semántica a la búsqueda estadística de Google, si bien es conocido que bajo el "omnibuscador" se esconde también cierta búsqueda semántica como ejemplifica la consulta "What year was Leonardo da Vinci born?". Por cierto, es curioso pero es ¡la misma pregunta que acabo utilizando siempre en las clases de QA y cuando pruebo un nuevo servicio! A lo mejor, a estas alturas ha entrado entre los best-sellers de las queries...

Bromas aparte, lo más interesante del artículo son las consideraciones sobre las interfaces de búsqueda y navegación de los resultados de los buscadores semánticos. Sin duda hay está la chicha fuera del reducido mundo académico, en especial, si consideramos la limitada capacidad semántica de nuestros queridos buscadores semánticos.

Etiquetas: , , ,

lunes, abril 07, 2008

El Futuro de la Web: Búsqueda multimedia

Sin duda, hacer un blog en vivo es mucho más difícil de lo que pensaba, y tuve que abandonar la idea si no quería acabar con un buen dolor de cabeza. Ahora, un par de días después voy a tratar de seleccionar lo más interesante de lo visto en el workshop.

Ha sido uno de los temas centrales ya que se han presentado proyectos europeos dentro de CHORUS, entre ellos SEMEDIA (Yahoo), RUSHES (tid), MESH (tid), SAPIR , VITALAS, AIM@SHAPE, TRIPOD y PHAROS. Los diferentes proyectos cubren los temas centrales de la búsqueda multimedia y de la producción de contenidos multimedia tanto para profesionales como para usuarios. SEMEDIA, al menos la parte de Yahoo se centra en Flickr donde están haciendo cosas como las de abajo. De algunas de ellas pudimos ver demos:
  • Minería de uso: las imágenes de Flickr tienen el mayor número de visitas en las primeras 48 horas después de su publicación
  • Minería de etiquetas: asocian categorías semánticas de Wordnet a las etiquetas de Flickr y tratan de mejorar el uso de las nubes de etiquetas (Roelof van Zwol) .
  • Modelos de recuperación que permitan usar las anotaciones del contenido generado por usuarios, buscando asociaciones entre etiquetas (Vanessa Murdock).
Casi todos los proyectos se centraban en temas de anotación de contenido (anotación del usuario, uso de metadatos de cámaras, geolocalización del contenido) y en como usar ese contenido e incluso razonar con él. Algunos como AIM@SHAPE iban más allá, hasta el uso de la anotación para la generación de escenas 3D.
Respecto al consumo de información multimedia me llamó la atención el proyecto de resumen automático de video dentro de MESH. Relacionado con el resumen de video está AV-RSS, una propuesta para facilitar la distribución de video dentro de los formatos de sindicación y que permita hacer una visualización previa semejante (en espíritu) a lo que se pretende en Vid2RSS.
Por último, SAPIR se centró en los problemas de escalabilidad para la multimedia. De la charla de Pavel Zelula me pareció muy interesante una transparencia que relacionaba resultados y arquitectura de escalabilidad que trataré de recuperar. Además, descubrí que ha desarrollado una librería de similitudes métricas MESSIF.