domingo, mayo 14, 2006

Proyecto Bibster

Cierto día se me ocurrió la idea de interconectar semánticamente referencias bibliográficas entre sí para un posterior tratamiento automático por parte de procesos, agentes o programas. Me pregunté si existía alguna línea de investigación, o proyecto, basado en la interconexión semántica de artículos científicos de tal forma que el proceso de búsqueda fuera automático sin necesidad de intervención humana. Y efectivamente: existen propuestas y aproximaciones en ese sentido pero partiendo desde enfoques distintos: Folcsonomias y Ontologías, es decir desde una perspectiva social y otra mas formalizada ligada al mundo de la Inteligencia Artificial.

Planteé mi duda en la lista websemantica-ayuda y me contestaron dos personas: Emmanuelle Gutierrez (SIDAR) y Alvaro Cabrerizo (XimetriX). Emmanuelle me comentó la existencia de los Microformatos, a su vez Alvaro nos habló del proyecto Bibster que posteriormente trataremos en esta entrada.

Abordemos brevemente el tema de la aplicación de las "Folcsonomías" en el campo de la bibliografía científica: en el portal CiteULike se utilizan tags para describir las palabras claves que describen el contenido y temática de los artículos científicos. De hecho, la técnica del uso de tags (tagging) se está aplicando en portales como Flickr (describir imágenes), del.icio.us (descripción de favoritos), youTube (vídeo), etc, con gran éxito por la mejora considerable en la potencia de las búsquedas de recursos. Realmente todo este conjunto de técnicas se podrían agrupar bajo el concepto de folksonomy (jargon) basado en el carácter democrático, participativo y colaborativo de la Web 2.0. La implicación de un colectivo social es esencial en el proceso de compartir, publicar y consultar aquellas etiquetas relacionadas con nuestros intereses y preferencias.

Otro enfoque distinto es la Web Semántica, pues gira en torno a la descripcion formal y explícita del conocimiento presente en los recursos de la web para que las máquinas puedan procesarlo automáticamente e inferir nuevo conocimiento a partir del actual. Las Ontologías, un concepto procedente del campo de la Inteligencia Artificial (y el mundo de la filosofía), permiten describir formalmente las entidades y conceptos presentes en un dominio concreto.

El proyecto Bibster especifica un sistema que permite la compartición y búsqueda de metadatos bibliográficos (expresados en BibTex) en una red P2P mediante la utilización de la Ontología SWRC y la jerarquía de tópicos de la ACM que permite describir categorías específicas en el dominio de la Ciencia de la computación . Una solución centralizada sería dificil de gestionar por la gran carga existente debido al alto número de peticiones entrantes, provocando numeros cuellos de botella. La naturaleza distribuida de las redes P2P permite compartir el conocimiento de forma descentralizada y, de esta forma, se obtienen búsquedas de tópicos y publicaciones de forma mas eficiente que en un enfoque centralizado.

Cabe preguntarse si el Tagging y las Ontologías pueden complementarse entre sí, o constituyen propuestas antagónicas. Quizás en el mundo de la Web Semántica se perciba el tagging como una amenaza aunque tengo la certeza de que todas las tecnologías de la Web 2.0 van a fomentar la utilización de técnicas semánticas en distintas áreas de interés.

Según Alvaro Cabrerizo, ambas propuestas pueden convivir y complementarse:

"Sobre si las ontologías y el tagging pueden convivir, la verdad es que ya lo hacen. El tagging está teniendo mucho éxito (e.g. youtube, flicker...) y lo segirá teniendo, debido a que es una manera muy sencilla de añadir información desde el punto de vista humano y para el consumo humano. Por otro lado el tema de las ontologías está mas orientado al consumo de la información por parte de las máquinas, así que no creo que sean propuestas antagónicas, es más ya imagino a swoogle con un nuevo servicio de búsqueda de ontologías basado en el tagging."

Technorati Tags: , , , , , , , ,

No hay comentarios: