Keith van Rijsbergen

Keith van Rijsbergen
Keith van Rijsbergen.

Cornelius Joost van Rijsbergen (Rotterdam, 1943), más conocido como Keith van Rijsbergen, es un programador informático e investigador del procesamiento del lenguaje natural y de la disciplina Recuperación de información.

Contenido

Biografía

Nace en Rotterdam (Holanda)y durante su niñez y juventud vivió en distintos países como Holanda, Indonesia, Namibia y, finalmente, Australia. Realiza estudios universitarios en Western (Australia), donde empieza a interesarse por las matemáticas. En 1972 es investido como doctor por la Universidad de Cambridge con una tesis sobre programación informática.

Hasta 1975 permanece en la Universidad de Monash estudiando la inteconexión entre la Inteligencia artificial y la Recuperación de información. Vuelve al Laboratorio de Informática de Cambridge como miembro honorario (fellowship) de la Royal Society Information Research. En 1980 ocupa la cátedra de informática de la Universidad de Dublín y en 1986 se integra a la Universidad de Glasgow para dirigir el grupo de investigación en Recuperación de información.

En 1993 fue designado como redactor-jefe de la revista científica The Computer Journal hasta 2000.

Obra científica. Las técnicas de cluster

Desde 1969, Rijsbergen lleva investigando la base teórica de los sistemas de recuperación de información, dotándola de sólidos principios. Definió la diferencia entre Recuperación de datos y Recuperación de información distinguiendo la primera como un proceso de obtención de datos exactos y concretos, y la segunda como un proceso basado en una inferencia inductiva; es decir, buscar fechas o nombres es recuperación de datos, mientras que buscar temas sería recuperación de información.

Durante la década de los 70 y principio de los 80, ideó las técnicas de cluster, también llamadas clustering, o clasificación automática. Son técnicas estadísticas multivariantes que se utilizan para hacer agrupaciones de objetos similares en un espacio multidimensional. Las similaridades pueden ser calculadas entre pares de documentos, basándose en el número de descriptores que tienen en común. La aplicacion en una base de datos documental dará como resultado el agrupamiento de documentos que tengan un gran número de términos en común.

Estás técnicas también son aplicadas a descriptores, cuyas similitudes nos permiten identificar relaciones semánticas entre términos. Este método resulta muy útil para construir tesauros.

Las técnicas de cluster se apoyan en los algoritmos de indización ponderada que ya diseñó Karen Spärck Jones. Esta indización automatizada considera mediante conclusiones estadísticas, qué términos representan mejor los contenidos de un documento. Esto daría fin al dilema conocido como conflicto de Rijsbergen: cuanto más términos del documento estén disponibles para la equiparación, más fácil el documentos será equipado en una búsqueda, pero más difícil distinguirlo de otros documentos.

Rijsbergen planteó además dos hipótesis:

  • Hipótesis de cluster: donde definía qué documentos similares tienden a ser relevantes para las mismas preguntas, y por tanto, ser útil para agrupar documentos relevantes para un petición concreta. Esta aplicación permitiría realizar búsquedas de alta precisión en una base de datos documental previamente clasificada.
  • Hipótesis de asociación: donde dice que un término de indización es bueno para discriminar documentos relevantes de aquellos que no lo son, cualquier término de indización estrechamente relacionado con ese es, probablamente, tan bueno como ese.

El uso de estas técnias fue empleado dentro del modelo probabilístico de recuperación de información, en redes de inferencia bayesiana y en técnicas de retroalimentación por relevancia.

A mediados de los 80, comenzó a abordar la investigación a través de los modelos cognitivos de recuperación de información. Esto modelos otorgan al usuario una importancia mayor al tener en cuenta tanto la formación del usuario como a la naturaleza y propiedades de sus búsquedas. Rijsbergen utilizó el principio de incertidumbre lógica al considerar que una colección documental no es, en su conjunto, ni completa y coherente para los usuarios, llegando incluso a haber elementos contradictorios entre sí. Propuso un paradigma nuevo donde el proceso de recuperación sea considerado como un proceso de inferencia incierta, y las consultas y los documentos puedan ser representados como declaraciones lógica-probabilísticas.

Obras y reconocimientos

En 1975 publicó Information retrieval, obra con abundante material original sobre el modelo probabilístico, además de aportar reformulaciones originales de trabajos de otros autores. Es considerado como un téxto clásico de la materia. Ha sido editado también en CD.

En 1999 publicaría en coautoría con Crestani y Lalmas Recuperación de información: la incertidumbre y la lógica, donde trataría sus aportaciones en lógica inferencial. También ha publicado numerosos artículos en prestigiosas revistas científicas.

Ha sido premiado con el premio Tony Kent en 2004 y el Premio Gerard Salton 2006.

Es miembro del Institut of Electrical Engineers (IEE), de la British Computer Society (BCS) y de la Association of Computing Machinery (ACM)(SIGIR).

Obras de referencia

  • MOYA ANEGÓN; Félix de (2002): Técnicas avanzadas de recuperación documental. En: Manual de Ciencias de la Documentación. Madrid : Pirámide.

Rerencias externas


Wikimedia foundation. 2010.

Игры ⚽ Нужно сделать НИР?

Mira otros diccionarios:

  • C. J. van Rijsbergen — Cornelis Joost van Rijsbergen C. J. Keith van Rijsbergen Born 1943&# …   Wikipedia

  • C. J. van Rijsbergen — C. J. Keith van Rijsbergen C. J. „Keith“ van Rijsbergen (Cornelis Joost van Rijsbergen) (* 1943 in den Niederlanden) ist ein Professor der Informatik. Er ist der Leiter der Information Retrieval Group an der Universität Glasgow. Er ist einer der… …   Deutsch Wikipedia

  • Cornelis Joost van Rijsbergen — C. J. Keith van Rijsbergen C. J. „Keith“ van Rijsbergen (Cornelis Joost van Rijsbergen) (* 1943 in den Niederlanden) ist ein Professor der Informatik. Er ist der Leiter der Information Retrieval Group an der Universität Glasgow. Er ist einer der… …   Deutsch Wikipedia

  • Tony Kent Strix award — The Strix award is an annual award for outstanding contributions to the field of information retrieval.The award has been presented since 1998 in memory of Dr Tony Kent, a past Fellow of the Institute of Information Scientists (IIS), who died in… …   Wikipedia

  • Karen Spärck Jones — en 2002 Nacimiento 26 de agosto de 1935 Huddersfield, Yorkshire F …   Wikipedia Español

  • Recuperación de información — Saltar a navegación, búsqueda La recuperación de información, llamada en inglés information retrieval (IR), es la ciencia de la búsqueda de información en documentos, búsqueda de los mismos documentos, la búsqueda de metadatos que describan… …   Wikipedia Español

  • Precision and recall — are two widely used measures for evaluating the quality of results in domains such as Information Retrieval and statistical classification.Precision can be seen as a measure of exactness or fidelity, whereas Recall is a measure of completeness.In …   Wikipedia

  • F-Maß — Die Artikel Positiver Vorhersagewert und Recall und Precision überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion über diese Überschneidungen. Bitte… …   Deutsch Wikipedia

  • Precision und Recall — Die Artikel Positiver Vorhersagewert und Recall und Precision überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion über diese Überschneidungen. Bitte… …   Deutsch Wikipedia

  • Recall und Precision — Die Artikel Positiver Vorhersagewert und Recall und Precision überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion über diese Überschneidungen. Bitte… …   Deutsch Wikipedia

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”