TrustRank

TrustRank

TrustRank es una técnica de análisis de hiperenlaces descrita en un documento elaborado por la Universidad de Stanford y Yahoo!. Este sistema separa las páginas web útiles de las de spam de manera semiautomática.[1]

Muchas páginas web de spam son creadas sólo con la intención de engañar a los motores de búsqueda. Estas páginas, creadas principalmente por razones comerciales, usan diversas técnicas para lograr una clasificación más alta en los resultados de los buscadores. Mientras que los expertos humanos pueden identificar fácilmente el spam, es demasiado costoso evaluar un gran número de páginas manualmente.

Un método popular para mejorar la clasificación es aumentar artificialmente la importancia percibida de un documento a través de complejos sistemas de vinculación. PageRank de Google y otros métodos creados para determinar la importancia relativa de los documentos de la Web han sido objeto de manipulación.

El método TrustRank solicita que un pequeño conjunto de páginas de ejemplo sean evaluadas por un experto. Una vez que las páginas de buena reputación están identificados manualmente, se rastrean otras páginas comparándolas con las de ejemplo. El índice de fiabilidad de una página disminuye a medida que se parece más a las páginas calificadas como spam por los expertos.

Los investigadores que propusieron la metodología TrustRank han seguido perfeccionando su labor mediante la evaluación de temas relacionados, como la medición de la masa de spam.

Referencias

  1. Garcia-Molina, Hector y Pedersen Jan (2004). «Combating Web Spam with TrustRank». Proceedings of the International Conference on Very Large Data Bases 30. 576. http://www.vldb.org/conf/2004/RS15P3.PDF. 

Wikimedia foundation. 2010.

Игры ⚽ Поможем решить контрольную работу

Mira otros diccionarios:

  • TrustRank — is a link analysis technique described in a paper by Stanford University and Yahoo! researchers for semi automatically separating useful webpages from spam. [cite journal last = Gyöngyi first = Zoltán authorlink = coauthors = Hector Garcia Molina …   Wikipedia

  • TrustRank — Le Trust Rank (terme anglais signifiant indice de confiance ) ou TR est le nom d un algorithme mis au point par deux chercheurs de l université Stanford et un chercheur de l entreprise Yahoo!. Cet algorithme visant à combattre les pages internet… …   Wikipédia en Français

  • TrustRank — Der TrustRank Algorithmus ist ein Verfahren zur Bewertung der Qualität von Webseiten[1]. Er dient zur halbautomatischen Klassifizierung der Qualität einer Seite bzw. zum Auffinden von Spam Seiten und soll Suchmaschinen bei der Bewertung von… …   Deutsch Wikipedia

  • PageRank — Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il fournit. De …   Wikipédia en Français

  • Classement Google — PageRank Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il… …   Wikipédia en Français

  • Page Rank — PageRank Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il… …   Wikipédia en Français

  • Page rank — PageRank Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il… …   Wikipédia en Français

  • Pagerank — Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il fournit. De …   Wikipédia en Français

  • Rang De Page — PageRank Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il… …   Wikipédia en Français

  • Rang de page — PageRank Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il… …   Wikipédia en Français

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”