Wissensexploration.de Knowledge Mining & Discovery: Text, Web und Data Mining, Suchtechnologien, explorative Datenanalyse | Web Crawling Strategien und Information Retrieval im Web, fokussierte Web Crawler, semantisches Wissen und Informationsextraktion | > Empowering Business Intelligence.
Themen:   Home Artikel Text Mining Fokussierte Crawler Web IR KDD Software Literatur Impressum
Software
Links | Kommentare

Software: Focused Crawler

In diesem Kapitel werden fokussierte Web Crawler vorgestellt, die für die Erstellung einer themenspezifischen Dokumentkollektion aus dem Web bzw. für eine Nischensuchmaschine geeignet sind. Kriterien für die Auswahl waren: Implementierung von link-topologischen Analysen, inhalts-basierten Analysen (Klassifikation), Intelligente Bestimmung der URL-Reihenfolge und die Verwendung von Hintergrundwissen.

Überblick

Bingo
Combine
METIS
NiFC
Nutch

Fokussierte Web Crawler [?] kombinieren link-topologische und inhaltsbasierten Analysealgorithmen, um Inhalte des Webs zu klassifizieren und zielorientiert zu sammeln und können deshalb als ein effektives und effizientes Werkzeug des Web Content Mining angesehen werden.