Links | Kommentare

Text Mining Software der Extraklasse: NStein

NStein Technlogies entwickelt Softwarelösungen, um riesige unstrukturierte und multilinguale Datenbestände zu analysieren.

Besonderheit in NSteins Text Mining Lösungen ist die „Linguistic DNA (LDNA)". Prinzip ist die Annahme, dass jeder Text einzigartige Charakteristiken besitzt, die ihn von jedem anderen Text unterscheiden. Mit LDNA werden Informationseinheiten (Unit of Information) erkannt, die die fundamentalen Informationen in einem Text repräsentieren. Diese fundamentalen Elemente (concepts) werden miteinander verlinkt und unter Beachtung der Bedeutung im jeweiligen Kontexts extrahiert.

Ntelligent Enterprise Search ist eine mächtige IR-Anwendung für Unternehmen. Das System unterstützt potentiell jede Sprache. Integriert sind Funktionen zur IE und Extraktion von Konzepten. Kategorisierung der Dokumente mit einer vordefinierten oder selbst erstellten Taxonomie, Zusammenfassen von Dokumenten, Finden von ähnlichen Dokumenten und das Clustern der Themen und Suchergebnisse sind ebenfalls verfügbar.

Ntelligent Content Management Suite ist ein cross-media-publishing Tool, das Prozess des e-publishing automatisiert und unterstützt. Das „Advanced Search and Text Mining“ Module ist eine robuste Suchtechnologie, die neben Volltextsuche mit booleschen („und“, „oder“ etc.) und lexikalen (im gleichen Satz, verwandte oder benachbarte Ausdrücke) Operatoren auch eine kontext-basierte Suche ermöglicht. Dazu werden Konzepte extrahiert, Dokumente automatisch Kategorisiert, Entitäten extrahiert (IE), Dokumente on-the-fly zusammengefasst und ähnliche Dokumente gefunden. Zusätzlich unterstützen das Clustern der Dokumente zu Themengebieten und eine Visualisierung der hierarchischen Gruppen einen Rechercheprozess. Erwähnenswert ist auch das Modul zur maschinellen Übersetzung. 30 verschiedne Sprachpaare werden angeboten um Dokumente automatisch zu übersetzten (u.a. Englisch, Spanisch, Arabisch, Chinesisch, Russisch, Deutsch).

Zusätzlich zur Verarbeitung enormer Mengen von Inhalten im jeweiligen Kontext bietet NStein Text Analyse zur Erkennung der Intention des Verfassers. „Reputation Management & Public Image Monitoring (PIM)“ beinhaltet die Module Nsentiment, Hot Topics Detector und Nfact Finder. Nsentiment unterscheidet Fakten von Meinungen (subjektiv/objektiv) und evaluiert den „ton“ des Textes (positiv/neutral/negativ). Der Hot Topics Detector identifiziert die populärsten Themen hinsichtlich einer Suchabfrage oder Dokumentmenge. Nfact Finder identifiziert Beziehungen zwischen Entitäten wie Personen, Orten, Firmen und Events. Die „Early Warning Application“ verwendet auch diese Komponenten, um ein „Topic Tracking“ zu ermöglichen.

URL: nstein.com