Strukturelle Analyse Web-basierter Dokumente

Cover
Springer-Verlag, 24.02.2006 - 171 Seiten
Das Web Mining, welches aus den Teilgebieten Web Structure Mining, Web Content Mining und Web Usage Mining besteht, erlangt im Zuge der Web-basierten Kommunikation eine immer stärkere Bedeutung. Aufgrund unüberschaubarer Datenmengen im Web sind gerade leistungsfähige Verfahren zur Gewinnung und Analyse Web-basierter Informationen von großer Wichtigkeit. Matthias Dehmer rückt das Web Structure Mining, insbesondere die strukturelle Analyse Web-basierter Hypertexte auf Grundlage gerichteter Graphen, in den Mittelpunkt seiner Untersuchung. Der Autor stellt ein graphentheoretisches Modell zur Bestimmung der strukturellen Ähnlichkeit einer Klasse von gerichteten Graphen vor. Auf Basis des angesprochenen Modells führt er Experimente mit bestehenden Hypertexten durch und beschreibt neuartige Anwendungen im Web Structure Mining und in anderen Gebieten.
 

Ausgewählte Seiten

Inhalt

Einleitung
1
Strukturelle Aspekte hypertextueller Einheiten
11
11
47
Grenzen der inhaltsbasierten Kategorisierung
51
14
63
Bekannte Metho
64
16
82
Neuer Ansatz
93
Strukturvorhersage
139
Zusammenfassung und Ausblick
145
Literaturverzeichnis
153
54
157
98
165
Urheberrecht

Andere Ausgaben - Alle anzeigen

Häufige Begriffe und Wortgruppen

Abbildung ähnlichkeitsbasierten Ähnlichkeitsmaß Ähnlichkeitsmaße Ähnlichkeitswert Ähnlichkeitswertverteilungen Algorithms Alignments Analyse Anwendung Arbeit Aspekte Ausgangsgrad Aussagekraft basierend Basis bekannte Berechnung Bestimmung der strukturellen bezeichnet bezüglich Botafogo Bunke C₁ Chakrabarti Chew Cluster Clustering Clusteringverfahren Clusterung Computer Science d₁ Data Mining definiert Definition Dehmer Dokumentstrukturen DOM-Strukturen dynamische Programmierung Eigenschaften Emmert-Streib Ergebnisse euklidische Abstand Folgenden gerichtete Graphen Gleichung Graphabstände Graphähn Graphähnlichkeitsmodell graphbasierter graphentheoretischen Graphgrammatiken Graphklasse Graphmatching Graphmengen Graphmetrik Graphmustern Graphstruktur Grund Grundlage H₁ H₂ heißt hierarchisierten und gerichteten Hyperebene Hypergraphen Hyperkanten Hypermedia Hypertext Hypertextstrukturen hypertextueller IEEE induzierten Informatik Information Retrieval inhaltsbasierten Kategorisierung International Conference Kapitel 5.5 Kategorie Kernel-Funktion Knoten Knotenmarkierungen Konstruktion Lernverfahren Maß Mehler Menge Methoden möglich Objekte optimalen pages Polymorphie Problemstellungen Proceedings Repräsentation S₁ Sequenz-Alignments Sequenzen Shneiderman Siehe Kapitel similarity Sobik Structure Mining strukturellen Ähnlichkeit Testkorpus Trainingsmenge ungerichteter Untergraphen Untersuchung V₁ Verfahren Web Mining web-basierter Dokumente web-basierter Hypertexte Webseiten Website-Strukturen wobei World Wide World Wide Web Wurzelbaum yfin zwei

Verweise auf dieses Buch

Autoren-Profil (2006)

Dr. Matthias Dehmer arbeitet in der Informatik im Bereich der Strukturklassifikation und der Analyse von graphbasierten Netzwerken. In der Mathematik ist er in der diskreten Mathematik (Schwerpunkt Graphentheorie) und in der angewandten Funktionentheorie (Schwerpunkt Nullstellenlokalisierung) tätig.

Bibliografische Informationen