Last updated May 10, 2011 09:50, by Thanh Nghia Lam
Erstellen von Statistik Tools für RDF Wiki
Betreuer: Sebastian Hellmann
- Ziel des Praktikums ist das Erstellen einer kleinen Tool Suite zum Vermessen von RDF Wissensbasen und deren Anwendung auf DBpedia.
- Bestehende Statistikmaße sollen recherchiert und evaluiert werden. Es soll überprüft werden, ob diese auf RDF (Labeled Directed Graphs) anwendbar sind. Mögliche Einstiegspunkte sind: Cluster Koeffizient, HITS, In / Outdegree, Graph Durchmesser, link
- Anwendbare Maße sollen implementiert werden, am Besten mit Unix Shell Skripten, AWK Beispiel für In/Outdegree, SPARQL und My SQL.
- Anschliessend sollen die Statistiken auf http://dbpedia.org angewendet werden und mit Gnuplot visualisiert.
- Erstellung des RDF Schema / RDF zum Testen
- Parsing Subjekt-Prädikate-Objekt mit Hilfe Shell, Sed, AWK unter Linux
- Implementierung in JAVA
- HITS Algorithmus für In-/OutDegree
- Anwendung auf Wikipedia / DBpedia
- Visualizierung mit Gnuplot
- Datenbank: RDF (n-Tripeln) ; MySQL (wenn nötig!)
- Datenbanksanfragen: SPARQL; SQL





