Letzte Änderung : 12.01.2026 16:08:55   


Code:132250
Modul:Data Mining 1
Module title:Data Mining 1
Version:1.0 (12/2009)
letzte Änderung: 17.10.2025
Modulverantwortliche/r: Prof. Dr.-Ing. ten Hagen, Klaus
k.tenhagen@hszg.de

angeboten in den 3 Studiengängen:
Informatik (M.Sc.) gültig ab Matrikel 2018
Informatik (M.Sc.) gültig ab Matrikel 2020
Informatik (M.Sc.) gültig ab Matrikel 2024

Modul läuft im:SoSe (Sommersemester)
Niveaustufe:Master
Dauer des Moduls:1 Semester
Status:Pflichtmodul
Lehrort:Görlitz
Lehrsprache:Deutsch

Workload* in SWS **
Semester
Zeit- std.ECTS-
Pkte
1
2
3
4

V
S
P
W
V
S
P
W
V
S
P
W
V
S
P
W
150
5
4.0

2
2
0
0


*Gesamtarbeitsaufwand pro Modul (1 ECTS-Punkt entspricht einem studentischen Arbeitsaufwand von 30 Zeitstunden)
**eine Semesterwochenstunde (SWS) entspricht 45 Minuten pro Woche

Selbststudienzeit in h
Angabe gesamt
davon
105
30
Vor- und Nachbereitung LV
30
Vorbereitung Prüfung
45
Sonstiges


Lehr- und Lernformen:Vorlesung, Seminar, Projektbearbeitung in der Gruppe

Um den Anschluss in der Vorlesung nicht zu verlieren ist es notwendig diese zuhause nachzubereiten. Dazu werden die aktuellen Folien im Anschluss an die Vorlesung zur Verfügung gestellt. Es ist sehr empfehlenswert, dabei auftretende Fragen in der Literatur oder auf dem Web zu recherchieren. Interessante Einsichten oder Fragen werden in den Konsultationen diskutiert.

Konsultationen für jede Gruppe (20 min pro Gruppe / 2 SWS bei 5 Gruppen)

  • Definition des Projektes

  • Vorstellung von Zwischenergebnissen

  • Besprechung des aktuellen Standes

  • Festlegung der Arbeiten für die nächste Woche


Selbstständige Arbeit (3 SWS) in der Gruppe oder individuell am Laptop zur Lösung des Forschungsaufgabe

Zur Vorbereitung auf die Projektverteidigung muss ein Beleg pro Gruppe als schriftlicher wissenschaftlich-technischer Bericht erstellt werden. Weiterhin muss die Präsentation für die Projektverteidigung erstellt werden.
Hinweise:Ein Beleg als wissenschaftlich-technischer Bericht pro Gruppe.
Die Ergebnisse des Projektes werden in einem Vortrag und eventueller Demonstration von 20 min mit 10 min Diskussion vorgestellt. Die Verteidigung ist öffentlich, weil ein Vortrag von einem Auditorium motivierender ist und Fragen von den anderen Studis erwünscht sind.
Der Beleg und die Verteidigung gehen mit gleichem Gewicht in die Note ein. Bei der Verteidigung werden die Präsentation und die Beantwortung der Fragen bewertet.
Zur Bewertung der individuellen Leistung in der selbstständigen Projektarbeit werden vertrauliche Beschreibungen der Gruppenmitglieder zu den einzelnen Beiträgen und deren Beurteilung herangezogen.


Prüfung(en)
Prüfung Prüfungsleistung als Beleg (PB)
 - 
100.0%



Lerninhalt: Im Modul Forschungsprojekt sind OLAP und Exploratory Data Analysis vorgestellt worden.
In diesem Modul wird nun Data Mining im Verhältnis zur Künstlichen Intelligenz, Maschinelles Lernen und Intelligenten Agenten diskutiert. Die vorgestellten Methoden werden durch Anwendungsbeispiele in realen Projekten illustriert. Im einzelnen werden behandelt:
Making decision under uncertainty, Data Warehousing, Bayesian Networks, Naive Bayes, Cross Validation, Clustering, z.B. K-means / medoids, Hierarchical Clustering, Nearest neighbor clustering, DBscan

Die aktuellen Projekte werden zu Beginn des Semesters definiert. Dabei werden Projektvorschläge der Studis berücksichtigt.

Lernergebnisse/Kompetenzen:
Fachkompetenzen:Die Studierenden

- betrachten und diskutieren jenseits rein technischer Fragestellungen auch ökonomische, ökologische, soziale und rechtliche Aspekte.
- sind in der Lage ein Data Warehouse zu entwerfen und zu implementieren.
- können ein Bayes Net z.B. für die Diagnose, in Zusammenarbeit mit den Domain Experte skizzieren und Data Mining zur Parametrierung desselben implementieren.
- konstruieren mit Naive Bayes multiple Anwendungen, wie z.B. ein adaptives SPAM Filter .
- beurteilen die Leistungsfähigkeit eines Klassifiers oder Entscheiders mit Cross Validation Methoden .
- können Clustering Algorithmen auswählen, implementieren und kritisch bewerten.

Fachübergreifende Kompetenzen:Die Studierenden

- können die Ergebnisse ihrer Arbeit verständlich und nachvollziehbar darstellen und in angemessener Form verteidigen.
- sind dazu fähig, Kritik an der Arbeit/den Lösungen zu rezipieren und für eine Lösungsverbesserung zu nutzen.
- können in Kleingruppen effektiv zusammenarbeiten, um Aufgaben zu lösen. Neben ausgeprägter Teamfähigkeit besitzen sie Fähigkeiten zur Selbstorganisation und Konfliktlösung.
- sind sich in den Bereichen ihrer Spezialisierung des aktuellen Standes der Technik bewusst, können zukünftige Entwicklungstendenzen sinnvoll prognostizieren und entsprechende Problemstellungen ableiten.

Notwendige Voraussetzungen für die Teilnahme:Kenntnisse (ohne Nachweiserfordernis)
- aus dem Bereich der Algorithmen und Datenstrukturen
- und praktische Handlungskompetenz
- in OOA und OOP in Datenbanken und SQL
Empfohlene Voraussetzungen für die Teilnahme:Verteilte Systeme, Betriebssystem insbesondere UNIX

Literatur:

  • “Introduction to Data Mining” von Pang-Ning Tan, Michael Steinbach und Vipin Kumar

  • „Exploratory Analysis of Spatial and Temporal Data“ von Natalia Andrienko und Gennady An-drienko

  • “Data Preparation for Data Mining” von Dorian Pyle

  • „Principle of Data Mining“ von David Hand, Heikki Mannila und Padhraic Smyth

  • “Bayesian Networks and Decision Graphs” von Finn V. Jensen

  • “Data Mining: Concepts and Techniques” von Jiawei Han und Micheline Kamber