Letzte Änderung : 14.04.2026 13:42:01   


Code:132250
Modul:Data Mining 1
Module title:Data Mining 1
Version:1.0 (12/2009)
letzte Änderung: 08.04.2026
Modulverantwortliche/r: Prof. Dr.-Ing. ten Hagen, Klaus
k.tenhagen@hszg.de

angeboten in den 4 Studiengängen:
Informatik (M.Sc.) gültig ab Matrikel 2018 (Pflichtmodul)
Informatik (M.Sc.) gültig ab Matrikel 2020 (Pflichtmodul)
Informatik (M.Sc.) gültig ab Matrikel 2024 (Pflichtmodul)
Informatik (M.Sc.) gültig ab Matrikel 2026 (Pflichtmodul)

Modul läuft im:SoSe (Sommersemester)
Niveaustufe:Master
Dauer des Moduls:1 Semester
Status:Pflichtmodul
Lehrort:Görlitz
Lehrsprache:Deutsch

Workload* in SWS **
Semester
Zeit- std.ECTS-
Pkte
1
2
3
4

V
S
P
W
V
S
P
W
V
S
P
W
V
S
P
W
150
5
4.0

2
2
0
0


*Gesamtarbeitsaufwand pro Modul (1 ECTS-Punkt entspricht einem studentischen Arbeitsaufwand von 30 Zeitstunden)
**eine Semesterwochenstunde (SWS) entspricht 45 Minuten pro Woche

Selbststudienzeit in h
Angabe gesamt
davon
105
30
Vor- und Nachbereitung LV
30
Vorbereitung Prüfung
45
Sonstiges


Lehr- und Lernformen:Vorlesung, Seminar, Projektbearbeitung in der Gruppe

Um den Anschluss in der Vorlesung nicht zu verlieren ist es notwendig diese zuhause nachzubereiten. Dazu werden die aktuellen Folien im Anschluss an die Vorlesung zur Verfügung gestellt. Es ist sehr empfehlenswert, dabei auftretende Fragen in der Literatur oder auf dem Web zu recherchieren. Interessante Einsichten oder Fragen werden in den Konsultationen diskutiert.

Konsultationen für jede Gruppe (20 min pro Gruppe / 2 SWS bei 5 Gruppen)

  • Definition des Projektes

  • Vorstellung von Zwischenergebnissen

  • Besprechung des aktuellen Standes

  • Festlegung der Arbeiten für die nächste Woche


Selbstständige Arbeit (3 SWS) in der Gruppe oder individuell am Laptop zur Lösung des Forschungsaufgabe

Zur Vorbereitung auf die Projektverteidigung muss ein Beleg pro Gruppe als schriftlicher wissenschaftlich-technischer Bericht erstellt werden. Weiterhin muss die Präsentation für die Projektverteidigung erstellt werden.
Hinweise:Ein Beleg als wissenschaftlich-technischer Bericht pro Gruppe.
Die Ergebnisse des Projektes werden in einem Vortrag und eventueller Demonstration von 20 min mit 10 min Diskussion vorgestellt. Die Verteidigung ist öffentlich, weil ein Vortrag von einem Auditorium motivierender ist und Fragen von den anderen Studis erwünscht sind.
Der Beleg und die Verteidigung gehen mit gleichem Gewicht in die Note ein. Bei der Verteidigung werden die Präsentation und die Beantwortung der Fragen bewertet.
Zur Bewertung der individuellen Leistung in der selbstständigen Projektarbeit werden vertrauliche Beschreibungen der Gruppenmitglieder zu den einzelnen Beiträgen und deren Beurteilung herangezogen.


Prüfung(en)
Prüfung Prüfungsleistung als Beleg (PB)
 - 
100.0%



Lerninhalt: Im Modul Forschungsprojekt sind OLAP und Exploratory Data Analysis vorgestellt worden.
In diesem Modul wird nun Data Mining im Verhältnis zur Künstlichen Intelligenz, Maschinelles Lernen und Intelligenten Agenten diskutiert. Die vorgestellten Methoden werden durch Anwendungsbeispiele in realen Projekten illustriert. Im einzelnen werden behandelt:
Making decision under uncertainty, Data Warehousing, Bayesian Networks, Naive Bayes, Cross Validation, Clustering, z.B. K-means / medoids, Hierarchical Clustering, Nearest neighbor clustering, DBscan

Die aktuellen Projekte werden zu Beginn des Semesters definiert. Dabei werden Projektvorschläge der Studis berücksichtigt.

Lernergebnisse/Kompetenzen:
Fachkompetenzen:Die Absolventen/-innen sind fähig, das im Bachelorstudium erworbene Basiswissen im Bereich der Informatik maßgeblich zu vertiefen.
Sie nutzen diese erweiterten Kenntnisse aus Fachgebieten wie Datenbanken, Data Mining, Künstlicher Intelligenz, Echtzeitprogrammierung, Betriebssystemen und der Modellbildung, um sie für ihre spezifische Profilbildung innerhalb der Masterausbildung nutzbringend anzuwenden und miteinander zu kombinieren.

Auf dieser fundierten Basis analysieren und abstrahieren die Absolventen/-innen technische Problemstellungen unter Berücksichtigung bekannter sowie unbekannter Randbedingungen.
Sie können den potenziellen Lösungsraum – von der Unlösbarkeit über eindeutige bis hin zu multiplen Lösungen – präzise einschätzen und darauf aufbauend fundierte Handlungsanweisungen ableiten.
Des Weiteren entwerfen sie unter bewusster Verwendung bekannter Kreativitätsmethoden innovative Problemlösungsansätze.

Darüber hinaus betrachten und diskutieren die Absolventen/-innen jenseits rein technischer Fragestellungen auch ökonomische, ökologische, soziale und rechtliche Aspekte von Problemstellungen und Lösungen.
Während sie in Modulen mit überwiegendem Vorlesungscharakter, wie etwa Statistik, ihre diesbezügliche Wissensbasis erweitern, setzen sie dieses Wissen insbesondere in Modulen mit Belegabschluss, wie z.B.
Fortgeschrittene Datenbankkonzepte oder Data Mining, praktisch um.
Dabei integrieren sie diese vielfältigen Perspektiven gezielt in die Lösungsfindung, um ganzheitliche Lösungen zu entwickeln.

In den Bereichen ihrer Spezialisierung sind die Absolventen/-innen zudem des aktuellen Standes der Technik bewusst und können zukünftige Entwicklungstendenzen sinnvoll prognostizieren, woraus sie entsprechende Problemstellungen ableiten.
Fachübergreifende Kompetenzen:Parallel zu diesen fachlichen und analytischen Kompetenzen verfügen die Absolventen/-innen über ausgeprägte Fähigkeiten zur effektiven Zusammenarbeit in Kleingruppen, um komplexe Aufgaben zu lösen.
Sie zeigen dabei nicht nur Teamfähigkeit, sondern auch Selbstorganisation und Kompetenzen zur Konfliktlösung.
Die Berücksichtigung der Interkulturalität ergibt sich dabei automatisch aus der typischerweise sehr heterogenen Zusammensetzung der Studierendengruppen.

Ihre Arbeitsergebnisse können die Absolventen/-innen verständlich und nachvollziehbar darstellen sowie in angemessener Form überzeugend verteidigen.

Notwendige Voraussetzungen für die Teilnahme:Programmierkenntnisse
Empfohlene Voraussetzungen für die Teilnahme:Verteilte Systeme, Betriebssystem insbesondere UNIX

Literatur:

  • “Introduction to Data Mining” von Pang-Ning Tan, Michael Steinbach und Vipin Kumar

  • „Exploratory Analysis of Spatial and Temporal Data“ von Natalia Andrienko und Gennady An-drienko

  • “Data Preparation for Data Mining” von Dorian Pyle

  • „Principle of Data Mining“ von David Hand, Heikki Mannila und Padhraic Smyth

  • “Bayesian Networks and Decision Graphs” von Finn V. Jensen

  • “Data Mining: Concepts and Techniques” von Jiawei Han und Micheline Kamber