|
Knowledge Discovery in Databases (KDD)2.5 ECTS (englische Bezeichnung: Knowledge Discovery in Databases)
Modulverantwortliche/r: Klaus Meyer-Wegener Lehrende:
Klaus Meyer-Wegener
Startsemester: |
SS 2019 | Dauer: |
1 Semester | Turnus: |
jährlich (SS) |
Präsenzzeit: |
30 Std. | Eigenstudium: |
45 Std. | Sprache: |
Englisch |
Lehrveranstaltungen:
Inhalt:
- Why data mining?
What is data mining?
A multi-dimensional view of data mining
What kinds of data can be mined?
What kinds of patterns can be mined?
What technologies are used?
What kinds of applications are targeted?
Major issues in data mining
A brief history of data mining
Lernziele und Kompetenzen:
Die Studierenden
kennen den typischen KDD-Prozess;
kennen Verfahren zur Vorbereitung von Daten für das Data Mining;
definieren Distanz- oder Ähnlichkeits-Funktionen auf einem speziellen Datenbestand;
überprüfen Attribute eines Datensatzes auf ihre Bedeutung für die Analyse hin und transformieren ggf. Attributwerte geeignet;
wissen, wie ein typisches Data Warehouse aufgebaut ist;
kennen die Definition von Distanz- bzw. Ähnlichkeitsfunktionen für die verschiedenen Typen von Attributen;
sind vertraut mit dem Prinzip des Apriori-Algorithmus zur Bestimmung von Mengen häufiger Elemente (frequent itemsets);
kennen den FP-Growth-Algorithmus zum schnellen Auffinden von Mengen häufiger Elemente;
geben die Definitionen von Support und Confidence für Assoziationsregeln wieder;
beschreiben die Ermittlung von Assoziationsregeln auf der Basis von Mengen häufiger Elemente;
sind in der Lage, die Vorgehensweise bei Klassifikationsaufgaben darzustellen;
legen dar, wie ein Entscheidungsbaum auf einem Trainingsdatensatz erzeugt wird;
stellen das Prinzip der Bayes'schen Klassifikation dar;
zählen verschiedene Clustering-Verfahren auf;
beschreiben den Ablauf von k-Means-Clustering;
kennen die verschiedenen Arten von Ausreißern.
The students:
know the typical KDD process;
know procedures for the preparation of data for data mining;
know the definition of distance or similarity functions for the different kinds of attributes;
define distance and similarity functions for a particular dataset;
check attributes of a dataset for their meaning with reference to an analysis and transform attribute values accordingly, if required.
know how a typical data warehouse is structured;
are familar with the principle of the Apriori algorithm for the identification of frequent itemsets;
know the FP-growth algorithm for a faster identification of frequent itemsets:
present the definitions of support and confidence for association rules;
describe the construction of association rules based on frequent itemsets;
are capable of describing the course of action in classification tasks;
present the construction of a decision tree based on a training dataset;
present the principle of Bayes' classification;
enumerate different clustering procedures;
describe the steps of k-means clustering;
know the different kinds of outliers.
Literatur:
Jiawei Han, Micheline Kamber, and Jian Pei: Data Mining – Concepts and Technologies, 3rd ed. Waltham, MA : Morgan Kaufmann, 2012 (The Morgan Kaufmann Series in Data Management Systems). - ISBN 978-0-12-381479-1
Studien-/Prüfungsleistungen:
Knowledge Discovery in Databases (Prüfungsnummer: 392229)
(englischer Titel: Knowledge Discovery in Databases)
- Prüfungsleistung, mündliche Prüfung, Dauer (in Minuten): 30, benotet, 2.5 ECTS
- Anteil an der Berechnung der Modulnote: 0.0 %
- Prüfungssprache: Englisch
- Erstablegung: SS 2019, 1. Wdh.: WS 2019/2020
1. Prüfer: | Klaus Meyer-Wegener |
|
|
|
|
UnivIS ist ein Produkt der Config eG, Buckenhof |
|
|