UnivIS
Informationssystem der Friedrich-Alexander-Universität Erlangen-Nürnberg © Config eG 
FAU Logo
  Sammlung/Stundenplan    Modulbelegung Home  |  Rechtliches  |  Kontakt  |  Hilfe    
Suche:      Semester:   
 
 Darstellung
 
Druckansicht

 
 
Modulbeschreibung (PDF)

 
 
 Außerdem im UnivIS
 
Vorlesungs- und Modulverzeichnis nach Studiengängen

Vorlesungsverzeichnis

 
 
Veranstaltungskalender

Stellenangebote

Möbel-/Rechnerbörse

 
 
Informations- und Kommunikationstechnik (Master of Science) >>

Knowledge Discovery in Databases (KDD)2.5 ECTS
(englische Bezeichnung: Knowledge Discovery in Databases)
(Prüfungsordnungsmodul: Knowledge discovery in databases)

Modulverantwortliche/r: Richard Lenz
Lehrende: Richard Lenz


Startsemester: SS 2022Dauer: 1 SemesterTurnus: jährlich (SS)
Präsenzzeit: 30 Std.Eigenstudium: 45 Std.Sprache: Englisch

Lehrveranstaltungen:


Inhalt:

  • Why data mining?
  • What is data mining?

  • A multi-dimensional view of data mining

  • What kinds of data can be mined?

  • What kinds of patterns can be mined?

  • What technologies are used?

  • What kinds of applications are targeted?

  • Major issues in data mining

  • A brief history of data mining

Lernziele und Kompetenzen:

Die Studierenden

  • kennen den typischen KDD-Prozess;

  • kennen Verfahren zur Vorbereitung von Daten für das Data Mining;

  • definieren Distanz- oder Ähnlichkeits-Funktionen auf einem speziellen Datenbestand;

  • überprüfen Attribute eines Datensatzes auf ihre Bedeutung für die Analyse hin und transformieren ggf. Attributwerte geeignet;

  • wissen, wie ein typisches Data Warehouse aufgebaut ist;

  • kennen die Definition von Distanz- bzw. Ähnlichkeitsfunktionen für die verschiedenen Typen von Attributen;

  • sind vertraut mit dem Prinzip des Apriori-Algorithmus zur Bestimmung von Mengen häufiger Elemente (frequent itemsets);

  • kennen den FP-Growth-Algorithmus zum schnellen Auffinden von Mengen häufiger Elemente;

  • geben die Definitionen von Support und Confidence für Assoziationsregeln wieder;

  • beschreiben die Ermittlung von Assoziationsregeln auf der Basis von Mengen häufiger Elemente;

  • sind in der Lage, die Vorgehensweise bei Klassifikationsaufgaben darzustellen;

  • legen dar, wie ein Entscheidungsbaum auf einem Trainingsdatensatz erzeugt wird;

  • stellen das Prinzip der Bayes'schen Klassifikation dar;

  • zählen verschiedene Clustering-Verfahren auf;

  • beschreiben den Ablauf von k-Means-Clustering;

  • kennen die verschiedenen Arten von Ausreißern.

The students:

  • know the typical KDD process;

  • know procedures for the preparation of data for data mining;

  • know the definition of distance or similarity functions for the different kinds of attributes;

  • define distance and similarity functions for a particular dataset;

  • check attributes of a dataset for their meaning with reference to an analysis and transform attribute values accordingly, if required.

  • know how a typical data warehouse is structured;

  • are familar with the principle of the Apriori algorithm for the identification of frequent itemsets;

  • know the FP-growth algorithm for a faster identification of frequent itemsets:

  • present the definitions of support and confidence for association rules;

  • describe the construction of association rules based on frequent itemsets;

  • are capable of describing the course of action in classification tasks;

  • present the construction of a decision tree based on a training dataset;

  • present the principle of Bayes' classification;

  • enumerate different clustering procedures;

  • describe the steps of k-means clustering;

  • know the different kinds of outliers.

Literatur:

The lecture is based on the following book:

  • J. Han, M. Kamber, and J. Pei, Data Mining: Concepts and Techniques, 3rd. San Francisco, CA, USA: Morgan Kaufmann Publishers Inc., 2011, ISBN: 0123814790

Also interesting and related textbooks are:

  • A. Géron, Hands-on machine learning with Scikit-Learn and TensorFlow : concepts, tools, and techniques to build intelligent systems, 2nd ed. O’Reilly Media, 2017, ISBN: 978-1491962299

  • H. Du, Data Mining Techniques and Applications: An Introduction. Cengage Learning EMEA, May 2010, p. 336, ISBN: 978-1844808915

  • I. H. Witten, E. Frank, M. A. Hall, et al., Data Mining, Fourth Edition: Practical Machine Learning Tools and Techniques, 4th. San Francisco, CA, USA: Morgan Kaufmann Publishers Inc., 2016, ISBN: 0128042915


Verwendbarkeit des Moduls / Einpassung in den Musterstudienplan:

  1. Informations- und Kommunikationstechnik (Master of Science)
    (Po-Vers. 2016s | TechFak | Informations- und Kommunikationstechnik (Master of Science) | Gesamtkonto | Wahlbereiche, Praktika, Seminar, Masterarbeit | Wahlmodule aus dem Angebot von EEI und Informatik | Knowledge discovery in databases)
Dieses Modul ist daneben auch in den Studienfächern "Information and Communication Technology (Master of Science)", "Medizintechnik (Master of Science)" verwendbar. Details

Studien-/Prüfungsleistungen:

Knowledge discovery in databases (Prüfungsnummer: 392229)

(englischer Titel: Knowledge discovery in databases)

Prüfungsleistung, mündliche Prüfung, Dauer (in Minuten): 30, benotet, 2.5 ECTS
Anteil an der Berechnung der Modulnote: 100.0 %
Prüfungssprache: Englisch

Erstablegung: SS 2022, 1. Wdh.: WS 2022/2023
1. Prüfer: Richard Lenz

UnivIS ist ein Produkt der Config eG, Buckenhof