|
Data Warehousing und Knowledge Discovery in Databases (DWKDD)5 ECTS (englische Bezeichnung: Data Warehousing and Knowledge Discovery in Databases)
Modulverantwortliche/r: Richard Lenz Lehrende:
Richard Lenz, Thomas Ruf
Startsemester: |
SS 2021 | Dauer: |
1 Semester | Turnus: |
jährlich (SS) |
Präsenzzeit: |
60 Std. | Eigenstudium: |
90 Std. | Sprache: |
Deutsch und Englisch |
Lehrveranstaltungen:
Ausschlussbedingung: Dieses Modul darf nur abgelegt werden, wenn keine der im Modul enthaltenen Lehrveranstaltungen auch noch in einem anderen Modul enthalten ist, das bereits abgelegt wurde.
-
Knowledge Discovery in Databases
(Vorlesung, 2 SWS, Richard Lenz et al., Di, 8:15 - 9:45, 00.152-113; *Aktueller Hinweis*: Diese Veranstaltung findet dieses Semester *online* statt. Weitere Informationen finden Sie im zugehörigen *StudOn-Kurs*. Information regarding online courses are provided via StudOn.)
-
Data Warehousing
(Vorlesung, 2 SWS, Thomas Ruf, Aufgrund der aktuellen Corona-Situation findet die Veranstaltung online statt. Die Termine für die via Zoom statt findenden Vorlesungen finden Sie in der entsprechenden studon-Gruppe.)
Empfohlene Voraussetzungen:
siehe Lehrveranstaltungen
Inhalt:
KDD
1. Introduction
2. Know Your Data
3. Data Preprocessing
4. Mining Frequent Patterns, Associations and Correlations: Basic Concepts and Methods
5. Advanced Frequent Pattern Mining
6. Classification: Basic Concepts
7. Classification: Advanced Methods
8. Cluster Analysis: Basic Concepts and Methods
9. Cluster Analysis: Advanced Methods
10. Outlier Detection
11. Trends and Research Frontiers in Data Mining DW
Das "Data Warehouse" stellt sowohl im theoretischen Bereich der Datenbankforschung als auch in der praktischen Anwendung in der Wirtschaft ein "Hot Topic" dar. Die breite Fächerung des Themengebietes macht es notwendig, sich dem Begriff "Data Warehouse" von verschiedenen Blickwinkeln zu nähern. Die Hauptpunkte der Vorlesung liegen dabei in der Diskussion der unterschiedlichen Architekturansätze, der zugehörigen Datenmodelle und den verarbeitungstechnischen Grundlagen. Weiterhin wird auf aktuelle Diskussionspunkte wie die Realisierungstechniken ROLAP und MOLAP oder die Aggregatbildung, -verwendung und -haltung eingegangen. Die Vorlesung ist geprägt von einer Mischung aus theoretischen Grundlagen und praktischer Anwendung von neuen Forschungsergebnissen. Um einen stärkeren Praxisbezug zu erreichen, werden mehrere Vorträge von Firmenvertretern bestritten, die zum einen von ihren Erfahrungen bei dem Aufbau eines "Data Warehouses" berichten und zum anderen den Stand der Technik in einschlägigen Data Warehouse- Systemen darstellen.
Lernziele und Kompetenzen:
DW
Die Studierenden
kennen verschiedene Anwendungsgebiete des Data Warehousing und charakterisieren diese;
modellieren multidimensionale Datenbanken;
entwickeln ein Grundverständnis für die Abbildung multidimensionaler Datenstrukturen in Datenbanken und bewerten die Vor- und Nachteile der verschiedenen Ansätze in konkreten Anwendungssituationen;
setzen grundlegende Verfahren der Datenauswertung in Data Warehouse-Systemen für konkrete Anwendungssituationen ein;
erläutern die Architektur und den Betrieb technischer Data Warehouse-Systeme und erläutern die sich hieraus ergebenden Implikationen im Betrieb solcher Systeme;
erklären die von Praxisvertretern vorgestellten Einsatzszenarien und Systemansätzen für Data Warehouse-Systeme;
schätzen aktuelle Entwicklungen im Themengebiet ein.
- Fachkompetenz
- Wissen
- KDD:
Die Studierenden
kennen den typischen KDD-Prozess;
kennen Verfahren zur Vorbereitung von Daten für das Data Mining;
kennen die Definition von Distanz- bzw. Ähnlichkeitsfunktionen für die verschiedenen Typen von Attributen;
sind vertraut mit dem Prinzip des Apriori-Algorithmus zur Bestimmung von Mengen häufiger Elemente (frequent itemsets);
kennen den FP-Growth-Algorithmus zum schnellen Auffinden von Mengen häufiger Elemente;
können die Definitionen von Support und Confidence für Assoziationsregeln wiedergeben;
können die Ermittlung von Assoziationsregeln auf der Basis von Mengen häufiger Ele-mente beschreiben;
sind in der Lage, die Vorgehensweise bei Klassifikationsaufgaben wiederzugeben;
können darlegen, wie ein Entscheidungsbaum auf einem Trainingsdatensatz erzeugt wird;
können das Prinzip der Bayes'schen Klassifikation darstellen;
können verschiedene Clustering-Verfahren aufzählen;
können den Ablauf von k-Means-Clustering beschreiben;
kennen die verschiedenen Arten von Ausreißern.
- Verstehen
- KDD: Die Teilnehmer können
Distanz- oder Ähnlichkeits-Funktionen auf einem speziellen Datenbestand defi-nieren;
Attribute eines Datensatzes auf ihre Bedeutung für die Analyse hin überprüfen und ggf. Attributwerte geeignet transformieren.
- Lern- bzw. Methodenkompetenz
- KDD:
Die Studierenden
müssen ein hohes Maß an Eigeninitiative zur Aneignung des Stoffes mitbringen und werden darin bestärkt;
müssen die englische Sprache so weit beherrschen, dass sie der Vorlesung folgen können;
verwenden gezielt ein Lehrbuch zur Vorlesung;
bekommen zahlreiche Hinweise auf zugrundeliegende Literatur, die sie bei Bedarf heraussuchen und durcharbeiten müssen.
- Selbstkompetenz
- KDD:
Die Teilnehmer
- Sozialkompetenz
- KDD:
Die Teilnehmer
eignen sich den Stoff in einer Gruppe mit extrem verschiedenen Hintergründen an;
brauchen das Gespräch mit anderen Teilnehmern zur Aneignung des Stoffs;
müssen sich in der Diskussion auch selbst der englischen Sprache bedienen.
Literatur:
siehe Lehrveranstaltungen
Studien-/Prüfungsleistungen:
Data Warehousing und Knowledge Discovery in Databases (Prüfungsnummer: 228988)
(englischer Titel: Data Warehousing and Knowledge Discovery in Databases)
- Prüfungsleistung, mehrteilige Prüfung, benotet
- Anteil an der Berechnung der Modulnote: 100.0 %
- weitere Erläuterungen:
Die Bewertung der Prüfungsleistung setzt sich zusammen aus 1/2 Note der Klausur in Data Warehousing (von etwa 60 Minuten Dauer) und 1/2 Note der mündlichen Prüfung in KDD (von etwa 30 Minuten Dauer). Zum Bestehen der Modulprüfungen müssen beide Teilprüfungen bestanden werden.
- Prüfungssprache: Deutsch oder Englisch
- Erstablegung: SS 2021, 1. Wdh.: WS 2021/2022
Data Warehousing und Knowledge Discovery in Databases (Prüfungsnummer: 824544)
(englischer Titel: Data Warehousing and Knowledge Discovery in Databases)
- Prüfungsleistung, mehrteilige Prüfung, benotet
- Anteil an der Berechnung der Modulnote: 100.0 %
- weitere Erläuterungen:
Die Bewertung der Prüfungsleistung setzt sich zusammen aus 1/2 Note der Klausur in Data Warehousing (von etwa 60 Minuten Dauer) und 1/2 Note der mündlichen Prüfung in KDD (von etwa 30 Minuten Dauer). Zum Bestehen der Modulprüfungen müssen beide Teilprüfungen bestanden werden.
- Prüfungssprache: Deutsch oder Englisch
- Erstablegung: SS 2021, 1. Wdh.: WS 2021/2022
Data Warehousing und Knowledge Discovery in Databases (Prüfungsnummer: 743223)
(englischer Titel: Data Warehousing und Knowledge Discovery in Databases)
- Prüfungsleistung, mehrteilige Prüfung, benotet, 5 ECTS
- Anteil an der Berechnung der Modulnote: 100.0 %
- weitere Erläuterungen:
Die Bewertung der Prüfungsleistung setzt sich zusammen aus 1/2 Note der Klausur in Data Warehousing (von etwa 60 Minuten Dauer) und 1/2 Note der mündlichen Prüfung in KDD (von etwa 30 Minuten Dauer). Zum Bestehen der Modulprüfungen müssen beide Teilprüfungen bestanden werden.
- Prüfungssprache: Deutsch oder Englisch
- Erstablegung: SS 2021, 1. Wdh.: WS 2021/2022
- Termin: 16.07.2021, Ort: Erlangen, Martensstrasse 3, Raum 08.130
|
|
|
|
UnivIS ist ein Produkt der Config eG, Buckenhof |
|
|