|
Sprach- und Audiosignalverarbeitung (SAV)5 ECTS (englische Bezeichnung: Speech and Audio Signal Processing)
Modulverantwortliche/r: Walter Kellermann Lehrende:
Walter Kellermann, Christian Hümmer
Startsemester: |
SS 2015 | Dauer: |
1 Semester | Turnus: |
jährlich (SS) |
Präsenzzeit: |
60 Std. | Eigenstudium: |
90 Std. | Sprache: |
Englisch |
Lehrveranstaltungen:
-
-
Sprach- und Audiosignalverarbeitung
(Vorlesung, 3 SWS, Walter Kellermann, Mi, Fr, 12:15 - 13:45, H15)
-
Übung zur Sprach- und Audiosignalverarbeitung
(Übung, 1 SWS, Christian Hümmer, Do, 8:15 - 9:45, 10:15 - 11:45, N 6.13; Mi, 18:15 - 19:45, N 6.13; Weitere Informationen sind unter http://lms.lnt.de/en/studies/educationalevents/summerterm2015.php?id=253 und ab Semesterbeginn auf StudOn zu finden)
Inhalt:
Die Vorlesung behandelt Grundlagen und Algorithmen der Verarbeitung von Sprach- und Audiosignalen mit Anwendungen in Telekommunikation und Multimedia, insbesondere:
Physiologie und Modelle der Spracherzeugung und des Hörens: Quelle-Filter-Modell, Filterbank-Modell der Cochlea; Maskierungseffekte;
Darstellung von Sprach- und Audiosignalen: Schätzung und Darstellung der Kurzzeit- und Langzeitstatistik in Zeit-, Frequenz- und Cepstralbereich; typische Beispiele, Visualisierungen;
Quellencodierung für Sprache und Audiosignale: Kriterien; skalare und vektorielle Codierung; lineare Prädiktion; Pitchprädiktion; Wellenform-/Parameter-/Hybrid-Codierung; Standards (ITU, GSM, ISO-MPEG)
Spracherkennung: Merkmalextraktion, Dynamic Time Warping, Hidden Markov Models
Grundprinzipien der Sprachsynthese: Text-to-Speech Systeme, modellbasierte und datenbasierte Synthese, PSOLA-Synthese
Signalverbesserung bei Signalaufnahme und –wiedergabe: Geräuschbefreiung, Echokompensation, Enthallung mittels ein- und mehrkanaliger Verfahren;
Lernziele und Kompetenzen:
Die Studierenden
verstehen die grundlegenden physiologischen Mechanismen der Spracherzeugung und des Hörens beim Menschen und können diese zur Analyse von Sprach- und Audiosignalen anwenden
wenden die grundlegenden Methoden zur Schätzung und Darstellung der Kurzzeit- und Langzeitstatistik von Sprach- und Audiosignalen an und können diese damit analysieren
verstehen die aktuellen Methoden zur Quellencodierung von Sprache-und Audiosignalen und können aktuelle Codierstandards analysieren
verstehen die Grundbausteine von Spracherkennungssystemen und können deren Funktion mittels Rechnersimulation analysieren
verstehen die Grundprinzipien von Text-to-Speech Systemen und können elementare Algorithmen zur Sprachsynthese anwenden
können elementare Algorithmen zur Signalverbesserung anwenden und für reale Daten analysieren
Literatur:
Gemäß themenbezogenen Angaben in der Lehrveranstaltung
Organisatorisches:
Signale und Systeme I +II
Verwendbarkeit des Moduls / Einpassung in den Musterstudienplan: Das Modul ist im Kontext der folgenden Studienfächer/Vertiefungsrichtungen verwendbar:
- Communications and Multimedia Engineering (Master of Science): 2. Semester
(Po-Vers. 2011 | Masterprüfung | Pflichtmodule | Speech and Audio Signal Processing)
Studien-/Prüfungsleistungen:
Speech and Audio Signal Processing (Prüfungsnummer: 64601)
(englischer Titel: Speech and Audio Signal Processing)
- Prüfungsleistung, Klausur, Dauer (in Minuten): 90, benotet
- Anteil an der Berechnung der Modulnote: 100.0 %
- Erstablegung: SS 2015, 1. Wdh.: WS 2015/2016
1. Prüfer: | Walter Kellermann |
- Termin: 29.09.2015, 16:00 Uhr, Ort: Mensa-Süd
Termin: 04.10.2016, 13:30 Uhr, Ort: Tentoria
Termin: 11.04.2017, 14:00 Uhr, Ort: LS
|
|
|
|
UnivIS ist ein Produkt der Config eG, Buckenhof |
|
|