|
Sprach- und Audiosignalverarbeitung (SAV)5 ECTS (englische Bezeichnung: Speech and Audio Signal Processing)
(Prüfungsordnungsmodul: Speech and Audio Signal Processing)
Modulverantwortliche/r: Walter Kellermann Lehrende:
Walter Kellermann, Christian Hümmer
Startsemester: |
SS 2014 | Dauer: |
1 Semester | Turnus: |
jährlich (SS) |
Präsenzzeit: |
60 Std. | Eigenstudium: |
90 Std. | Sprache: |
Englisch |
Lehrveranstaltungen:
-
-
Sprach- und Audiosignalverarbeitung
(Vorlesung, 3 SWS, Walter Kellermann, Mo, 12:15 - 13:45, H15; Di, 16:15 - 17:45, H15)
-
Übung zur Sprach- und Audiosignalverarbeitung
(Übung, 1 SWS, Christian Hümmer, Do, 8:15 - 9:45, N 6.13; Do, 10:15 - 11:45, N 6.13, R4.15; Donnerstagstermin abwechselnd mit der Übung, weitere Informationen sind auf StudOn zu finden)
Inhalt:
Spracherzeugung und Hören beim Menschen
Physiologie und Modelle der Spracherzeugung und des Hörens: Quelle-Filter-Modell, Filterbank-Modell der Cochlea; Maskierungseffekte; Darstellung von Sprach- und Audiosignalen
Schätzung und Darstellung der Kurzzeit- und Langzeitstatistik in Zeit-, Frequenz- und Cepstralbereich; typische Beispiele, Visualisierungen; Quellencodierung für Sprache und Audiosignale
Kriterien; skalare und vektorielle Codierung; lineare Prädiktion; Pitchprädiktion; Wellenform-/Parameter-/Hybrid-Codierung; Standards (ITU, GSM, ISO-MPEG) Spracherkennung
Merkmalextraktion, Dynamic Time Warping, Hidden Markov Models Grundprinzipien der Sprachsynthese
Text-to-Speech Systeme, modellbasierte und datenbasierte Synthese, PSOLA-Synthese Signalverbesserung bei Signalaufnahme und –wiedergabe
Geräuschbefreiung, Echokompensation, Enthallung mittels ein- und mehrkanaliger Verfahren;
Lernziele und Kompetenzen:
Die Studierenden
verstehen die grundlegenden physiologischen Mechanismen der Spracherzeugung und des Hörens beim Menschen und können diese zur Analyse von Sprach- und Audiosignalen anwenden
wenden die grundlegenden Methoden zur Schätzung und Darstellung der Kurzzeit- und Langzeitstatistik von Sprach- und Audiosignalen an und können diese damit analysieren
verstehen die aktuellen Methoden zur Quellencodierung von Sprache-und Audiosignalen und können aktuelle Codierstandards analysieren
verstehen die Grundbausteine von Spracherkennungssystemen und können deren Funktion mittels Rechnersimulation analysieren
verstehen die Grundprinzipien von Text-to-Speech Systemen und können elementare Algorithmen zur Sprachsynthese anwenden
können elementare Algorithmen zur Signalverbesserung anwenden und für reale Daten analysieren
Literatur:
Literaturempfehlung erfolgt in der Vorlesung.
Organisatorisches:
Signale und Systeme I +II
Verwendbarkeit des Moduls / Einpassung in den Musterstudienplan:
- Berufspädagogik Technik (Master of Education)
(Po-Vers. 2010 | Masterprüfung | Wahlpflichtmodule Fachwissenschaft | Speech and Audio Signal Processing)
Dieses Modul ist daneben auch in den Studienfächern "Communications and Multimedia Engineering (Master of Science)", "Computational Engineering (Rechnergestütztes Ingenieurwesen) (Master of Science)", "Elektrotechnik, Elektronik und Informationstechnik (Bachelor of Science)", "Elektrotechnik, Elektronik und Informationstechnik (Master of Science)", "Wirtschaftsingenieurwesen (Master of Science)" verwendbar. Details
Studien-/Prüfungsleistungen:
Speech and Audio Signal Processing (Prüfungsnummer: 64601)
- Prüfungsleistung, Klausur, Dauer (in Minuten): 90, benotet
- Anteil an der Berechnung der Modulnote: 100.0 %
- Erstablegung: SS 2014, 1. Wdh.: WS 2014/2015
1. Prüfer: | Walter Kellermann |
- Termin: 22.09.2014, 08:00 Uhr, Ort: H 11
Termin: 29.09.2015, 16:00 Uhr, Ort: Mensa-Süd
|
|
|
|
UnivIS ist ein Produkt der Config eG, Buckenhof |
|
|