|
Sprach- und Audiosignalverarbeitung (SASP)
- Dozent/in
- Prof. Dr.-Ing. Walter Kellermann
- Angaben
- Vorlesung
3 SWS, benoteter Schein, ECTS-Studium, ECTS-Credits: 5
nur Fachstudium, für FAU Scientia Gaststudierende zugelassen, Sprache Englisch
Zeit und Ort: Di 16:15 - 17:45, H5; Mi 14:15 - 15:45, H5
- Studienfächer / Studienrichtungen
- WPF EEI-BA-INT 5-6
WPF EEI-MA-INT 1-4
WPF CE-MA-TA-IT 1-4
WPF IuK-MA-ES-EEI 1-4
WPF IuK-MA-KN-EEI 1-4
WPF IuK-MA-MMS-EEI 1-4
WPF IuK-MA-REA-EEI 1-4
WPF IuK-BA 5-6
WPF ICT-MA-ES 1-4
WPF ICT-MA-MPS 1-4
WPF WING-MA 1-3
WPF WING-MA-ET-IT 1-3
PF CME-MA 2
WPF ASC-MA 1-4
WPF MT-MA-MEL 1-4
- Voraussetzungen / Organisatorisches
- Voraussetzung: Vorlesung Signale und Systeme I +II
- Inhalt
- Die Vorlesung behandelt Grundlagen und Algorithmen der Verarbeitung von Sprach- und Audiosignalen mit Anwendungen in Telekommunikation und Multimedia, insbesondere:
Physiologie und Modelle der Spracherzeugung und des Hörens: Quelle-Filter-Modell, Filterbank-Modell der Cochlea; Maskierungseffekte;
Darstellung von Sprach- und Audiosignalen: Schätzung und Darstellung der Kurzzeit- und Langzeitstatistik in Zeit-, Frequenz- und Cepstralbereich; typische Beispiele, Visualisierungen;
Quellencodierung für Sprache und Audiosignale: Kriterien; skalare und vektorielle Codierung; lineare Prädiktion; Pitchprädiktion; Wellenform-/Parameter-/Hybrid-Codierung; Standards (ITU, GSM, ISO-MPEG)
Spracherkennung: Merkmalextraktion, Dynamic Time Warping, Hidden Markov Models
Grundprinzipien der Sprachsynthese: Text-to-Speech Systeme, modellbasierte und datenbasierte Synthese, PSOLA-Synthese
Signalverbesserung bei Signalaufnahme und -wiedergabe: Geräuschbefreiung, Echokompensation, Enthallung mittels ein- und mehrkanaliger Verfahren.
- Empfohlene Literatur
- Gemäß themenbezogenen Angaben in der Lehrveranstaltung
- ECTS-Informationen:
- Title:
- Speech and Audio Signal Processing
- Credits: 5
- Prerequisites
- Prerequisite: Lecture Signals and Systems I + II
- Contents
- The course concentrates on algorithms for speech and audio signal processing with applications in telecommunications and multimedia, especially
Human Speech Production and Hearing: Source-Filter-Model, Filterbank Model of Cochlea; Masking effects;
Signal Representation for Speech and Audio: Estimation and representation of short-term and long-term statistics in time domain, frequency domain, and cepstral domain; typical examples and visualisations;
Source Coding for Speech and Audio: criteria; scalar and vectorial quantization and coding; linear prediction; pitch prediction; waveform/ parameter/ hybrid coding; standards (ITU, GSM, ISO-MPEG)
Fundamental Concepts of Automatic Speech Recognition: Feature extraction, Dynamic Time Warping, Hidden Markov Models
Fundamental Concepts of Speech Synthesis: Text-to-Speech systems, modell-based and data-driven synthesis, PSOLA synthesis
Signal enhancement for acquisition and reproduction: Noise reduction, echo cancellation, dereverberation using single-channel and multichannel algorithms.
- Literature
- Recommendations for each topic are given during the lectures
- Zusätzliche Informationen
- Erwartete Teilnehmerzahl: 52, Maximale Teilnehmerzahl: 75
www: https://www.studon.fau.de/crs174396.html
- Zugeordnete Lehrveranstaltungen
- UE: Übung zur Sprach- und Audiosignalverarbeitung
-
www: https://www.studon.fau.de/crs174396.html
- Verwendung in folgenden UnivIS-Modulen
- Startsemester SS 2022:
- Sprach- und Audiosignalverarbeitung (SAV)
- Institution: Lehrstuhl für Multimediakommunikation und Signalverarbeitung
|
|
|
|
UnivIS ist ein Produkt der Config eG, Buckenhof |
|
|