Lehrveranstaltung

Informationssystem der Friedrich-Alexander-Universität Erlangen-Nürnberg

Sammlung/Stundenplan Modulbelegung

Home | Rechtliches | Kontakt | Hilfe

Suche:

Semester:



	Darstellung
		Druckansicht



	Außerdem im UnivIS
		Vorlesungs- und Modulverzeichnis nach Studiengängen Vorlesungsverzeichnis


		Veranstaltungskalender Stellenangebote Möbel-/Rechnerbörse

Sprach- und Audiosignalverarbeitung (SASP)

Dozent/in

Prof. Dr.-Ing. Walter Kellermann

Angaben

Vorlesung
3 SWS, benoteter Schein, ECTS-Studium, ECTS-Credits: 5
nur Fachstudium, für FAU Scientia Gaststudierende zugelassen, Sprache Englisch
Zeit und Ort: Di 16:15 - 17:45, H5; Mi 14:15 - 15:45, H5

Studienfächer / Studienrichtungen

WPF EEI-BA-INT 5-6
WPF EEI-MA-INT 1-4
WPF CE-MA-TA-IT 1-4
WPF IuK-MA-ES-EEI 1-4
WPF IuK-MA-KN-EEI 1-4
WPF IuK-MA-MMS-EEI 1-4
WPF IuK-MA-REA-EEI 1-4
WPF IuK-BA 5-6
WPF ICT-MA-ES 1-4
WPF ICT-MA-MPS 1-4
WPF WING-MA 1-3
WPF WING-MA-ET-IT 1-3
PF CME-MA 2
WPF ASC-MA 1-4
WPF MT-MA-MEL 1-4

Voraussetzungen / Organisatorisches

Voraussetzung: Vorlesung Signale und Systeme I +II

Inhalt

Die Vorlesung behandelt Grundlagen und Algorithmen der Verarbeitung von Sprach- und Audiosignalen mit Anwendungen in Telekommunikation und Multimedia, insbesondere:

Physiologie und Modelle der Spracherzeugung und des Hörens: Quelle-Filter-Modell, Filterbank-Modell der Cochlea; Maskierungseffekte;
Darstellung von Sprach- und Audiosignalen: Schätzung und Darstellung der Kurzzeit- und Langzeitstatistik in Zeit-, Frequenz- und Cepstralbereich; typische Beispiele, Visualisierungen;
Quellencodierung für Sprache und Audiosignale: Kriterien; skalare und vektorielle Codierung; lineare Prädiktion; Pitchprädiktion; Wellenform-/Parameter-/Hybrid-Codierung; Standards (ITU, GSM, ISO-MPEG)
Spracherkennung: Merkmalextraktion, Dynamic Time Warping, Hidden Markov Models
Grundprinzipien der Sprachsynthese: Text-to-Speech Systeme, modellbasierte und datenbasierte Synthese, PSOLA-Synthese
Signalverbesserung bei Signalaufnahme und -wiedergabe: Geräuschbefreiung, Echokompensation, Enthallung mittels ein- und mehrkanaliger Verfahren.

Empfohlene Literatur

Gemäß themenbezogenen Angaben in der Lehrveranstaltung

ECTS-Informationen:

Title:

Speech and Audio Signal Processing

Credits: 5

Prerequisites

Prerequisite: Lecture Signals and Systems I + II

Contents

The course concentrates on algorithms for speech and audio signal processing with applications in telecommunications and multimedia, especially

Human Speech Production and Hearing: Source-Filter-Model, Filterbank Model of Cochlea; Masking effects;
Signal Representation for Speech and Audio: Estimation and representation of short-term and long-term statistics in time domain, frequency domain, and cepstral domain; typical examples and visualisations;
Source Coding for Speech and Audio: criteria; scalar and vectorial quantization and coding; linear prediction; pitch prediction; waveform/ parameter/ hybrid coding; standards (ITU, GSM, ISO-MPEG)
Fundamental Concepts of Automatic Speech Recognition: Feature extraction, Dynamic Time Warping, Hidden Markov Models
Fundamental Concepts of Speech Synthesis: Text-to-Speech systems, modell-based and data-driven synthesis, PSOLA synthesis
Signal enhancement for acquisition and reproduction: Noise reduction, echo cancellation, dereverberation using single-channel and multichannel algorithms.

Literature

Recommendations for each topic are given during the lectures

Zusätzliche Informationen

Erwartete Teilnehmerzahl: 52, Maximale Teilnehmerzahl: 75
www: https://www.studon.fau.de/crs174396.html

Zugeordnete Lehrveranstaltungen

UE: Übung zur Sprach- und Audiosignalverarbeitung: www: https://www.studon.fau.de/crs174396.html

Verwendung in folgenden UnivIS-Modulen

Startsemester SS 2022:: Sprach- und Audiosignalverarbeitung (SAV)

Institution: Lehrstuhl für Multimediakommunikation und Signalverarbeitung



	UnivIS ist ein Produkt der Config eG, Buckenhof