UnivIS
Informationssystem der Friedrich-Alexander-Universität Erlangen-Nürnberg © Config eG 
FAU Logo
  Sammlung/Stundenplan    Modulbelegung Home  |  Rechtliches  |  Kontakt  |  Hilfe    
Suche:      Semester:   
 
 Darstellung
 
Druckansicht

 
 
 Außerdem im UnivIS
 
Vorlesungs- und Modulverzeichnis nach Studiengängen

Vorlesungsverzeichnis

 
 
Veranstaltungskalender

Stellenangebote

Möbel-/Rechnerbörse

 
 
>>

  Sprach- und Audiosignalverarbeitung (SASP)

Dozent/in
Prof. Dr.-Ing. Walter Kellermann

Angaben
Vorlesung
3 SWS, benoteter Schein, ECTS-Studium, ECTS-Credits: 5
nur Fachstudium, Sprache Englisch
Zeit und Ort: Mo, Di 12:15 - 13:45, H5

Studienfächer / Studienrichtungen
WPF EEI-BA-INT 5-6
WPF EEI-MA-INT 1-4
WPF CE-MA-TA-IT 1-4
WPF IuK-MA-ES-EEI 1-4
WPF IuK-MA-KN-EEI 1-4
WPF IuK-MA-MMS-EEI 1-4
WPF IuK-MA-REA-EEI 1-4
WPF IuK-BA 5-6
WPF ICT-MA-ES 1-4
WPF ICT-MA-MPS 1-4
WPF WING-MA 1-3
WPF WING-MA-ET-IT ab 2
PF CME-MA 2
WPF ASC-MA 1-4
WPF MT-MA-MEL 1-4

Voraussetzungen / Organisatorisches
Voraussetzung: Vorlesung Signale und Systeme I +II

Die Vorlesungen werden semesterbegleitend aufgezeichnet und über StudOn zur Verfügung gestellt bis ein regulärer Präsenzbetrieb wieder möglich ist. Bei StudOn finden Sie ebenfalls das Vorlesungsskript als PDF-Datei sowie aktuelle Informationen zur Vorlesung und Übung.

Inhalt
Die Vorlesung behandelt Grundlagen und Algorithmen der Verarbeitung von Sprach- und Audiosignalen mit Anwendungen in Telekommunikation und Multimedia, insbesondere:
  • Physiologie und Modelle der Spracherzeugung und des Hörens: Quelle-Filter-Modell, Filterbank-Modell der Cochlea; Maskierungseffekte;

  • Darstellung von Sprach- und Audiosignalen: Schätzung und Darstellung der Kurzzeit- und Langzeitstatistik in Zeit-, Frequenz- und Cepstralbereich; typische Beispiele, Visualisierungen;

  • Quellencodierung für Sprache und Audiosignale: Kriterien; skalare und vektorielle Codierung; lineare Prädiktion; Pitchprädiktion; Wellenform-/Parameter-/Hybrid-Codierung; Standards (ITU, GSM, ISO-MPEG)

  • Spracherkennung: Merkmalextraktion, Dynamic Time Warping, Hidden Markov Models

  • Grundprinzipien der Sprachsynthese: Text-to-Speech Systeme, modellbasierte und datenbasierte Synthese, PSOLA-Synthese

  • Signalverbesserung bei Signalaufnahme und -wiedergabe: Geräuschbefreiung, Echokompensation, Enthallung mittels ein- und mehrkanaliger Verfahren.

Empfohlene Literatur
Gemäß themenbezogenen Angaben in der Lehrveranstaltung

ECTS-Informationen:
Title:
Speech and Audio Signal Processing

Credits: 5

Prerequisites
Prerequisite: Lecture Signals and Systems I + II
Recordings of each lecture will be made availabe via StudOn until regular face-to-face events can take place again. On StudOn, you also find the lecture notes as PDF file as well as the latest information about the lecture and its supplements.

Contents
The course concentrates on algorithms for speech and audio signal processing with applications in telecommunications and multimedia, especially
  • Human Speech Production and Hearing: Source-Filter-Model, Filterbank Model of Cochlea; Masking effects;

  • Signal Representation for Speech and Audio: Estimation and representation of short-term and long-term statistics in time domain, frequency domain, and cepstral domain; typical examples and visualisations;

  • Source Coding for Speech and Audio: criteria; scalar and vectorial quantization and coding; linear prediction; pitch prediction; waveform/ parameter/ hybrid coding; standards (ITU, GSM, ISO-MPEG)

  • Fundamental Concepts of Automatic Speech Recognition: Feature extraction, Dynamic Time Warping, Hidden Markov Models

  • Fundamental Concepts of Speech Synthesis: Text-to-Speech systems, modell-based and data-driven synthesis, PSOLA synthesis

  • Signal enhancement for acquisition and reproduction: Noise reduction, echo cancellation, dereverberation using single-channel and multichannel algorithms.

Literature
Recommendations for each topic are given during the lectures

Zusätzliche Informationen
Erwartete Teilnehmerzahl: 52, Maximale Teilnehmerzahl: 75
www: https://www.studon.fau.de/crs174396.html

Zugeordnete Lehrveranstaltungen
UE: Übung zur Sprach- und Audiosignalverarbeitung
Dozent/in: Mhd Modar Halimeh, M. Sc.
www: https://www.studon.fau.de/crs174396.html

Verwendung in folgenden UnivIS-Modulen
Startsemester SS 2020:
Sprach- und Audiosignalverarbeitung (SAV)

Institution: Lehrstuhl für Multimediakommunikation und Signalverarbeitung
UnivIS ist ein Produkt der Config eG, Buckenhof