Module

Informationssystem der Friedrich-Alexander-Universität Erlangen-Nürnberg

Sammlung/Stundenplan Modulbelegung

Home | Rechtliches | Kontakt | Hilfe

Suche:

Semester:



	Darstellung
		Druckansicht


		Modulbeschreibung (PDF)



	Außerdem im UnivIS
		Vorlesungs- und Modulverzeichnis nach Studiengängen Vorlesungsverzeichnis


		Veranstaltungskalender Stellenangebote Möbel-/Rechnerbörse

Sprach- und Audiosignalverarbeitung (SAV)5 ECTS
(englische Bezeichnung: Speech and Audio Signal Processing)
(Prüfungsordnungsmodul: Speech and Audio Signal Processing)
Modulverantwortliche/r: Walter Kellermann
Lehrende: Walter Kellermann, Christian Hümmer

weitere Studienfächer/Prüfungsordnungsmodule:
Einfrieren der UnivIS-Modul-Beschreibung: 1.3.2016
Wahlpflichtmodule aus Katalog für IuK (30245) Wahlpflichtmodul aus EEI im Schwerpunkt Eingebettete Systeme (32960) Wahlpflichtmodul aus EEI im Schwerpunkt Kommunikationsnetze (32961) Wahlpflichtmodul aus EEI im Schwerpunkt Multimediasysteme (32962) Wahlpflichtmodul aus EEI im Schwerpunkt Realisierung von Informations- und Kommunikationssystemen (32963) Information Technology - DSP (45827) Wahlpflichtmodul aus EEI im Schwerpunkt Eingebettete Systeme (87843) Wahlpflichtmodul aus EEI im Schwerpunkt Multimediasysteme (87851)

Startsemester: SS 2016 Dauer: 1 Semester Turnus: jährlich (SS)

Präsenzzeit: 60 Std. Eigenstudium: 90 Std. Sprache: Englisch

Lehrveranstaltungen:

Sprach- und Audiosignalverarbeitung
(Vorlesung, 3 SWS, Walter Kellermann, Do, 16:15 - 17:45, H6; Fr, 10:15 - 11:45, H15)

Übung zur Sprach- und Audiosignalverarbeitung
(Übung, 1 SWS, Christian Hümmer, Mi, 11:15 - 12:45, N 6.13; Fr, 8:15 - 9:45, N 6.13; Weitere Informationen sind unter http://lms.lnt.de/en/studies/educationalevents/summerterm2015.php?id=253 und ab Semesterbeginn auf StudOn zu finden)

Inhalt:

Die Vorlesung behandelt Grundlagen und Algorithmen der Verarbeitung von Sprach- und Audiosignalen mit Anwendungen in Telekommunikation und Multimedia, insbesondere:

Physiologie und Modelle der Spracherzeugung und des Hörens: Quelle-Filter-Modell, Filterbank-Modell der Cochlea; Maskierungseffekte;

Darstellung von Sprach- und Audiosignalen: Schätzung und Darstellung der Kurzzeit- und Langzeitstatistik in Zeit-, Frequenz- und Cepstralbereich; typische Beispiele, Visualisierungen;

Quellencodierung für Sprache und Audiosignale: Kriterien; skalare und vektorielle Codierung; lineare Prädiktion; Pitchprädiktion; Wellenform-/Parameter-/Hybrid-Codierung; Standards (ITU, GSM, ISO-MPEG)

Spracherkennung: Merkmalextraktion, Dynamic Time Warping, Hidden Markov Models

Grundprinzipien der Sprachsynthese: Text-to-Speech Systeme, modellbasierte und datenbasierte Synthese, PSOLA-Synthese

Signalverbesserung bei Signalaufnahme und –wiedergabe: Geräuschbefreiung, Echokompensation, Enthallung mittels ein- und mehrkanaliger Verfahren;

Lernziele und Kompetenzen:

Die Studierenden

verstehen die grundlegenden physiologischen Mechanismen der Spracherzeugung und des Hörens beim Menschen und können diese zur Analyse von Sprach- und Audiosignalen anwenden

wenden die grundlegenden Methoden zur Schätzung und Darstellung der Kurzzeit- und Langzeitstatistik von Sprach- und Audiosignalen an und können diese damit analysieren

verstehen die aktuellen Methoden zur Quellencodierung von Sprache-und Audiosignalen und können aktuelle Codierstandards analysieren

verstehen die Grundbausteine von Spracherkennungssystemen und können deren Funktion mittels Rechnersimulation analysieren

verstehen die Grundprinzipien von Text-to-Speech Systemen und können elementare Algorithmen zur Sprachsynthese anwenden

können elementare Algorithmen zur Signalverbesserung anwenden und für reale Daten analysieren

Literatur:

Gemäß themenbezogenen Angaben in der Lehrveranstaltung

Organisatorisches:

Signale und Systeme I +II

Verwendbarkeit des Moduls / Einpassung in den Musterstudienplan:

Elektrotechnik, Elektronik und Informationstechnik (Master of Science)
(Po-Vers. 2015s | TechFak | Elektrotechnik, Elektronik und Informationstechnik (Master of Science) | Masterprüfung | Studienrichtung Informationstechnik | Vertiefungsmodule Informationstechnik | Speech and Audio Signal Processing)

Dieses Modul ist daneben auch in den Studienfächern "123#67#H", "Berufspädagogik Technik (Master of Education)", "Communications and Multimedia Engineering (Master of Science)", "Computational Engineering (Rechnergestütztes Ingenieurwesen) (Master of Science)", "Elektrotechnik, Elektronik und Informationstechnik (Bachelor of Science)", "Informations- und Kommunikationstechnik (Bachelor of Science)", "Informations- und Kommunikationstechnik (Master of Science)", "Wirtschaftsingenieurwesen (Master of Science)" verwendbar. Details

Studien-/Prüfungsleistungen:

Speech and Audio Signal Processing (Prüfungsnummer: 64601)

(englischer Titel: Speech and Audio Signal Processing)

zugeh. "mein campus"-Prüfung:
64601 Speech and Audio Signal Processing (Prüfung, Form: schriftlich oder mündlich, Drittelnoten (mit 4,3), Dauer: -, 5 ECTS, Prüfung).
Prüfungsleistung, Klausur, Dauer (in Minuten): 90, benotet, 5 ECTS

Anteil an der Berechnung der Modulnote: 100.0 %

Erstablegung: SS 2016, 1. Wdh.: WS 2016/2017

1. Prüfer: Walter Kellermann (100247)

Termin: 04.10.2016, 13:30 Uhr, Ort: Tentoria
Termin: 11.04.2017, 14:00 Uhr, Ort: LS
Termin: 02.10.2017, 11:00 Uhr, Ort: H 11
Termin: 27.03.2018, 11:00 Uhr, Ort: H 10 TechF



	UnivIS ist ein Produkt der Config eG, Buckenhof

Sprach- und Audiosignalverarbeitung (SAV)5 ECTS(englische Bezeichnung: Speech and Audio Signal Processing) (Prüfungsordnungsmodul: Speech and Audio Signal Processing)

weitere Studienfächer/Prüfungsordnungsmodule:

Lehrveranstaltungen:

Inhalt:

Lernziele und Kompetenzen:

Literatur:

Organisatorisches:

Verwendbarkeit des Moduls / Einpassung in den Musterstudienplan:

Studien-/Prüfungsleistungen:

Speech and Audio Signal Processing (Prüfungsnummer: 64601)

Sprach- und Audiosignalverarbeitung (SAV)5 ECTS
(englische Bezeichnung: Speech and Audio Signal Processing)
(Prüfungsordnungsmodul: Speech and Audio Signal Processing)