|
Speech and Language Understanding (SLU)5 ECTS (englische Bezeichnung: Speech and Language Understanding)
Modulverantwortliche/r: Andreas Maier, Seung Hee Yang Lehrende:
Andreas Maier, Seung Hee Yang, Abner Hernandez
Start semester: |
SS 2022 | Duration: |
1 semester | Cycle: |
jährlich (SS) |
Präsenzzeit: |
60 Std. | Eigenstudium: |
90 Std. | Language: |
Englisch |
Lectures:
Inhalt:
Nach Behandlung der grundlegenden Mechanismen menschlicher Spracherzeugung und Sprachwahrnehmung
gibt die Vorlesung eine detaillierte Einführung in (vornehmlich) statistisch orientierte Methoden der
maschinellen Erkennung gesprochener Sprache.
Schwerpunktthemen sind Merkmalgewinnung, Vektorquantisierung,
akustische Sprachmodellierung mit Hilfe von Markovmodellen, linguistische Sprachmodellierung mit Hilfe
stochastischer Grammatiken, prosodische Information
sowie Suchalgorithmen zur Beschleunigung des Dekodiervorgangs.
After focussing on of the basic mechanisms of human speech generation and speech perception the lecture gives a detailed introduction to (mainly) statistically oriented methods of automatic recognition of spoken language.
Main topics are feature extraction, vector quantization, acoustic speech modeling with the help of Markov models, linguistic speech modeling with the help of stochastic grammars, prosodic information as well as search algorithms to speed up the decoding process.
Lernziele und Kompetenzen:
Die Studierenden
verstehen die Grundlagen der menschlichen Sprachproduktion und die akustischen Eigenschaften unterschiedlicher Phonemklassen
erklären den allgemeinen Aufbau eines Mustererkennungssystems
verstehen Abtastung, das Abtasttheorem und Quantisierung in Bezug auf Sprachsignale
verstehen die Fourier-Transformation und mathematische Modelle der Sprachproduktion
verstehen harte und weiche Vektorquantisierungsmethoden
verstehen unüberwachtes Lernen (EM-Algorithmus)
verstehen Hidden Markov-Modelle (HMMs)
erklären stochastische Sprachmodelle
The students
understand the principles of human speech production and acoustic properties of the different phoneme classes
explain the general pipeline of a pattern recognition system
understand sampling, the sampling theorem, and quantization w.r.t. speech signals
understand Fourier transformation and mathematical models of speech production
understand hard and soft vector quantization methods
understand unsupervised learning (EM-algorithm)
understand Hidden Markov Models (HMMs)
explain stochastic language models
Literatur:
- Niemann H.: Klassifikation von Mustern; Springer, Berlin 1983
Niemann H.: Pattern Analysis and Understanding; Springer, Berlin 1990
Schukat-Talamazzini E.G.: Automatische Spracherkennung;
Vieweg, Wiesbaden 1995
Rabiner L.R., Schafer R.: Digital Processing of Speech Signals;
Prentice Hall, New Jersey 1978
Rabiner L.R., Juang B.H.: Fundamentals of Speech Recognition;
Prentice Hall, New Jersey 1993
Weitere Informationen:
Keywords: Mustererkennung, Merkmale, HMM, Sprachmodelle, Prosodie, Suchalgorithmen
Verwendbarkeit des Moduls / Einpassung in den Musterstudienplan: Das Modul ist im Kontext der folgenden Studienfächer/Vertiefungsrichtungen verwendbar:
- Artificial Intelligence (Master of Science)
(Po-Vers. 2021s | TechFak | Artificial Intelligence (Master of Science) | Gesamtkonto | Wahlpflichtmodulbereich | Subsymbolic AI/Machine Learning | Speech and Language Processing)
- Data Science (Master of Science)
(Po-Vers. 2021w | Gesamtkonto | Anwendungsfächer | Artificial intelligence in biomedical engineering (AIBE) | Speech and Language Processing)
- Informatik (Bachelor of Science)
(Po-Vers. 2009s | TechFak | Informatik (Bachelor of Science) | Wahlpflichtbereich (5. und 6. Semester) | Wahlpflichtmodule | Vertiefungsrichtung Mustererkennung | Speech and Language Processing)
- Informatik (Bachelor of Science)
(Po-Vers. 2009w | TechFak | Informatik (Bachelor of Science) | Gesamtkonto | Wahlpflichtbereich (5. und 6. Semester) | Wahlpflichtmodule | Vertiefungsrichtung Mustererkennung | Speech and Language Processing)
- Informatik (Bachelor of Science)
(Po-Vers. 2022w | TechFak | Informatik (Bachelor of Science) | Gesamtkonto | Wahlpflichtbereich (Wahlpflichtmodule aus mind. 2 Vertiefungsrichtungen) | Vertiefungsrichtung Mustererkennung | Speech and Language Processing)
- Informatik (Master of Science)
(Po-Vers. 2010 | TechFak | Informatik (Master of Science) | Gesamtkonto | Wahlpflichtbereich | Säule der anwendungsorientierten Vertiefungsrichtungen | Vertiefungsrichtung Mustererkennung | Speech and Language Processing)
- Information and Communication Technology (Master of Science)
(Po-Vers. 2019s | TechFak | Information and Communication Technology (Master of Science) | Gesamtkonto | Wahlmodule | Wahlmodule aus dem Angebot von EEI und Informatik | Speech and Language Processing)
- Mathematik (Bachelor of Science)
(Po-Vers. | NatFak | Mathematik (Bachelor of Science) | Module des Nebenfachs | Nebenfach Informatik | Vertiefungsmodule | Vertiefungsrichtung Mustererkennung | Speech and Language Processing)
- Mathematik (Bachelor of Science)
(Po-Vers. 2019w | NatFak | Mathematik (Bachelor of Science) | weitere Module der Bachelorprüfung | Module des Nebenfachs | Nebenfach Informatik | Vertiefungsmodule | Vertiefungsrichtung Mustererkennung | Speech and Language Processing)
- Medizintechnik (Bachelor of Science)
(Po-Vers. 2013 | TechFak | Medizintechnik (Bachelor of Science) | Gesamtkonto | Vertiefungsmodule ET/INF | Vertiefungsmodule aus dem Sockel beider Studienrichtungen | Speech and Language Processing)
- Medizintechnik (Bachelor of Science)
(Po-Vers. 2013 | TechFak | Medizintechnik (Bachelor of Science) | Gesamtkonto | Vertiefungsmodule MB/WW/CBI | Vertiefungsmodule aus dem Sockel beider Studienrichtungen | Speech and Language Processing)
- Medizintechnik (Bachelor of Science)
(Po-Vers. 2018w | TechFak | Medizintechnik (Bachelor of Science) | Gesamtkonto | Pflicht- und Wahlpflichtmodule der Studienrichtung Medizinelektronik, medizinische Bild- und Datenverarbeitung (Modulgruppen B5 und B8) | B8 Wahlpflichtmodule der Studienrichtung Medizinelektronik, medizinische Bild- und Datenverarbeitung | Vertiefungsmodule ET/INF | Speech and Language Processing)
- Medizintechnik (Bachelor of Science)
(Po-Vers. 2018w | TechFak | Medizintechnik (Bachelor of Science) | Gesamtkonto | Pflicht- und Wahlpflichtmodule der Studienrichtung Medizinische Gerätetechnik, Produktionstechnik und Prothetik (Modulpruppen B6 und B8) | B8 Wahlpflichtmodule der Studienrichtung Medizinische Gerätetechnik, Produktionstechnik und Prothetik | Vertiefungsmodule MB/WW/CBI | Speech and Language Processing)
- Medizintechnik (Master of Science)
(Po-Vers. 2013 | TechFak | Medizintechnik (Master of Science) | Studienrichtung Medizinische Bild- und Datenverarbeitung | M5 Medizintechnische Vertiefungsmodule (BDV) | Speech and Language Processing)
- Medizintechnik (Master of Science)
(Po-Vers. 2018w | TechFak | Medizintechnik (Master of Science) | Studienrichtung Medizinische Bild- und Datenverarbeitung | M5 Medizintechnische Vertiefungsmodule (BDV) | Speech and Language Processing)
- Medizintechnik (Master of Science)
(Po-Vers. 2019w | TechFak | Medizintechnik (Master of Science) | Modulgruppen M1, M2, M3, M5, M7 nach Studienrichtungen | Studienrichtung Medizinische Bild- und Datenverarbeitung | M5 Medizintechnische Vertiefungsmodule (BDV) | Speech and Language Processing)
- Medizintechnik (Master of Science)
(Po-Vers. 2019w | TechFak | Medizintechnik (Master of Science) | Modulgruppen M1, M2, M3, M5, M7 nach Studienrichtungen | Study Field Health and Medical Data Analytics | M5 Medical Engineering specialisation modules (HMDA) | Speech and Language Processing)
- Wirtschaftsinformatik (Bachelor of Science)
(Po-Vers. 2018w | ReWiFak | Wirtschaftsinformatik (Bachelor of Science) | Gesamtkonto | Kernbereich (Fachkompetenz) | Informatik | Speech and Language Processing)
- Wirtschaftsinformatik (Bachelor of Science)
(Po-Vers. 2020w | ReWiFak | Wirtschaftsinformatik (Bachelor of Science) | Gesamtkonto | Wahlpflichtbereiche | Wahlpflichtbereich Informatik | Speech and Language Processing)
Studien-/Prüfungsleistungen:
Speech and Language Processing (Prüfungsnummer: 44551)
- Prüfungsleistung, Klausur, Dauer (in Minuten): 60, benotet, 5 ECTS
- Anteil an der Berechnung der Modulnote: 100.0 %
- Prüfungssprache: Englisch
- Erstablegung: SS 2022, 1. Wdh.: WS 2022/2023
|
|
|