"Alignment": Maschinelle Text-Ton-Synchronisation
Technische Details
Der IDS-Aligner läuft derzeit unter dem Betriebssystem LINUX.
Er besteht grob aus den Komponenten:
- Grafische Oberfläche (optional),
- Steuerungsmechanismen,
- Aussprachewörterbuch (optional)
- Regelbasierter Phonetisierer mit
- multilingualen Regeln,
- der Möglichkeit Aussprachevarianten zu erzeugen,
- Modelle für Phoneme (Hidden Markov Modelle),
- Modelle für die Behandlung von Simultanpassagen und nicht transkribierten nonverbalen Phänomenen,
- Spezifische Spracherkennungsmodule (HTK),
- Diverse Hilfsprogramme.
 
Besonderheiten:
- Die Funktionalität des Phonetisierers versetzt den Aligner in die Lage,
- auch Diskurse zu verarbeiten, die nicht standardsprachlich transliteriert worden sind.
- prinzipiell auch Aussprachevarianten zu erkennen (bedarf jedoch noch Verbesserungen in nicht geringem Umfang beim Training).
- Es gibt Optionen zum automatischen Einfügen von Zeitmarken für nicht transliterierte nonverbale Ereignisse.
- Simultanpassagen können dem Aligner in Form von Alternativen zur Auswahl übergeben werden.
- Selbst standardsprachliche Transliterationen von Dialektaufnahmen wurden zufriedenstellend synchronisiert.
- Die Länge der Audiodateien spielt bei der Bearbeitung keine Rolle, solange Haupt- und Festplattenspeicher keinen Engpass aufweisen (Audiodateien von bis zu 2h40m Länge wurden getestet).
- Das Antwortverhalten des Aligners hängt ab von dem verwendeten Rechner, der akustischen Qualität des zu untersuchenden Materials und den gewählten Optionen (s.o.).