-
Versionen
VersionDatum=13-02-2012ID=2.0_beta
Beta-Release mit Transkripten im DGD1-Format
VersionDatum=19-12-2012ID=2.0
Erstes offizielles Release mit Transkripten im
FLN-Format
VersionDatum=01-07-2015ID=2.5
Ortsdaten ergänzt
VersionDatum=04-02-2022ID=2.17
Um ein Transkript erweitert
Namelang=de
Deutsche Mundarten: ehemalige deutsche Ostgebiete
Namelang=en
German Dialects: Former German Eastern Territories
Sonstige_Bezeichnungen
OS ; IV ; TAVM
Korpus_Projekt_Kurzbeschreibunglang=de
Das Korpus Deutsche Mundarten: ehemalige deutsche
Ostgebiete (OS--) wurde vom Deutschen Spracharchiv (DSAv) in Zusammenarbeit mit dem
Forschungsinstitut für deutsche Sprache „Deutscher Sprachatlas“ (Marburg) erstellt.
Zur
Ergänzung des Korpus Deutsche Mundarten: Zwirner-Korpus (ZW--) wurde eine Erhebung
durchgeführt,
die das Ziel hatte, die Dialekte des geschlossenen deutschen Sprachgebiets im ehemaligen
deutschen Osten und der deutschen Sprachinseln in Ost- und Südosteuropa möglichst
umfänglich zu
dokumentieren. Weitere Projektinformationen sind veröffentlicht in: Bellmann, Günter
/ Göschel,
Joachim (1970): Tonbandaufnahme ostdeutscher Mundarten 1962-1965. Gesamtkatalog. Marburg
(= DDG
73). Das Korpus OS-- umfasst 981 Tonaufnahmen aus der Zeit von 1962 bis 1965 mit einer
Gesamtdauer von 462 Stunden und 5 Minuten. Es handelt sich um Aufnahmen mit 987 älteren
Übersiedlern (Frauen und Männer) aus den ehemaligen deutschen Ostgebieten, Sprecher
ost- und
südostdeutscher Dialekte, die den Sprachstand vor 1945 repräsentieren. Aufgenommen
wurden
Sprechereignisse unterschiedlicher Art, v.a. Erzählungen, Unterhaltungen und Standardtexte
(Wochentage, Zahlen, Wenkersätze). Die Aufnahmen wurden im Archiv für Gesprochenes
Deutsch (AGD)
(früher: Deutsches Spracharchiv) digitalisiert. 281 im AGD digitalisierte und mit
dem Ton
synchronisierte (alignierte) Transkripte (an der alten Orthographie orientierte hochsprachliche
Übertragung, Erläuterungen der Transkribenten, Lemmatisierung, POS-Tagging) sind archiviert.
Anhand der Metadaten wurden eine Themenliste, eine Liste der sprachlichen Besonderheiten
und
eine Liste der Berufe der Sprecher erstellt. Außerdem gibt es alphabetisch und nach
Frequenzen
geordnete Wort- und Lemmalisten. Das Korpus OS-- wird in der Datenbank für Gesprochenes
Deutsch
(DGD) bereitgestellt, einzelne Aufnahmen können auch im persönlichen Service des AGD
weitergegeben werden.
Korpus_Projekt_Kurzbeschreibunglang=en
The corpus "Deutsche Mundarten: ehemalige deutsche
Ostgebiete" ["German Dialects: Former German Eastern Territories"] (OS--) was compiled
by the
German Language Archive (DSAv) in cooperation with the Research Institute for the
German
Language "German Language Atlas" (Marburg). In order to complement the corpus "Deutsche
Mundarten: Zwirner-Korpus" ["German Dialects: Zwirner-Korpus"] (ZW--), the two institutions
undertook a data collection effort with the aim of documenting, to the extent possible,
the
dialects of the contiguous German language area in the former German East as well
as the German
language enclaves in Eastern and South-Eastern Europe. Additional project information
is
published in: Bellmann, Günter / Göschel, Joachim (1970): Tonbandaufnahme ostdeutscher
Mundarten
1962-1965. Gesamtkatalog. Marburg (= DDG 73). [Bellmann, Günter / Göschel, Joachim
(1970): Tape
recording of East German dialects 1962-1965, complete catalogue. Marburg (= DDG 73).]
The corpus
OS-- comprises 981 sound recordings made in the years from 1962 to 1965 with a total
duration of
462 hours and 5 minutes. These are recordings with 987 elderly resettled ethnic Germans
(women
and men) from the former German Eastern territories who are speakers of East and Southeast
German dialects, representing the state of their language varieties of German before
1945.
Recordings were made of various types of speech events, especially narratives, conversations
and
standard texts (weekdays, numbers, phrases of remembrance). The recordings were digitized
at the
Archiv für Gesprochenes Deutsch (AGD) (formerly: Deutsches Spracharchiv). The AGD
archive holds
281 transcripts that it digitized and synchronized (aligned) to the audio. The textual
transcriptions hew close to the standard language and follow the old orthography.
They come with
additional notes by the transcribers, lemmatization, and POS tagging. Based on the
metadata, a
list of topics, a list of linguistic peculiarities and a list of the professions of
the speakers
were created. Also available are word and lemma lists ordered alphabetically and by
frequency.
The corpus OS-- can be accessed via the Database for Spoken German (DGD). Individual
sound
recordings and transcripts can also be provided for download or on physical media
via the
personal service of the AGD.
Deskriptoren
gesprochene deutsche Sprache ; Dialekt ; deutsche Sprachinsel ; Osteuropa ;
Südosteuropa ; Tonaufnahme ; Transkript ; Themenliste ; Liste der sprachlichen Besonderheiten
;
Liste der Berufe der Sprecher ; Wortliste ; Lemmaliste
-
ErstellungsprojektTitel=Tonbandaufnahme ostdeutscher Mundarten
Ort
Nicht dokumentiert
Institut
Forschungsinstitut für deutsche Sprache „Deutscher Sprachatlas“ ; Deutsches
Spracharchiv
Typ
DFG
Leiter
L. E. Schmitt ; Eberhard Zwirner
Auskunft
Nicht vorhanden
Laufzeit
Nicht dokumentiert
Zentrale_Publikationen
Bellmann, Günter / Göschel, Joachim (1970): Tonbandaufnahme ostdeutscher
Mundarten 1962-1965. Gesamtkatalog. Marburg (= DDG 73).
-
Aufzeichnungsobjekte
+
Ereignisse_Basisdaten
Anzahl
981
Beschreibung
Geplante Aufnahmeaktionen
Länder_Regionen_Orte
Deutschland ; Österreich ; Tschechische Republik
Institutionen
Forschungsinstitut für deutsche Sprache „Deutscher Sprachatlas“ ; Deutsches
Spracharchiv
Räumlichkeiten
Wohnungen der Sprecher
Zeit
1962-1965
Anmerkungen
In den Ereignisdokumenten werden z.T. historische Ortsbezeichnungen verwendet.
Die in den Ereignisdokumenten verzeichneten Planquadrate sind in mehreren Karten
dokumentiert (vgl. Eberhard Zwirner / Wolfgang Bethge (1958): Erläuterungen zu den
Texten.
Lautbibliothek der deutschen Mundarten. Göttingen)
Rundfunksendungen
Nicht vorhanden
+
Sprechereignisse
+
Basisdaten
Anzahl
981
Arten
Erzählung ; Vortrag ; Vorlesen ; Standardtexte (Wochentage, Zahlen,
Wenkersätze)
Forscherbeteiligung
Verbal beteiligt ; Nicht dokumentiert
Elizitiertheit
Elizitiert
Mediale_Realisierung
Face-to-face
Öffentlichkeitsgrad
Nicht öffentlich
Vorgaben
Nicht dokumentiert
Sprachen
Deutsch ; Polnisch
+
Inhalte
Beschreibung
Nicht vorhanden
Themen
vgl. Zusatzmaterial - Themenliste
+
Sprecher
Anzahl
987 dokumentiert
Beschreibung
Ältere Sprecher ost- und südostdeutscher Dialekte, die den Sprachstand vor 1945
repräsentieren
Anmerkungen
Es gibt detaillierte Sprecherdaten. In den Sprecherdokumenten werden z.T.
historische Ortsbezeichnungen verwendet. Die in den Sprecherdokumenten verzeichneten
Planquadrate sind in mehreren Karten dokumentiert (vgl. Eberhard Zwirner / Wolfgang
Bethge
(1958): Erläuterungen zu den Texten. Lautbibliothek der deutschen Mundarten.
Göttingen)
-
Korpusbestandteile
+
QuellaufnahmenTyp=Audio
+
Basisdaten
Anzahl
981
Relation_zu_Ereignissen
Nicht dokumentiert
Herkunft
Erstellungsprojekt
+
Aufnahmetechnik
Aufnahmegeräte
Magnetophon M5 von Telefunken
Mikrofone
Kugelförmiges Tauchspulenmikrophon M 19 b von Beyer ; kugelförmiges
Tauchspulenmikrophon M 100 von Beyer
AufnahmegeschwindigkeitEinheit=cm/s
19,05
+
DistributionStelle=Nicht vorhanden
+
ZugänglichkeitArt=Nicht vorhanden
Kontakt
Nicht vorhanden
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
Nicht vorhanden
+
SE-AufnahmenTyp=Audio
+
Basisdaten
Anzahl
981
+
Dauer
Einzelne_Aufnahmen
5 Minuten, 19 Sekunden bis 1 Stunde, 16 Minuten
Gesamtdauer
460 Stunden, 52 Minuten
Schutzbedürftige_Daten
Nicht vorhanden
Relation_zu_Quellaufnahmen
Vollständig
Relation_zu_Sprechereignissen
Vollständig
+
Transkribierte_SE-Aufnahmen
Anzahl
281
SE-Arten
Erzählung ; Vortrag ; Vorlesen; z.T. Wochentage und Zahlen
Dauer
Nicht dokumentiert
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
981
DateigrößeEinheit=Byte
146869358076
Datenschutz
Nicht vorhanden
+
Tontechnische_Daten
Format
WAVE
Codec
PCM
Kanäle
Mono
AbtastrateEinheit=Hz
44100
QuantisierungsrateEinheit=Bit
16
DatenrateEinheit=kBit/s
705
Datenrate_Modus
konstant
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Anhören von Aufnahmeausschnitten in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Erwerb im Rahmen des AGD-Service
Kontakt
agd@ids-mannheim.de
Kosten
Gemäß Preisliste
Kosten_URL
http://agd.ids-mannheim.de/konditionen.shtml
Zugang_URL
Nicht vorhanden
+
TranskripteTyp=TT_01
+
Basisdaten
Anzahl
281
Schutzbedürftige_Daten
Nicht vorhanden
Relation_zu_SE-Aufnahmen
Unvollständig
+
AnnotationenTyp=ANT_01
+
Basisdaten
Bezeichnung_in_Transkripten
Nicht vorhanden
Spezifikation
An der alten Orthographie orientierte hochsprachliche Übertragung ;
Erläuterungen der Transkribenten ; Lemmatisierung ; POS-Tagging
Konventionen
Projektspezifisch
Zeicheninventar
Deutsches Alphabet
+
ErstellungTyp=ERT_01
Spezifikation
Ersterstellung
Projekt
Nicht dokumentiert
Instrumente
Nicht dokumentiert
+
Ergebnisse_UmfangDefinition_Einheiten=Wort(segment/verschleifung)
Types:
30270
Tokens:
838022
+
ErstellungTyp=ERT_02
Spezifikation
Digitalisierung von ERT_01 und Bearbeitung für DGD1
Projekt
Datenbank Gesprochenes Deutsch
Instrumente
Nicht dokumentiert
+
Ergebnisse_UmfangDefinition_Einheiten=Wort(segment/verschleifung)
Types:
30270
Tokens:
838022
+
ErstellungTyp=ERT_DB1
Spezifikation
Konvertierung von HTML-Fassung der DGD1
Projekt
Datenbank für Gesprochenes Deutsch
Instrumente
Java ; Stuttgart-Tübingen-Tagset (STTS) ; TreeTagger
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
30270
Tokens:
838022
+
AlignmentTyp=ALT_01
Spezifikation
Wortweise
+
HerstellungErstellung_Typ=ERT_02
Anzahl:
276
Projekt:
Datenbank Gesprochenes Deutsch
Verfahren_Instrumente:
Automatisch ; IDS-Aligner
+
AlignmentTyp=ALT_02
Spezifikation
Pseudoalignment
+
HerstellungErstellung_Typ=ERT_DB1
Anzahl:
4
Projekt:
Datenbank für Gesprochenes Deutsch
Verfahren_Instrumente:
Java
+
AlignmentTyp=ALT_03
Spezifikation
Manuelles Alignment
+
HerstellungErstellung_Typ=ERT_DB1
Anzahl:
1
Projekt:
Archiv für Gesprochenes Deutsch
Verfahren_Instrumente:
EXMARaLDA Partitur-Editor
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
276
DateigrößeEinheit=Byte
144387669
Inhalt
ANT_01, ERT_DB1, ALT_01
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
Digitale_FassungenTyp=DFT_02
+
Basisdaten
Anzahl
4
DateigrößeEinheit=Byte
1019721
Inhalt
ANT_01, ERT_DB1, ALT_02
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
Digitale_FassungenTyp=DFT_03
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
445502
Inhalt
ANT_01, ERT_DB1, ALT_03
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Recherchen in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Transkriptionskonventionen
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
12077
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Themenliste
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
79103
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Liste der sprachlichen Besonderheiten
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
35145
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Wortlisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Thomas Schmidt
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
1460552
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Lemmalisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Thomas Schmidt
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
1170302
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Liste der Berufe der Sprecher
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
74122
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Notizen für interne Zwecke
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
11720
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Nicht vorhanden
+
ZugänglichkeitArt=Nicht vorhanden
Kontakt
Nicht vorhanden
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
Nicht vorhanden
-
Dokumentationsgeschichte
UpdateDatum=2021-06-24
Anmerkungen
In dem 1992 publizierten Gesamtkatalog der Tonaufnahmen des Deutschen Spracharchivs
und in der DGD sind drei OS-Aufnahmen mit Sperrvermerken verzeichnet. Diese Materialien
wurden
in der DGD nicht berücksichtigt. Für sechs OS-Ereignisse gibt es im DSAv-Katalog und
in der
DGD jeweils zwei Einträge. Für die DGD wurden diese Einträge in jeweils einem Dokument
zusammengefasst. Die Text-Ton-Synchronisation (Alignment) ist defizitär. Im Jahr 2015
wurden
die Angaben für westeuropäische Orte in Ereignis- und Sprecherdokumenten überprüft
und an die
aktuelle Verwaltungsliederung angepasst.