-
Versionen
VersionDatum=13-02-2012ID=2.0_beta
Beta-Release mit Transkripten im DGD1-Format
VersionDatum=19-12-2012ID=2.0
Erstes offizielles Release mit Transkripten im
FLN-Format
VersionDatum=01-07-2015ID=2.5
Ortsdaten ergänzt
VersionDatum=04-02-2022ID=2.17
Um ein Transkript erweitert
Namelang=de
Deutsche Mundarten: ehemalige deutsche Ostgebiete
Namelang=en
German Dialects: Former German Eastern Territories
Sonstige_Bezeichnungen
OS ; IV ; TAVM
Korpus_Projekt_Kurzbeschreibunglang=de
Das Korpus Deutsche Mundarten: ehemalige deutsche Ostgebiete (OS--) wurde vom Deutschen
Spracharchiv (DSAv) in Zusammenarbeit mit dem Forschungsinstitut für deutsche Sprache
„Deutscher Sprachatlas“ (Marburg) erstellt. Projektleiter waren Eberhard Zwirner (DSAv)
und Ludwig Erich Schmidt (Deutscher Sprachatlas). Zur Ergänzung des Korpus Deutsche
Mundarten: Zwirner-Korpus (ZW--) wurde eine Erhebung durchgeführt, die das Ziel hatte,
die im Korpus ZW-- nur nach zufälliger Streuung am Aufnahmeort erfassten Dialekte
des geschlossenen deutschen Sprachgebiets im ehemaligen deutschen Osten und der deutschen
Sprachinseln in Ost- und Südosteuropa möglichst umfänglich zu dokumentieren.
Die Erhebung fand statt in der gesamten alten BRD (oftmals in Flüchtlingslagern und
den neu entstandenen sog. „Flüchtlingsstädten“), in Österreich (um Salzburg) sowie
im nordböhmischen Gebiet um Gablonz (Jablonec nad Nisou) in der damaligen Tschechoslowakei
mit im ursprünglichen Siedlungsgebiet verbliebenen Sprechern. Das DSAv übernahm mit
seinen Toningenieuren und dem Aufnahmewagen die technische Betreuung der Aufnahmen.
Dem „Deutschen Sprachatlas“ oblag die sprachwissenschaftliche und inhaltliche Betreuung,
so dass der Schwerpunkt im Korpus OS--, im Gegensatz zum thematisch freieren Korpus
ZW--, bei den vorgegebenen Themen ländliche Arbeitswelt und Alltagsleben sowie regionales
Brauchtum lag. Zusätzlich wurden von fast allen Sprechern in drei regional modifizierten
Versionen die Wenkersätze aufgenommen.
Weitere Projektinformationen sind veröffentlicht in: Bellmann, Günter / Göschel, Joachim
(1970): Tonbandaufnahme ostdeutscher Mundarten 1962-1965. Gesamtkatalog. Marburg (=
DDG 73). Das Korpus OS-- umfasst 984 Tonaufnahmen, davon sind 981 Tonaufnahmen aus
der Zeit von 1962 bis 1965 mit einer Gesamtdauer von 462 Stunden und 5 Minuten extern
zugänglich. Es handelt sich um Aufnahmen mit 987 meist älteren Übersiedlern (Frauen
und Männer) aus den ehemaligen deutschen Ostgebieten, Sprecher deutscher Dialekte
aus ost- und südosteuropäischen Staaten, die den Sprachstand vor 1945 repräsentieren.
Zu Vergleichszwecken wurden in Schleswig-Holstein und Schwaben einige nach 1945 geborene
Kinder und einheimische Ehepartner von Flüchtlingen sowie spezielle Sprecher der einheimischen
Mundart einbezogen. Aufgenommen wurden Sprechereignisse unterschiedlicher Art, v.a.
Erzählungen, Unterhaltungen und Standardtexte (Wochentage, Zahlen, Wenkersätze). Die
Aufnahmen wurden im Archiv für Gesprochenes Deutsch (AGD) (früher: Deutsches Spracharchiv)
digitalisiert. Standard-sprachliche, phonetische und phonemische Transkripte zu 4
Aufnahmen wurden in den Bänden 9 und 19 sowie im Beiheft 4 der vom DSAv herausgegebenen
Reihe PHONAI publiziert. 281 im AGD digitalisierte und mit dem Ton synchronisierte
(alignierte) Transkripte (an der alten Orthographie orientierte hochsprachliche Übertragung,
Erläuterungen der Transkribenten, Lemmatisierung, POS-Tagging) sind archiviert. Anhand
der Metadaten wurden eine Themenliste, eine Liste der sprachlichen Besonderheiten
und eine Liste der Berufe der Sprecher erstellt. Außerdem gibt es alphabetisch und
nach Frequenzen geordnete Wort- und Lemmalisten. Das Korpus OS-- wird in der Datenbank
für Gesprochenes Deutsch (DGD) bereitgestellt, einzelne Aufnahmen können auch im persönlichen
Service des AGD weitergegeben werden.
Korpus_Projekt_Kurzbeschreibunglang=en
The corpus "Deutsche Mundarten: ehemalige deutsche Ostgebiete" ["German Dialects:
Former German Eastern Territories"] (OS--) was created by the German Language Archive
(DSAv) in cooperation with the Research Institute for the German Language "Deutscher
Sprachatlas" (Marburg). Project leaders were Eberhard Zwirner (DSAv) and Ludwig Erich
Schmidt (Deutscher Sprachatlas).
In order to complement the corpus "Deutsche
Mundarten: Zwirner-Korpus" ["German Dialects: Zwirner-Korpus"] (ZW--), the two institutions
undertook a data collection effort with the aim of documenting, to the extent possible,
the
dialects of the contiguous German language area in the former German East as well
as the German
language enclaves in Eastern and South-Eastern Europe. In the corpus ZW-- as it existed,
these dialects were represented only incidentally according to the recording locations.
In order to supplement the corpus "Deutsche Mundarten: Zwirner-Korpus" ["German Dialects:
Zwirner-Korpus"] (ZW--), a survey was carried out with the aim of documenting as comprehensively
as possible the dialects of the closed German language area in the former German East
and the German language islands in Eastern and Southeastern Europe, which were recorded
in the corpus ZW-- only after random scattering at the recording location.
The survey took place (i) throughout the old Federal Republic of Germany (often in
refugee camps and the newly established so-called "refugee towns"), (ii) in Austria
(around Salzburg), and (iii) in the northern Bohemian area around Gablonz (Jablonec
nad Nisou) with speakers remaining in their original settlement area within the state
that had by then become Czechoslovakia . The DSAv took on the technical supervision
of the recordings, providing its own sound engineers and a recording truck. The "Deutsches
Sprachatlas" was responsible for the linguistic and content-related supervision. Accordingly,
the focus of the corpus OS--, in contrast to the thematically freer corpus ZW--, was
on the pre-specified topics of the rural working environment and everyday life as
well as regional customs. In addition, the Wenker sentences were recorded by almost
all speakers in three regionally modified versions.
Further project information is published in: Bellmann, Günter / Göschel, Joachim (1970):
Tape recording of East German dialects 1962-1965. complete catalog. Marburg (= DDG
73). The corpus OS-- comprises 984 sound recordings. Of these, 981 sound recordings
from the period 1962 to 1965 with a total duration of 462 hours and 5 minutes are
externally accessible. These are recordings with 987 mostly older resettled ethnic
Germans ["Übersiedler"] (women and men) from the former German eastern territories,
who were speakers of German dialects from eastern and southeastern European states,
representing the language status before 1945. For comparative purposes, some children
born after 1945 as well as locally-born spouses of refugees in Schleswig-Holstein
and Swabia were included, as well as specific speakers of the local dialect. Speech
events of various kinds were recorded, especially narratives, conversations and standard
texts (days of the week, numbers, Wenker sentences). The recordings were digitized
at the Archive for Spoken German (AGD) (formerly: German Language Archive). Standard-language
transcripts as well as phonetic and phonemic transcripts for 4 recordings were published
in volumes 9 and 19 and in supplement 4 of the PHONAI series edited by the DSAv. The
AGD archive holds 281 transcripts that it digitized and synchronized (aligned) to
the audio. The textual transcriptions hew close to the standard language and follow
the old orthography. They come with additional notes by the transcribers, lemmatization,
and POS tagging. Based on the metadata. A list of topics, a list of linguistic peculiarities
and a list of the professions of the speakers were created. Also available are word
and lemma lists ordered alphabetically and by frequency. The corpus OS-- can be accessed
via the Database for Spoken German (DGD). Individual sound recordings and transcripts
can also be provided for download or on physical media via the personal service of
the AGD.
Deskriptoren
gesprochene deutsche Sprache ; Dialekt ; deutsche Sprachinsel ; Osteuropa ;
Südosteuropa ; Tonaufnahme ; Transkript ; Themenliste ; Liste der sprachlichen Besonderheiten
;
Liste der Berufe der Sprecher ; Wortliste ; Lemmaliste
-
ErstellungsprojektTitel=Tonbandaufnahme ostdeutscher Mundarten
Ort
Nicht dokumentiert
Institut
Forschungsinstitut für deutsche Sprache „Deutscher Sprachatlas“ ; Deutsches
Spracharchiv
Typ
DFG
Leiter
L. E. Schmitt ; Eberhard Zwirner
Auskunft
Nicht vorhanden
Laufzeit
Nicht dokumentiert
Zentrale_Publikationen
Bellmann, Günter / Göschel, Joachim (1970): Tonbandaufnahme ostdeutscher
Mundarten 1962-1965. Gesamtkatalog. Marburg (= DDG 73).
-
Aufzeichnungsobjekte
+
Ereignisse_Basisdaten
Anzahl
981
Beschreibung
Geplante Aufnahmeaktionen
Länder_Regionen_Orte
Deutschland ; Österreich ; Tschechische Republik
Institutionen
Forschungsinstitut für deutsche Sprache „Deutscher Sprachatlas“ ; Deutsches
Spracharchiv
Räumlichkeiten
Wohnungen der Sprecher
Zeit
1962-1965
Anmerkungen
In den Ereignisdokumenten werden z.T. historische Ortsbezeichnungen verwendet.
Die in den Ereignisdokumenten verzeichneten Planquadrate sind in mehreren Karten
dokumentiert (vgl. Eberhard Zwirner / Wolfgang Bethge (1958): Erläuterungen zu den
Texten.
Lautbibliothek der deutschen Mundarten. Göttingen)
Rundfunksendungen
Nicht vorhanden
+
Sprechereignisse
+
Basisdaten
Anzahl
981
Arten
Erzählung ; Vortrag ; Vorlesen ; Standardtexte (Wochentage, Zahlen,
Wenkersätze)
Forscherbeteiligung
Verbal beteiligt ; Nicht dokumentiert
Elizitiertheit
Elizitiert
Mediale_Realisierung
Face-to-face
Öffentlichkeitsgrad
Nicht öffentlich
Vorgaben
Nicht dokumentiert
Sprachen
Deutsch ; Polnisch
+
Inhalte
Beschreibung
Nicht vorhanden
Themen
vgl. Zusatzmaterial - Themenliste
+
Sprecher
Anzahl
987 dokumentiert
Beschreibung
Ältere Sprecher ost- und südostdeutscher Dialekte, die den Sprachstand vor 1945
repräsentieren
Anmerkungen
Es gibt detaillierte Sprecherdaten. In den Sprecherdokumenten werden z.T.
historische Ortsbezeichnungen verwendet. Die in den Sprecherdokumenten verzeichneten
Planquadrate sind in mehreren Karten dokumentiert (vgl. Eberhard Zwirner / Wolfgang
Bethge
(1958): Erläuterungen zu den Texten. Lautbibliothek der deutschen Mundarten.
Göttingen)
-
Korpusbestandteile
+
QuellaufnahmenTyp=Audio
+
Basisdaten
Anzahl
981
Relation_zu_Ereignissen
Nicht dokumentiert
Herkunft
Erstellungsprojekt
+
Aufnahmetechnik
Aufnahmegeräte
Magnetophon M5 von Telefunken
Mikrofone
Kugelförmiges Tauchspulenmikrophon M 19 b von Beyer ; kugelförmiges
Tauchspulenmikrophon M 100 von Beyer
AufnahmegeschwindigkeitEinheit=cm/s
19,05
+
DistributionStelle=Nicht vorhanden
+
ZugänglichkeitArt=Nicht vorhanden
Kontakt
Nicht vorhanden
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
Nicht vorhanden
+
SE-AufnahmenTyp=Audio
+
Basisdaten
Anzahl
981
+
Dauer
Einzelne_Aufnahmen
5 Minuten, 19 Sekunden bis 1 Stunde, 16 Minuten
Gesamtdauer
460 Stunden, 52 Minuten
Schutzbedürftige_Daten
Nicht vorhanden
Relation_zu_Quellaufnahmen
Vollständig
Relation_zu_Sprechereignissen
Vollständig
+
Transkribierte_SE-Aufnahmen
Anzahl
281
SE-Arten
Erzählung ; Vortrag ; Vorlesen; z.T. Wochentage und Zahlen
Dauer
Nicht dokumentiert
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
981
DateigrößeEinheit=Byte
146869358076
Datenschutz
Nicht vorhanden
+
Tontechnische_Daten
Format
WAVE
Codec
PCM
Kanäle
Mono
AbtastrateEinheit=Hz
44100
QuantisierungsrateEinheit=Bit
16
DatenrateEinheit=kBit/s
705
Datenrate_Modus
konstant
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Anhören von Aufnahmeausschnitten in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Erwerb im Rahmen des AGD-Service
Kontakt
agd@ids-mannheim.de
Kosten
Gemäß Preisliste
Kosten_URL
http://agd.ids-mannheim.de/konditionen.shtml
Zugang_URL
Nicht vorhanden
+
TranskripteTyp=TT_01
+
Basisdaten
Anzahl
281
Schutzbedürftige_Daten
Nicht vorhanden
Relation_zu_SE-Aufnahmen
Unvollständig
+
AnnotationenTyp=ANT_01
+
Basisdaten
Bezeichnung_in_Transkripten
Nicht vorhanden
Spezifikation
An der alten Orthographie orientierte hochsprachliche Übertragung ;
Erläuterungen der Transkribenten ; Lemmatisierung ; POS-Tagging
Konventionen
Projektspezifisch
Zeicheninventar
Deutsches Alphabet
+
ErstellungTyp=ERT_01
Spezifikation
Ersterstellung
Projekt
Nicht dokumentiert
Instrumente
Nicht dokumentiert
+
Ergebnisse_UmfangDefinition_Einheiten=Wort(segment/verschleifung)
Types:
30270
Tokens:
838022
+
ErstellungTyp=ERT_02
Spezifikation
Digitalisierung von ERT_01 und Bearbeitung für DGD1
Projekt
Datenbank Gesprochenes Deutsch
Instrumente
Nicht dokumentiert
+
Ergebnisse_UmfangDefinition_Einheiten=Wort(segment/verschleifung)
Types:
30270
Tokens:
838022
+
ErstellungTyp=ERT_DB1
Spezifikation
Konvertierung von HTML-Fassung der DGD1
Projekt
Datenbank für Gesprochenes Deutsch
Instrumente
Java ; Stuttgart-Tübingen-Tagset (STTS) ; TreeTagger
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
30270
Tokens:
838022
+
AlignmentTyp=ALT_01
Spezifikation
Wortweise
+
HerstellungErstellung_Typ=ERT_02
Anzahl:
276
Projekt:
Datenbank Gesprochenes Deutsch
Verfahren_Instrumente:
Automatisch ; IDS-Aligner
+
AlignmentTyp=ALT_02
Spezifikation
Pseudoalignment
+
HerstellungErstellung_Typ=ERT_DB1
Anzahl:
4
Projekt:
Datenbank für Gesprochenes Deutsch
Verfahren_Instrumente:
Java
+
AlignmentTyp=ALT_03
Spezifikation
Manuelles Alignment
+
HerstellungErstellung_Typ=ERT_DB1
Anzahl:
1
Projekt:
Archiv für Gesprochenes Deutsch
Verfahren_Instrumente:
EXMARaLDA Partitur-Editor
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
276
DateigrößeEinheit=Byte
144387669
Inhalt
ANT_01, ERT_DB1, ALT_01
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
Digitale_FassungenTyp=DFT_02
+
Basisdaten
Anzahl
4
DateigrößeEinheit=Byte
1019721
Inhalt
ANT_01, ERT_DB1, ALT_02
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
Digitale_FassungenTyp=DFT_03
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
445502
Inhalt
ANT_01, ERT_DB1, ALT_03
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Recherchen in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Transkriptionskonventionen
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
12077
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Themenliste
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
79103
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Liste der sprachlichen Besonderheiten
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
35145
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Wortlisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Thomas Schmidt
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
1460552
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Lemmalisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Thomas Schmidt
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
1170302
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Liste der Berufe der Sprecher
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
74122
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Notizen für interne Zwecke
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
11720
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Nicht vorhanden
+
ZugänglichkeitArt=Nicht vorhanden
Kontakt
Nicht vorhanden
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
Nicht vorhanden
-
Dokumentationsgeschichte
UpdateDatum=2021-06-24
Anmerkungen
In dem 1992 publizierten Gesamtkatalog der Tonaufnahmen des Deutschen Spracharchivs
und in der DGD sind drei OS-Aufnahmen mit Sperrvermerken verzeichnet. Diese Materialien
wurden
in der DGD nicht berücksichtigt. Für sechs OS-Ereignisse gibt es im DSAv-Katalog und
in der
DGD jeweils zwei Einträge. Für die DGD wurden diese Einträge in jeweils einem Dokument
zusammengefasst. Die Text-Ton-Synchronisation (Alignment) ist defizitär. Im Jahr 2015
wurden
die Angaben für westeuropäische Orte in Ereignis- und Sprecherdokumenten überprüft
und an die
aktuelle Verwaltungsliederung angepasst.