-
Versionen
VersionID=2.0Datum=19-12-2012
Erstes Release (als Teil von MV)
VersionID=2.12Datum=16-05-2019
Ausgliederung als eigenständiges Korpus, dabei Überarbeitung der Audios und Metadaten,
Erweiterung um 48 Aufnahmen aus Beständen des AGD
VersionID=2.21Datum=11-01-2024
2 alignierte Transkripte im FLN-Format integriert
Namelang=de
Extraterritoriale Varietäten: Varia
Namelang=en
Extraterritorial Varieties: Varia
Sonstige_Bezeichnungen
VII/ ; MV ; NA
Korpus_Projekt_Kurzbeschreibunglang=de
Das Korpus „Extraterritoriale Varietäten: Varia“ (MVEX) besteht aus 94 Aufnahmen mit
Varietäten aus deutschen Sprachinseln in Europa (Polen, Ukraine, Rumänien, Serbien,
Italien) und außerhalb Europas (Kanada, USA, Mexiko, Südafrika, Australien, Neuseeland),
überwiegend Mennonitendeutsche, Pennsylvaniadeutsche, Australiendeutsche und Donauschwaben.
Die Tonaufnahmen aus der Zeit von 1958 bis 1983 wurden im Deutschen Spracharchiv (DSAv)
von auswärtigen Wissenschaftlern übernommen und im Korpus "Binnen- und auslandsdeutsche
Mundarten: Varia" (VII, später MV) archiviert. 46 Aufnahmen, deren Bearbeitungsstand
dem damals im DSAv üblichen Standard entsprach, wurden für den Gesamtkatalog des DSAv
(1992; PHONAI Bd. 38/39. Tübingen: Niemeyer) ausgewählt und in die Datenbank für gesprochenes
Deutsch (DGD) des DSAv übernommen (davon 9 Aufnahmen im Korpus „Deutsch in Nordamerika“/NA).
In der DGD 2 waren sie bis 2019 im Korpus MV-- (s. dort) zugänglich. Sie wurden technisch
neu bearbeitet und unter Beibehaltung ihrer Ordnungsnummer in das Korpus MVEX überführt.
Die übrigen 48 Aufnahmen sind nach technischer Bearbeitung und Zusammenstellung der
Metadaten erstmals über die DGD zugänglich. Die Gesamtdauer beträgt 28 Stunden und
31 Minuten. Es handelt sich um Aufnahmen mit 126 Sprechern (Frauen und Männer) aus
Australien, Deutschland, Italien, Kanada, Mexiko, Neuseeland, Österreich, Polen, Südafrika
und den USA in Sprechereignissen unterschiedlicher Art, v.a. Erzählungen, Unterhaltungen,
Übersetzungen und Standardtexte (Kontrollsätze, Wenkersätze, Wortliste, Zahlen, Wochentage,
Monate). Alle Aufnahmen wurden im Archiv für Gesprochenes Deutsch (AGD) (früher: Deutsches
Spracharchiv) digitalisiert. Transkripte von 17 Aufnahmen aus Australien, Italien,
Kanada und den USA wurden in den Bänden 6, 10, 18, 21 und 31 der vom DSAv herausgegebenen
Reihe PHONAI publiziert. Zu zwei Aufnahmen aus Australien wurden am AGD auf dieser
Basis mit dem Ton synchronisierte (alignierte) Transkripte erstellt und korrigiert.
Die Tonaufnahmen und derzeit zwei Transkripte des Korpus MVEX werden in der Datenbank
für Gesprochenes Deutsch (DGD) bereitgestellt, einzelne Aufnahmen können auch im persönlichen
Service des AGD weitergegeben werden. Ähnliche Aufnahmen finden sich in der DGD in
den Korpora „Australiendeutsch“ (AD--), „Gesprochenes Deutsch im Südlichen Afrika“
(GDSA), „Mennonitenplautdietsch in Nord- und Südamerika“ (MEND), „Russlanddeutsche
Dialekte“ (RUDI) und dem ebenfalls aus dem alten Korpus MV-- hervorgegangenen „Deutsch
in Wisconsin“ (WISC), zu europäischen Sprachinseln auch im Zwirner-Korpus (ZW--) und
im Korpus „Deutsche Mundarten: ehemalige deutsche Ostgebiete“ (OS--).
Korpus_Projekt_Kurzbeschreibunglang=en
The corpus "Extraterritorial varieties: Varia" (MVEX) consists of 94 recordings representing
varieties from German language enclaves in Europe (Poland, Ukraine, Romania, Serbia,
Italy) and outside of Europe (Canada, USA, Mexico, South Africa, Australia, New Zealand).
The speakers represented in the corpus are mainly Mennonite Germans, Pennsylvania
Germans, Australian Germans and Danube Swabians.
These sound recordings from the period between 1958 and 1983 were taken in by the
Deutsches Spracharchiv (DSAv) from foreign scholars
and archived in the corpus "Inland and foreign German dialects: Varia" (VII, later
MV).
In 1992, 46 recordings which had been processed according to the state of the art
the in use were selected for the DSAv general catalogue (1992; PHONAI Bd. 38/39. Tübingen:
Niemeyer) and included in the database for spoken German (DGD) of the DSAv.
9 of the 46 recordings were integrated into the corpus "Deutsch in Nordamerika" (NA).
In the second major version of the Database for Spoken German, DGD2, the 46 recordings
were initally accessible as part of the MV-- corpus (see there). They have since
been technically re-engineered and transferred to the corpus MVEX (while retaining
the numeric part of the ID they had as part of MV).
The remaining group of 48 recordings in MVEX are accessible via the DGD for the first
time, after technical editing was performed and metadata compiled. The total duration
of the recordings in MVEX is 28 hours and 31 minutes.
The recordings are with 126 speakers (women and men) from Australia, Germany, Italy,
Canada, Mexico, New Zealand, Austria, Poland,
South Africa and the USA. The speech events captured are of various kinds, mainly
narratives, conversations, translations and standard texts (control sentences, Wenker
sentences, word lists, numbers, weekdays, months).
The recordings have been digitized at the Archiv für Gesprochenes Deutsch (AGD) (formerly:
Deutsches Spracharchiv).
The transcripts of 17 recordings from Australia, Italy, Canada and the USA were published
in volumes 6, 10, 18, 21 and 31 of the PHONAI series edited by DSAv.
For two recordings from Australia, transcripts synchronized (aligned) with the audio
were created and corrected at the AGD on this basis. The sound recordings and currently
two transcripts of the MVEX corpus are available via the Database for Spoken German
(DGD).
Individual recordings can also be obtained for download or on physical media by way
of the personal service of the AGD.
Similar recordings to those in MVEX can be found in the DGD as part of the corpora
"Australian German" (AD), "Mennonitenplautdietsch in North and South America" (MEND),
"Spoken German in Southern Africa (GDSA), "Russian-German dialects" (RUDI) and "German
in Wisconsin" (WISC). (WISC also originated from the old corpus MV--.) Data that is
relevant for German linguistic enclaves in Europe can also be found in the Zwirner
corpus (ZW) as well as in the corpus "German dialects: former German Eastern territories"
(OS). Further similar recordings are part of AGD corpora which are not (yet) prepared
for distribution through the DGD, in particular "German in New Zealand" (NZ).
Deskriptoren
gesprochene deutsche Sprache ; Dialekt ; Umgangssprache ; deutsche Sprachinsel ; Tonaufnahme
-
ErstellungsprojektTitel=Binnen- und auslandsdeutsche Mundarten: Varia
Ort
Braunschweig ; Münster ; Bonn ; Mannheim
Institut
Deutsches Spracharchiv
Typ
Korpuserstellung
Leiter
Eberhard Zwirner ; Klaus Kohler ; Gerold Ungeheuer ; Edeltraut Knetschke ; Margret
Sperlbaum
Auskunft
agd@ids-mannheim.de
Laufzeit
1950er bis 1980er Jahre
Zentrale_Publikationen
Bond, Anatole (1978): Deutsche Siedlung am Schwarzen Meer Lustdorf bei Odessa. Geschichte
und sprachliche Studien. Deutsche Dialektgeographie (DDG): Bd. 104. Marburg: N.G.
Elwert Verlag.
Droescher, Werner O. (1974): Puhoi. Eine egerländer Mundart in Neuseeland. PHONAI
15: Monographien 7. Tübingen: Max Niemeyer Verlag. 195-235.
Karch, Dieter und Wolfgang W. Moelleken (1977): Siedlungspfälzisch im Kreis Waterloo,
Ontario, Kanada. PHONAI 18: Monographien 9. Tübingen: Max Niemeyer Verlag.
McGraw, Peter A. (1979): Dane County Kölsch, Wisconsin USA. PHONAI 21: Monographien
12. Tübingen: Max Niemeyer Verlag.
Moelleken, Wolfgang W. (1987): Die rußlanddeutschen Mennoniten in Kanada und Mexiko:
sprachliche Entwicklung und diglossische Situation. Zeitschrift für Dialektologie
und Linguistik. 145-183.
Moelleken, Wolfgang W. (1972): Niederdeutsch der Molotschna- und Chortitzamennoniten
in British Columbia/Kanada. PHONAI 10: Monographien 4. Tübingen: Max Niemeyer Verlag.
Moelleken, Wolfgang W. (1967): Diaphonic Correspondences in the Low German of Mennonites
from the Fraser Valley, British Columbia. Zeitschrift für Mundartforschung, Bd. 34
(3/4). 240–253.
Paul, Peter (1970): Barossatal: Südaustralien. PHONAI 6: Monographien 1. Tübingen:
Max Niemeyer Verlag. 189-317.
Paul, Peter (1965): Das Barossa Deutsche. MA thesis: University of Adelaide.
Paul, Peter (1962): Barossadeutsch. Sprachliche Untersuchungen des ostmitteldeutschen
Dialektes des Barossatales (Südaustralien). BA thesis: University of Adelaide.
Rowley, Anthony R. (1986): Fersental (Val Fèrsina bei Trient/Oberitalien) – Untersuchung
einer Sprachinselmundart. PHONAI 31: Monographien 18. Tübingen: Max Niemeyer Verlag.
Stielau, Hildegard Irma (1980): Nataler Deutsch. Auburger, Leopold und Heinz Kloss,
Gottfried Kolde (Hrsg.): Deutsche Sprache in Europa und Übersee. Berichte und Forschungen:
Bd. 7. Wiesbaden: Franz Steiner Verlag.
Thiessen, John (1963): Studien zum Wortschatz der kanadischen Mennoniten. Deutsche
Dialektgeographie (DDG): Bd. 64. Marburg: N.G. Elwert Verlag.
Wiebe, Grace E. (1983): The segmental phonemes of Swift Current Mennonite Low German.
MA thesis: University of Alberta.
-
Aufzeichnungsobjekte
+
Ereignisse_Basisdaten
Anzahl
94
Beschreibung
Geplante Aufnahmeaktionen
Länder_Regionen_Orte
Australien ; Deutschland ; Italien ; Kanada ; Mexiko ; Neuseeland ; Polen ; Südafrika
; Vereinigte Staaten von Amerika
Institutionen
Nicht dokumentiert
Räumlichkeiten
Nicht dokumentiert
Zeit
1958-1973
Anmerkungen
In den Ereignisdokumenten werden z.T. historische Ortsbezeichnungen verwendet.
Rundfunksendungen
Nicht vorhanden
+
Sprechereignisse
+
Basisdaten
Anzahl
94
Arten
Erzählung ; Vorlesen ; Übersetzung ; Standardtexte (Kontrollsätze, Wenkersätze, Wortliste,
Zahlen, Wochentage, Monate)
Forscherbeteiligung
Verbal beteiligt ; Verbal nicht beteiligt
Elizitiertheit
Elizitiert
Mediale_Realisierung
Face-to-face
Öffentlichkeitsgrad
Nicht öffentlich
Vorgaben
Nicht dokumentiert
Sprachen
Deutsch
+
Inhalte
Beschreibung
Nicht vorhanden
Themen
siehe Ereignisdokumentationen
+
Sprecher
Anzahl
126
Beschreibung
u.a. Barossadeutsche ; Mennonitendeutsche ; Pennsylvaniadeutsche ; Donauschwaben
Anmerkungen
Es gibt detaillierte Sprecherdaten. In den Sprecherdokumenten werden z.T. historische
Ortsbezeichnungen verwendet.
-
Korpusbestandteile
+
QuellaufnahmenTyp=Audio
+
Basisdaten
Anzahl
94
Relation_zu_Ereignissen
Nicht dokumentiert
Herkunft
Anatole Bond ; Werner O. Droescher ; Elwyn H. Flint ; Peter A. McGraw ; Holde Heuer
; Wolfgang W. Moelleken ; Peter Paul ; Anthony R. Rowley ; Hildegard I. Stielau ;
John Thiessen ; Peter Wanko ; Ronald N. Werth ; Grace E. Wiebe ; Ralph C. Wood
+
Aufnahmetechnik
Aufnahmegeräte
Nicht dokumentiert
Mikrofone
Nicht dokumentiert
AufnahmegeschwindigkeitEinheit=cm/s
Nicht dokumentiert
Anmerkungen
Unterschiedliche Aufnahmegeschwindigkeiten wegen unterschiedlicher Herkunft der Tonaufnahmen
(19 cm/s Vollspur, 19 cm/s Halbspur, 9,5 cm/s Halbspur, 4,75 cm/s Halbspur). Die Aufnahmen
wurden überwiegend als Kopien in das DSAv aufgenommen, von diesen Tonbändern erfolgte
2009 die Digitalisierung im AGD.
+
DistributionStelle=Nicht vorhanden
+
ZugänglichkeitArt=Nicht vorhanden
Kontakt
Nicht vorhanden
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
Nicht vorhanden
+
SE-AufnahmenTyp=Audio
+
Basisdaten
Anzahl
94
+
Dauer
Einzelne_Aufnahmen
3 Minuten, 56 Sekunden bis 42 Minuten, 55 Sekunden
Gesamtdauer
28 Stunden, 31 Minuten
Schutzbedürftige_Daten
Nicht vorhanden
Relation_zu_Quellaufnahmen
Vollständig
Relation_zu_Sprechereignissen
Vollständig
+
Transkribierte_SE-Aufnahmen
Anzahl
2
SE-Arten
1
Dauer
29 Minuten, 49 Sekunden
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
94
DateigrößeEinheit=Byte
0
Datenschutz
Nicht vorhanden
+
Tontechnische_Daten
Format
WAVE
Codec
PCM
Kanäle
Stereo
AbtastrateEinheit=Hz
48000
QuantisierungsrateEinheit=Bit
16
DatenrateEinheit=kBit/s
1536
Datenrate_Modus
konstant
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Anhören von Aufnahmeausschnitten in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Erwerb im Rahmen des AGD-Service
Kontakt
agd@ids-mannheim.de
Kosten
Gemäß Preisliste
Kosten_URL
http://agd.ids-mannheim.de/konditionen.shtml
Zugang_URL
Nicht vorhanden
+
TranskripteTyp=TT_01
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Relation_zu_SE-Aufnahmen
Vollständige Transkripte
+
AnnotationenTyp=ANT_01
+
Basisdaten
Bezeichnung_in_Transkripten
Nicht vorhanden
Spezifikation
cGat-Minimaltranskript (literarisch) ; orthographische Normalisierung ; Lemmatisierung
; POS-Tagging
Konventionen
cGat
Zeicheninventar
Deutsches Alphabet
+
ErstellungTyp=ERT_01
Spezifikation
EXMARaLDA Basistranskripte
Projekt
Archiv für Gesprochenes Deutsch
Instrumente
EXMARaLDA Partitur-Editor
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
+
ErstellungTyp=ERT_DB1
Spezifikation
Konvertierung von ERT_01
Projekt
Archiv für Gesprochenes Deutsch
Instrumente
Konvertierung mit XSL
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
+
AlignmentTyp=ALT_01
Spezifikation
Manuell segmentweise
+
HerstellungErstellung_Typ=ERT_01
Anzahl:
2
Projekt:
Archiv für Gesprochenes Deutsch
Verfahren_Instrumente:
EXMARaLDA Partitur-Editor
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
521986
Inhalt
ANT_01, ERT_DB1, ALT_01
Datenschutz
keine schutzbedürftigen Daten
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Recherchen in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Wortlisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Mark-Christoph Müller
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
44096
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Lemmalisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Mark-Christoph Müller
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
33508
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
-
Dokumentationsgeschichte
UpdateDatum=2019-05-07
Anmerkungen
Im Jahr 2015 wurden die Angaben für deutsche Orte in Ereignis- und Sprecherdokumenten
überprüft und an die aktuelle Verwaltungsliederung angepasst