-
Versionen
VersionDatum=23-10-2014ID=2.3
Erstes Release (Teilkorpus South Australia) mit alignierten Transkripten im FLN-Format
VersionDatum=07-04-2017ID=2.8
Erweiterung um 173 Aufnahmen und 135 Transkripte aus den Teilkorpora Wimmera, Western
District und Pre-War Speakers
Namelang=de
Australiendeutsch
Namelang=en
Australian German
Sonstige_Bezeichnungen
AD
Korpus_Projekt_Kurzbeschreibunglang=de
Im Korpus Australiendeutsch wurden Tonaufnahmen aus mehreren Projekten an der Monash
University in Melbourne zum Stand und Gebrauch der deutschen Sprache bei deutschstämmigen
Einwanderern und deren Nachkommen in Australien zusammengestellt. Projektleiter war
jeweils der australische Sprachwissenschaftler Michael Clyne. Die Tonaufnahmen und
weitere Materialien wie Metadaten und Transkripte wurden 2012/13 aus dem Nachlass
von Michael Clyne in das Archiv für Gesprochenes Deutsch (AGD) im IDS übernommen und
dort restauriert und digitalisiert. 220 Tonaufnahmen mit einer Gesamtdauer von 64
Stunden und 19 Minuten aus der Zeit von 1966 bis 1973 konnten in vier Teilkorpora
extern zugänglich gemacht werden. Die Aufnahmen in drei der vier Teilkorpora stammen
aus ländlichen Gegenden in South Australia (Barossa Valley u.a.: 46 Aufnahmen; AD--_E_00001
– AD--_E_00049; 1967) und Victoria (Western District of Victoria: 54 Aufnahmen; AD--_E_00051
– AD--_E_00106; 1966, 1970; Wimmera: 91 Aufnahmen; AD--_E_00108 – AD--_E_00198; 1969,
1972, 1973). Die Sprecherinnen und Sprecher leben überwiegend in der dritten Generation
in Australien, ihre Vorfahren sind Mitte des 19. Jahrhunderts meist aus religiösen
Gründen aus Schlesien oder Mecklenburg ausgewandert. Im vierten Teilkorpus ist mit
den sog. „Pre-War-Speakers“ eine großstädtisch-bildungsbürgerliche Bevölkerungsschicht
in Melbourne vertreten (AD--_E_00199 – AD--_E_00227; 29 Aufnahmen; 1969). Diese Sprecherinnen
und Sprecher sind Einwanderer der ersten Generation (bzw. deren Nachkommen) und vor
dem Zweiten Weltkrieg überwiegend aus deutschen und österreichischen Großstädten nach
Australien eingewandert. Die Aufnahmen enthalten Erzählungen, Interviews und Bildbeschreibungen
von und mit 333 meist älteren Frauen und Männern. 168 dieser Aufnahmen sind transkribiert.
Die Transkripte (orthographische Transkription ; orthographische Normalisierung ;
Lemmatisierung ; POS-Tagging) wurden im AGD überarbeitet und aligniert. Anhand der
Metadaten wurde eine Themenliste erstellt. Außerdem gibt es alphabetisch und nach
Frequenzen geordnete Wort- und Lemmalisten. Das Korpus AD-- wird in der Datenbank
für Gesprochenes Deutsch (DGD) bereitgestellt, einzelne Tonaufnahmen können auch im
persönlichen Service des AGD weitergegeben werden. Weitere Aufnahmen aus deutschen
Sprachinseln in Australien (Barossa Valley und Queensland) sind in der DGD im Korpus
„Extraterritoriale Varietäten: Varia“ (MVEX) zu finden.
Korpus_Projekt_Kurzbeschreibunglang=en
The corpus Australian German ("Australiendeutsch") consists of audio recordings from
several projects at Monash University in Melbourne on the state and use of the German
language among ethnic German immigrants and their descendants. The project leader
in each case was the Australian linguist Michael Clyne. The audio recordings and other
materials such as metadata and transcripts were transferred from Michael Clyne's estate
to the Archive for Spoken German (AGD) at the IDS in 2012/13, where they were restored
and digitized. 220 sound recordings with a total duration of 64 hours and 19 minutes
from the period 1966 to 1973 could be made accessible externally in four subcorpora.
The recordings in three of the four sub-corpora originate from rural areas in South
Australia (Barossa Valley et al.: 46 recordings; AD--_E_00001 - AD--_E_00049; 1967)
and Victoria (Western District of Victoria: 54 recordings; AD--_E_00051 - AD--_E_00106;
1966, 1970; Wimmera: 91 recordings; AD--_E_00108 - AD--_E_00198; 1969, 1972, 1973).
The speakers are mostly third-generation Australian residents; their ancestors emigrated
from Silesia or Mecklenburg in the mid-19th century, mostly for religious reasons.
In the fourth subcorpus, the so-called "Pre-War Speakers" represent the metropolitan,
educated middle-class population of Melbourne (AD--_E_00199 - AD--_E_00227; 29 recordings;
1969). These speakers are first--generation immigrants (or their descendants) who
immigrated to Australia before World War II primarily from large German and Austrian
cities. The recordings contain narratives, interviews, and pictorial descriptions
by or with 333 mostly older women and men. 168 of these recordings have been transcribed.
The transcripts (orthographic transcription ; orthographic normalization ; lemmatization
; POS tagging) were revised and aligned to the audio at AGD. A list of topics was
created based on the metadata. Word and lemma lists are available, arranged alphabetically
or by frequency. The corpus AD-- is made available via the Database for Spoken German
(DGD), and individual sound recordings can also be obtained through the AGD's personal
service. Additional recordings from German language islands in Australia (Barossa
Valley and Queensland) are available in the DGD as part of the corpus "Extraterritorial
Varieties: Varia" (MVEX).
Deskriptoren
gesprochene deutsche Sprache ; Dialekt ; Sprachinsel ; Australien ; Tonaufnahme ;
Transkript ; Wortliste ; Lemmaliste
-
ErstellungsprojektTitel=Monash Corpus of Australian German
Ort
Melbourne
Institut
Monash University
Typ
Eigenprojekt
Leiter
Michael Clyne
Auskunft
Nicht vorhanden
Laufzeit
Nicht dokumentiert
Zentrale_Publikationen
Michael Clyne (1981): Deutsch als Muttersprache in Australien. Zur Ökologie einer
Einwanderersprache. In Zusammenarbeit mit dem Centre for Migrant Studies. Monash University.
Deutsche Sprache in Europa und Übersee. Band 8. Wiesbaden: Franz Steiner Verlag.
Sandra Joy Kipp (2002): German-English Bilingualism in the Western District of Victoria.
Diss. Department of Linguistics and Applied Linguistics. The University of Melbourne.
-
Aufzeichnungsobjekte
+
Ereignisse_Basisdaten
Anzahl
220
Beschreibung
Geplante Aufnahmeaktionen
Länder_Regionen_Orte
Australien (Südaustralien, Victoria)
Institutionen
Monash University, Melbourne
Räumlichkeiten
Nicht dokumentiert
Zeit
1966-1973
Rundfunksendungen
Nicht vorhanden
+
Sprechereignisse
+
Basisdaten
Anzahl
220
Arten
Erzählung ; Interview ; Bildbeschreibung
Forscherbeteiligung
Verbal beteiligt
Elizitiertheit
Elizitiert
Mediale_Realisierung
Face-to-face
Öffentlichkeitsgrad
Nicht öffentlich
Vorgaben
Nicht dokumentiert
Sprachen
Deutsch ; Englisch
+
Inhalte
Beschreibung
Nicht vorhanden
Themen
vgl. Themenliste (Zusatzmaterial)
+
Sprecher
Anzahl
333
Beschreibung
vorwiegend ältere Frauen und Männern, deren Familien z.T. seit drei Generationen in
Südaustralien leben
-
Korpusbestandteile
+
QuellaufnahmenTyp=Audio
+
Basisdaten
Anzahl
220
Relation_zu_Ereignissen
Nicht dokumentiert
Herkunft
Monash University
+
Aufnahmetechnik
Aufnahmegeräte
Tonbandgerät
Mikrofone
Nicht dokumentiert
AufnahmegeschwindigkeitEinheit=cm/s
4,75 ; 9,5
+
DistributionStelle=Nicht vorhanden
+
ZugänglichkeitArt=Nicht vorhanden
Kontakt
Nicht vorhanden
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
Nicht vorhanden
+
SE-AufnahmenTyp=Audio
+
Basisdaten
Anzahl
220
+
Dauer
Einzelne_Aufnahmen
2 Minuten, 41 Sekunden bis 55 Minuten, 41 Sekunden
Gesamtdauer
64 Stunden, 19 Minuten
Schutzbedürftige_Daten
Nicht vorhanden ; Personennamen
Relation_zu_Quellaufnahmen
Vollständig
Relation_zu_Sprechereignissen
Vollständig ; Unvollständig
+
Transkribierte_SE-Aufnahmen
Anzahl
168
SE-Arten
Erzählung ; Interview ; Bildbeschreibung
Dauer
49 Stunden, 52 Minuten
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
124
DateigrößeEinheit=Byte
22471962338
Datenschutz
Nicht vorhanden
+
Tontechnische_Daten
Format
WAVE
Codec
PCM
Kanäle
Stereo
AbtastrateEinheit=Hz
48000
QuantisierungsrateEinheit=Bit
16
DatenrateEinheit=kBit/s
1536
Datenrate_Modus
konstant
+
Digitale_FassungenTyp=DFT_02
+
Basisdaten
Anzahl
96
DateigrößeEinheit=Byte
22010993816
Datenschutz
Schutzbedürftige Daten anonymisiert
+
Tontechnische_Daten
Format
WAVE
Codec
PCM
Kanäle
Stereo
AbtastrateEinheit=Hz
48000
QuantisierungsrateEinheit=Bit
16
DatenrateEinheit=kBit/s
1536
Datenrate_Modus
konstant
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Anhören von Aufnahmeausschnitten in DGD
Kontakt
dgd-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Erwerb im Rahmen des AGD-Service
Kontakt
agd@ids-mannheim.de
Kosten
Gemäß Preisliste
Kosten_URL
http://agd.ids-mannheim.de/konditionen.shtml
Zugang_URL
Nicht vorhanden
+
TranskripteTyp=TT_01
+
Basisdaten
Anzahl
168
Schutzbedürftige_Daten
Nicht vorhanden ; Personennamen
Relation_zu_SE-Aufnahmen
Vollständige Transkripte, Teiltranskript
+
AnnotationenTyp=ANT_01
+
Basisdaten
Bezeichnung_in_Transkripten
Nicht vorhanden
Spezifikation
orthographische Transkription; orthographische Normalisierung ; Lemmatisierung ; POS-Tagging
Konventionen
Projektspezifisch
Zeicheninventar
Deutsches Alphabet
+
ErstellungTyp=ERT_01
Spezifikation
Ersterstellung
Projekt
Monash Corpus of Australian German
Instrumente
Texteditor ; Textverarbeitung
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
Nicht dokumentiert
Tokens:
Nicht dokumentiert
+
ErstellungTyp=ERT_DB1
Spezifikation
Bearbeitung von ERT_01
Projekt
Datenbank für Gesprochenes Deutsch
Instrumente
Perl-Skripte ; Simple EXMARaLDA ; EXMARaLDA Partitur-Editor
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
18584
Tokens:
329378
+
AlignmentTyp=ALT_01
Spezifikation
Manuell segmentweise
+
HerstellungErstellung_Typ=ERT_DB1
Anzahl:
168
Projekt:
Datenbank für Gesprochenes Deutsch
Verfahren_Instrumente:
EXMARaLDA Partitur-Editor
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
96
DateigrößeEinheit=Byte
14100803
Inhalt
ANT_01, ERT_DB1, ALT_01
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
Digitale_FassungenTyp=DFT_02
+
Basisdaten
Anzahl
72
DateigrößeEinheit=Byte
16595211
Inhalt
ANT_01, ERT_DB1, ALT_01
Datenschutz
Schutzbedürftige Daten maskiert
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Recherchen in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Themenliste
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer ; Ulf-Michael Stift
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
57843
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Wortlisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Thomas Schmidt
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
844803
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Lemmalisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Thomas Schmidt
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
692646
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
-
Dokumentationsgeschichte