-
Versionen
VersionDatum=23-10-2014ID=2.3
Erstes Release (Teilkorpus South Australia) mit alignierten Transkripten im FLN-Format
VersionDatum=07-04-2017ID=2.8
Erweiterung um 173 Aufnahmen und 135 Transkripte aus den Teilkorpora Wimmera, Western
District und Pre-War Speakers
Namelang=de
Australiendeutsch
Namelang=en
Australian German
Sonstige_Bezeichnungen
AD
Korpus_Projekt_Kurzbeschreibunglang=de
Das Korpus Australiendeutsch wurde im Rahmen eines Projektes der Monash University
in Melbourne erstellt. Projektleiter war Michael Clyne. Das Korpus umfasst 220 Tonaufnahmen
mit einer Gesamtdauer von 64 Stunden und 19 Minuten aus der Zeit von 1966 bis 1973.
Die im AGD restaurierten Aufnahmen stammen aus South Australia und Victoria. Sie enthalten
Erzählungen, Interviews und Bildbeschreibungen von und mit 333 älteren Frauen und
Männern, deren Familien z.T. seit drei Generationen in Südaustralien leben. 168 dieser
Aufnahmen sind transkibiert. Die Transkripte (orthographische Transkription ; orthographische
Normalisierung ; Lemmatisierung ; POS-Tagging) wurden im AGD überarbeitet und aligniert.
Anhand der Metadaten wurden eine Themenliste erstellt. Außerdem gibt es alphabetisch
und nach Frequenzen geordnete Wort- und Lemmalisten. Das Korpus AD-- wird in der Datenbank
für Gesprochenes Deutsch (DGD) bereitgestellt, einzelne Tonaufnahmen können auch im
persönlichen Service des AGD weitergegeben werden.
Korpus_Projekt_Kurzbeschreibunglang=en
The corpus "Australian German" was created as part of a project at Monash University
in Melbourne. The project manager was Michael Clyne. The corpus contains 220 sound
recordings from the period 1966 to 1973, with a total duration of 64 hours and 19
minutes. The recordings, restored by the AGD, were made in South Australia and Victoria.
They contain narratives, interviews and visual descriptions with/by 333 older women
and men, some of whose families have lived in South Australia for three generations.
For 168 of these recordings, transcripts had been made. The transcripts (orthographic
transcription ; orthographic normalization ; lemmatization ; POS tagging) were revised
and aligned to the audio at the AGD. Based on the metadata a list of topics was created.
Also available are word and lemma lists, ordered alphabetically and by frequency.
The corpus AD-- is made available through the Database for spoken German (DGD). Individual
sound recordings and transcripts can also be provided for download or on physical
media via the personal service of the AGD.
Deskriptoren
gesprochene deutsche Sprache ; Dialekt ; Sprachinsel ; Australien ; Tonaufnahme ;
Transkript ; Wortliste ; Lemmaliste
-
ErstellungsprojektTitel=Monash Corpus of Australian German
Ort
Melbourne
Institut
Monash University
Typ
Eigenprojekt
Leiter
Michael Clyne
Auskunft
Nicht vorhanden
Laufzeit
Nicht dokumentiert
Zentrale_Publikationen
Michael Clyne (1981): Deutsch als Muttersprache in Australien. Zur Ökologie einer
Einwanderersprache. In Zusammenarbeit mit dem Centre for Migrant Studies. Monash University.
Deutsche Sprache in Europa und Übersee. Band 8. Wiesbaden: Franz Steiner Verlag.
Sandra Joy Kipp (2002): German-English Bilingualism in the Western District of Victoria.
Diss. Department of Linguistics and Applied Linguistics. The University of Melbourne.
-
Aufzeichnungsobjekte
+
Ereignisse_Basisdaten
Anzahl
220
Beschreibung
Geplante Aufnahmeaktionen
Länder_Regionen_Orte
Australien (Südaustralien, Victoria)
Institutionen
Monash University, Melbourne
Räumlichkeiten
Nicht dokumentiert
Zeit
1966-1973
Rundfunksendungen
Nicht vorhanden
+
Sprechereignisse
+
Basisdaten
Anzahl
220
Arten
Erzählung ; Interview ; Bildbeschreibung
Forscherbeteiligung
Verbal beteiligt
Elizitiertheit
Elizitiert
Mediale_Realisierung
Face-to-face
Öffentlichkeitsgrad
Nicht öffentlich
Vorgaben
Nicht dokumentiert
Sprachen
Deutsch ; Englisch
+
Inhalte
Beschreibung
Nicht vorhanden
Themen
vgl. Themenliste (Zusatzmaterial)
+
Sprecher
Anzahl
333
Beschreibung
vorwiegend ältere Frauen und Männern, deren Familien z.T. seit drei Generationen in
Südaustralien leben
-
Korpusbestandteile
+
QuellaufnahmenTyp=Audio
+
Basisdaten
Anzahl
220
Relation_zu_Ereignissen
Nicht dokumentiert
Herkunft
Monash University
+
Aufnahmetechnik
Aufnahmegeräte
Tonbandgerät
Mikrofone
Nicht dokumentiert
AufnahmegeschwindigkeitEinheit=cm/s
4,75 ; 9,5
+
DistributionStelle=Nicht vorhanden
+
ZugänglichkeitArt=Nicht vorhanden
Kontakt
Nicht vorhanden
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
Nicht vorhanden
+
SE-AufnahmenTyp=Audio
+
Basisdaten
Anzahl
220
+
Dauer
Einzelne_Aufnahmen
2 Minuten, 41 Sekunden bis 55 Minuten, 41 Sekunden
Gesamtdauer
64 Stunden, 19 Minuten
Schutzbedürftige_Daten
Nicht vorhanden ; Personennamen
Relation_zu_Quellaufnahmen
Vollständig
Relation_zu_Sprechereignissen
Vollständig ; Unvollständig
+
Transkribierte_SE-Aufnahmen
Anzahl
168
SE-Arten
Erzählung ; Interview ; Bildbeschreibung
Dauer
49 Stunden, 52 Minuten
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
124
DateigrößeEinheit=Byte
22471962338
Datenschutz
Nicht vorhanden
+
Tontechnische_Daten
Format
WAVE
Codec
PCM
Kanäle
Stereo
AbtastrateEinheit=Hz
48000
QuantisierungsrateEinheit=Bit
16
DatenrateEinheit=kBit/s
1536
Datenrate_Modus
konstant
+
Digitale_FassungenTyp=DFT_02
+
Basisdaten
Anzahl
96
DateigrößeEinheit=Byte
22010993816
Datenschutz
Schutzbedürftige Daten anonymisiert
+
Tontechnische_Daten
Format
WAVE
Codec
PCM
Kanäle
Stereo
AbtastrateEinheit=Hz
48000
QuantisierungsrateEinheit=Bit
16
DatenrateEinheit=kBit/s
1536
Datenrate_Modus
konstant
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Anhören von Aufnahmeausschnitten in DGD
Kontakt
dgd-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Erwerb im Rahmen des AGD-Service
Kontakt
agd@ids-mannheim.de
Kosten
Gemäß Preisliste
Kosten_URL
http://agd.ids-mannheim.de/konditionen.shtml
Zugang_URL
Nicht vorhanden
+
TranskripteTyp=TT_01
+
Basisdaten
Anzahl
168
Schutzbedürftige_Daten
Nicht vorhanden ; Personennamen
Relation_zu_SE-Aufnahmen
Vollständige Transkripte, Teiltranskript
+
AnnotationenTyp=ANT_01
+
Basisdaten
Bezeichnung_in_Transkripten
Nicht vorhanden
Spezifikation
orthographische Transkription; orthographische Normalisierung ; Lemmatisierung ; POS-Tagging
Konventionen
Projektspezifisch
Zeicheninventar
Deutsches Alphabet
+
ErstellungTyp=ERT_01
Spezifikation
Ersterstellung
Projekt
Monash Corpus of Australian German
Instrumente
Texteditor ; Textverarbeitung
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
Nicht dokumentiert
Tokens:
Nicht dokumentiert
+
ErstellungTyp=ERT_DB1
Spezifikation
Bearbeitung von ERT_01
Projekt
Datenbank für Gesprochenes Deutsch
Instrumente
Perl-Skripte ; Simple EXMARaLDA ; EXMARaLDA Partitur-Editor
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
18584
Tokens:
329378
+
AlignmentTyp=ALT_01
Spezifikation
Manuell segmentweise
+
HerstellungErstellung_Typ=ERT_DB1
Anzahl:
168
Projekt:
Datenbank für Gesprochenes Deutsch
Verfahren_Instrumente:
EXMARaLDA Partitur-Editor
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
96
DateigrößeEinheit=Byte
14100803
Inhalt
ANT_01, ERT_DB1, ALT_01
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
Digitale_FassungenTyp=DFT_02
+
Basisdaten
Anzahl
72
DateigrößeEinheit=Byte
16595211
Inhalt
ANT_01, ERT_DB1, ALT_01
Datenschutz
Schutzbedürftige Daten maskiert
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Recherchen in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Themenliste
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer ; Ulf-Michael Stift
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
57843
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Wortlisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Thomas Schmidt
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
844803
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Lemmalisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Thomas Schmidt
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
692646
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
-
Dokumentationsgeschichte