-
Versionen
VersionID=2.23Datum=31-03-2025
Erstveröffentlichung
Namelang=de
Deutschböhmen in Brasilien
Namelang=en
German Bohemians in Brazil
Sonstige_Bezeichnungen
Nicht vorhanden
Korpus_Projekt_Kurzbeschreibunglang=de
Das Korpus „Deutschböhmen in Brasilien“ (BOBR) wurde von Angélica Prediger (damals
UFRGS Porto Alegre, zum Veröffentlichungszeitpunkt Universität Heidelberg) im Rahmen
ihrer Dissertation zur Topodynamik des gesprochenen Deutsch von Einwanderergemeinschaften
aus Nordböhmen in Brasilien (Prediger 2019) erstellt.
Die Aufnahmen stammen aus den Jahren 2016 bis 2018 und wurden in Privathaushalten
in den Städten Agudo, Colinas, Imigrante und Venâncio Aires sowie deren Umland im
Bundesstaat Rio Grande do Sul erhoben.
Das Korpus ist nach den sozialdemographischen Parametern Geschlecht, Generation und
Bildungsgrad stratifiziert, das heißt, von jedem Ortspunkt wurden Gewährspersonen
mit den möglichen gekreuzten Ausprägungen dieser Merkmale interviewt. Die Erhebung
wurde nach den methodischen Prinzipien der pluridimensionalen und relationalen Dialektologie
geplant und durchgeführt. Die Interviews bestehen neben freien Gesprächen und Lektüreaufgaben
vor allem aus fragebogengeleiteten Aufgaben, welche die Bereiche der Grammatik, der
Lexik, der Phonologie sowie soziobiographische Aspekte abdecken.
Teil der Aufnahmen sind unter anderem auch Übersetzungsaufgaben aus dem brasilianischen
Portugiesisch. Der verwendete Fragebogen beruht auf einer adaptierten und gekürzten
Version des Fragebogens aus dem Projekt „Atlas Linguístico-Contatual das Mínoras Alemãs
na Bacia do Prata: Hunsrückisch (ALMA-H)“ (Cléo V. Altenhofen/Harald Thun), die unter
anderem basierend auf Sprachatlanten und Wörterbüchern aus Böhmen, Schlesien und Nordostbayern
um weitere Varianten ergänzt wurde. Die interviewten Sprecher*innen waren zum Aufnahmezeitpunkt
zwischen 18 und 81 Jahre alt.
Mit dem Release 2.23 im März 2025 stehen in der Datenbank für Gesprochenes Deutsch
159 Tonaufnahmen mit 37 Sprecher*innen mit einer Gesamtlänge von 33 Stunden und 27
Minuten zur Verfügung. Zu 12 dieser Aufnahmen liegen nach cGAT-Konventionen (Schmidt
et al. 2015) transkribierte, normalisierte, lemmatisierte und mit einem Part-of-Speech-Tagging
nach STTS 2.0 (Westpfahl et al. 2017) versehene Transkripte vor. Als Zusatzmaterial
stehen neben Wort- und Lemmalisten die verwendeten Fragebögen und der Text der Lektüreaufgabe
zur Verfügung.
Korpus_Projekt_Kurzbeschreibunglang=en
The corpus “German Bohemians in Brazil” (BOBR) was collected by Angélica Prediger
(then UFRGS Porto Alegre, at the time of release University of Heidelberg) as part
of her dissertation on the topodynamics of spoken German in immigrant communities
from northern Bohemia in Brazil (Prediger 2019).
The recordings were made between 2016 and 2018 and were collected in private households
in the cities of Agudo, Colinas, Imigrante and Venâncio Aires and their surrounding
areas in the state of Rio Grande do Sul.
The corpus is stratified according to the socio-demographic parameters of gender,
generation and level of education, i.e. respondents from each location were interviewed
with the possible crossed characteristics of these features. The survey was planned
and conducted according to the methodological principles of pluridimensional and relational
dialectology. In addition to free discussions and reading tasks, the interviews consisted
mainly of questionnaire-based tasks covering the areas of grammar, lexis, phonology
and sociobiographical aspects.
The recordings also include translation tasks from Brazilian Portuguese. The questionnaire
used is based on an adapted and shortened version of the questionnaire from the project
“Atlas Linguístico-Contatual das Mínoras Alemãs na Bacia do Prata: Hunsrückisch (ALMA-H)”
(Cléo V. Altenhofen/Harald Thun), which was supplemented with further variants based
on language atlases and dictionaries from Bohemia, Silesia and north-eastern Bavaria,
among others. The interviewed speakers were between 18 and 81 years old at the time
of recording.
With the release 2.23 in March 2025, 159 audio recordings with 37 speakers with a
total length of 33 hours and 27 minutes are available in the database for spoken German.
Transcripts transcribed, normalized, lemmatized and provided with part-of-speech tagging
according to STTS 2.0 (Westpfahl et al. 2017) are available for 12 of these recordings
in accordance with cGAT conventions (Schmidt et al. 2015). In addition to word and
lemma lists, the questionnaires used and the text of the reading task are available
as supplementary material.
Deskriptoren
gesprochene deutsche Sprache ; Brasilien ; extraterritoriale Varietät ; Deutschböhmen
; deutschsprachige Minderheiten ; Interviews ; Lateinamerika ; Sprachinsel
-
ErstellungsprojektTitel=Topodynamik des gesprochenen Deutsch von Einwanderergemeinschaften aus Nordböhmen
in Brasilien
Ort
Porto Alegre
Institut
UFRGS Porto Alegre
Typ
Korpuserstellung
Leiter
Angélica Prediger
Auskunft
agd@ids-mannheim.de
Laufzeit
2016-2018
Zentrale_Publikationen
Prediger, Angélica (2019): Topodinâmica do Alemão Falado em Comunidades de Imigração
do Norte da Boêmia no Brasil. Dissertation, UFRGS Porto Alegre. URI: http://hdl.handle.net/10183/204557.
___Prediger, Angélica / Habermann, Mechthild (2021): Identität und Sprache in Südbrasilien.
Böhmisch – Hunsrückisch – Portugiesisch in Kontakt. In: Wildfeuer, Alfred / Franz,
Sebastian (Hrsg.): Mehrsprachigkeit – Identität – Authentizität. Themenheft der Zeitschrift
für Dialektologie und Linguistik, 88(1–2), S. 19–220.
___Prediger, Angélica / Kürschner, Sebastian (2021): Die Dynamik des gesprochenen
Deutschen bei Nachfahren böhmischer Auswanderer in Südbrasilien. In: Földes, Csaba
(Hrsg.): Kontaktvarietäten des Deutschen im Ausland (Beiträge zur Interkulturellen
Germanistik). Tübingen: Narr, S. 215–237.
___Prediger, Angélica / Habel, Jussara M. (2024): Die Weiterentwicklung einer intermediate
variety bei Nachfahren böhmischer Herkunft in Rio Grande do Sul, Brasilien. In: Linguagem
& Ensino 27(1), S. 154–170.
-
Aufzeichnungsobjekte
+
Ereignisse_Basisdaten
Anzahl
20
Beschreibung
Aufnahmen von Deutschböhmen in Brasilien
Länder_Regionen_Orte
Brasilien
Institutionen
Nicht dokumentiert
Räumlichkeiten
Nicht dokumentiert
Zeit
2016-2018
Rundfunksendungen
Nicht vorhanden
+
Sprechereignisse
+
Basisdaten
Anzahl
158
Arten
Interview ; Fragebuch; Freies Gespräch
Forscherbeteiligung
Verbal beteiligt
Elizitiertheit
Elizitiert ; Nicht elizitiert
Mediale_Realisierung
Face-to-face
Öffentlichkeitsgrad
Nicht öffentlich
Vorgaben
Nicht dokumentiert
Sprachen
Deutsch ; brasilianisches Portugiesisch
+
Inhalte
Beschreibung
Nicht vorhanden
Themen
siehe Ereignisdokumentationen
+
Sprecher
Anzahl
37
Beschreibung
Sprecher*innen der deutschböhmischen Varietät in Brasilien
-
Korpusbestandteile
+
SE-AufnahmenTyp=Audio
+
Basisdaten
Anzahl
159
+
Dauer
Einzelne_Aufnahmen
00:00:21 - 01:03:22
Gesamtdauer
33:27:40
Schutzbedürftige_Daten
Schutzbedürftige Daten maskiert
Relation_zu_Quellaufnahmen
Vollständig
Relation_zu_Sprechereignissen
Vollständig
+
Transkribierte_SE-Aufnahmen
Anzahl
12
SE-Arten
Gesamtaufnahmen
Dauer
01:50:53
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
159
DateigrößeEinheit=Byte
0
Datenschutz
Schutzbedürftige Daten pseudonymisiert
+
Tontechnische_Daten
Format
WAVE
Codec
PCM
Kanäle
Stereo
AbtastrateEinheit=Hz
48000
QuantisierungsrateEinheit=Bit
16
DatenrateEinheit=kBit/s
1536
Datenrate_Modus
konstant
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Anhören von Aufnahmeausschnitten in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
TranskripteTyp=TT_01
+
Basisdaten
Anzahl
12
Schutzbedürftige_Daten
z.T. personenbezogene Daten ; evtl. weitere Daten (Ortsnamen, Namen von Institutionen
bzw. Organisationen)
Relation_zu_SE-Aufnahmen
Vollständige Transkripte
+
AnnotationenTyp=ANT_01
+
Basisdaten
Bezeichnung_in_Transkripten
Nicht vorhanden
Spezifikation
cGat-Minimaltranskript (literarisch) ; orthographische Normalisierung ; Lemmatisierung
; POS-Tagging
Konventionen
cGat
Zeicheninventar
Deutsches Alphabet
+
ErstellungTyp=ERT_01
Spezifikation
FOLKER-Transkripte
Projekt
Archiv für Gesprochenes Deutsch
Instrumente
FOLKER
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
2073
Tokens:
13387
+
ErstellungTyp=ERT_DB1
Spezifikation
Konvertierung von ERT_01
Projekt
Archiv für Gesprochenes Deutsch
Instrumente
OrthoNormal ; Stuttgart-Tübingen-Tagset (STTS) ; TreeTagger
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
2073
Tokens:
13387
+
AlignmentTyp=ALT_01
Spezifikation
Manuell segmentweise
+
HerstellungErstellung_Typ=ERT_01
Anzahl:
12
Projekt:
Archiv für Gesprochenes Deutsch
Verfahren_Instrumente:
FOLKER
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
12
DateigrößeEinheit=Byte
0
Inhalt
ANT_01, ERT_DB1, ALT_01
Datenschutz
Schutzbedürftige Daten maskiert
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Recherchen in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Wortlisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Jan Gorisch
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
87638
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Lemmalisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Jan Gorisch
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
59268
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Fragebogen_Phonologie
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Siegwalt Lindenfelser
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
123362
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Fragebogen_Grammatik_1_Wenkersätze
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Siegwalt Lindenfelser
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
388911
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Fragebogen_Grammatik_2_Deutschböhmen
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Siegwalt Lindenfelser
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
205938
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Fragebogen_Grammatik_3_Standarddeutsch
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Siegwalt Lindenfelser
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
203509
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Fragebogen_Lexik
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Siegwalt Lindenfelser
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
409734
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Text_Lektüreaufgabe
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Siegwalt Lindenfelser
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
289804
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
-
Dokumentationsgeschichte