-
Versionen
VersionDatum=31-03-2025ID=2.23
Erstveröffentlichung
Namelang=de
Sprachsituation an der innerdeutschen Grenze
Namelang=en
Language situation at the inner-German border
Korpus_Projekt_Kurzbeschreibunglang=de
Das Korpus „Sprachsituation an der innerdeutschen Grenze“ (SPIG) wurde im Rahmen der
Datenaufbereitungsprojekte „Sprachsituation an der innerdeutschen Grenze (SPRiG)“
(Laufzeit: 2021–2022; Leitung: Nicole Palliwoda, Universität Kiel, und Alexander Werth,
Universität Passau; in Kooperation mit dem Archiv für Gesprochenes Deutsch und gefördert
im Rahmen der FDM-Projektförderung des Konsortiums für die Sozial-, Bildungs-, Verhaltens-
und Wirtschaftswissenschaften (KonsortSWD)) sowie „Untersuchungen zur Sprachsituation
im thüringisch-bayerischen Grenzgebiet“ (Laufzeit: 2005–2011; Leitung: Rüdiger Harnisch,
Universität Passau; gefördert durch die DFG, Projektnr. 5457014) erstellt. Die Daten
wurden im Rahmen des Kooperationsprojektes „Erhebungen zur Dialektsituation im thüringisch-bayerischen
Grenzgebiet“ (Laufzeit: 1992–1994; Leitung: Robert Hinderling, Friedrich-Schiller-Universität
Jena, und Wolfgang Lösch, Universität Bayreuth; gefördert durch die DFG) unter Mitwirkung
von Mitarbeitenden des Thüringischen Wörterbuchs und des Sprachatlas von Nordostbayern
erhoben. Projektziel war es zunächst, Sprachdaten unterschiedlicher Altersgruppen
an der ehemaligen innerdeutschen Grenze zu erheben, um den Sprachstand dies- und jenseits
der ehemaligen Grenze für spätere Analysen zu sichern. Das Korpus beinhaltet Sprachaufnahmen
von insgesamt 501 Gewährspersonen aus 21 Orten im ehemaligen thüringisch-bayerischen
Grenzgebiet. 20 dieser Orte liegen sich an der ehemaligen innerdeutschen Grenze geographisch
gegenüber, der 21. Ort, Mödlareuth, war – wie damals Berlin – zwischen Ost und West
geteilt. Für die Zusammenstellung des Ortsnetzes wurden neben der Verortung entlang
der ehemaligen innerdeutschen Grenze auch historische Gegebenheiten berücksichtigt,
wie sie in diesem Raum etwa auf konfessionelle und territorial-politische Bedingungen
zurückgeführt werden können.
Pro Ort wurden ca. 20 Gewährspersonen befragt, um einen intergenerativen Vergleich
zu ermöglichen. Diese verteilen sich auf vier verschiedene Altersgruppen: Geburtsjahr
um 1920 (AG 1), 1940 (AG 2), 1955 (AG 3), 1970 (AG 4). Die Tonbandmitschnitte bestehen
aus vier Teilen: 1. Abfrage von Wörtern/Satzgruppen zur Realisierung primärer Dialektmerkmale
und Übertragung von 25 standardsprachlichen Sätzen in den jeweiligen Ortsdialekt;
2. Fragen zur Sprachverwendung und Dialektbewertung mittels eines soziolinguistischen
Fragebogens; 3. Abfrage von Sozialdaten der Gewährspersonen; 4. eine freie Erzählung
im Dialekt (natürlich gesprochene Alltagssprache) zum Thema Grenzöffnung 1989.
Die über die Datenbank für Gesprochenes Deutsch (DGD) zur Verfügung gestellte Version
des Korpus beinhaltet insgesamt 274 Aufnahmen im Umfang von 125 Stunden. Zu diesen
Audiodateien liegen 482 Ton-Text-alignierte, normalisierte, lemmatisierte und mit
einem Part-of-Speech-Tagging nach STTS 2.0 (Westpfahl et al. 2017) versehene Transkripte
in einer normorthografischen Umschrift der Abschnitte vor, die Erzählungen zur Grenzöffnung
beinhalten. Zum Korpus SPIG werden zusätzlich die Erhebungsfragebögen, eine Liste
unveröffentlichter weiterer Aufnahmen sowie Wort- und Lemmalisten als Zusatzmaterial
zur Verfügung gestellt.
Korpus_Projekt_Kurzbeschreibunglang=en
The corpus “Sprachsituation an der innerdeutschen Grenze” (SPIG) was created as part
of the data preparation project “Sprachsituation an der innerdeutschen Grenze (SPRiG)”
(Duration: 2021-2022; Head: Nicole Palliwoda, University of Kiel, and Alexander Werth,
University of Passau; in cooperation with the Archive for Spoken German and funded
within the framework of the FDM project funding of the Consortium for the Social,
Educational, Behavioral and Economic Sciences (KonsortSWD)) and “Investigations on
the language situation in the Thuringian-Bavarian border area” (duration: 2005-2011;
Head: Rüdiger Harnisch, University of Passau; funded by the DFG, project no. 5457014).
The data was collected as part of the collaborative project “Erhebungen zur Dialektsituation
im thüringisch-bayerischen Grenzgebiet” (Surveys on the dialect situation in the Thuringian-Bavarian
border region) (duration: 1992-1994; Director: Robert Hinderling, Friedrich Schiller
University Jena, and Wolfgang Lösch, University of Bayreuth; funded by the DFG) with
the assistance of staff from the Thuringian Dictionary and the Language Atlas of Northeast
Bavaria. The initial aim of the project was to collect language data from different
age groups at the former inner-German border in order to secure the language status
on both sides of the former border for later analysis. The corpus contains language
recordings from a total of 501 respondents from 21 locations in the former Thuringian-Bavarian
border region. 20 of these places are geographically opposite each other on the former
inner-German border; the 21st place, Mödlareuth, was divided between East and West
- as was Berlin at the time. In addition to the location along the former inner-German
border, historical circumstances were also taken into account when compiling the network
of places, as they can be traced back to denominational and territorial-political
conditions in this area.
Approximately 20 respondents were interviewed per location to enable an intergenerational
comparison. These are divided into four different age groups: Year of birth around
1920 (AG 1), 1940 (AG 2), 1955 (AG 3), 1970 (AG 4). The tape recordings consist of
four parts: 1. a query of words/phrase groups to realize primary dialect characteristics
and the translation of 25 standard language sentences into the respective local dialect;
2. questions on language use and dialect evaluation using a sociolinguistic questionnaire;
3. a query of the respondents' social data; 4. a free narration in dialect (naturally
spoken everyday language) on the topic of the opening of the border in 1989.
The version of the corpus made available via the Database for Spoken German (DGD)
contains a total of 274 recordings amounting to 125 hours. These audio files are accompanied
by 482 audio-text-aligned, normalized, lemmatized and part-of-speech-tagged transcripts
according to STTS 2.0 (Westpfahl et al. 2017) in a standard orthographic transcription
of the sections containing narratives on the opening of the border. In addition to
the SPIG corpus, the survey questionnaires, a list of other unpublished recordings
as well as word and lemma lists are provided as supplementary material.
Deskriptoren
gesprochene deutsche Sprache ; Dialekt ; innerdeutsche Grenze ; Grenzöffnung ; Tonaufnahme
; Transkript ; Wortliste ; Lemmaliste
-
ErstellungsprojektTitel=Sprachsituation an der innerdeutschen Grenze
Ort
Kiel ; Passau
Institut
Christian-Albrechts-Universität zu Kiel ; Universität Passau
Typ
Datenaufbereitungsprojekt
Leiter
Nicole Palliwoda ; Alexander Werth
Auskunft
palliwoda@germsem.uni-kiel.de ; alexander.werth@uni-passau.de ; agd@ids-mannheim.de
Laufzeit
2021-2022
Anmerkungen
Von KonsortSWD gefördertes Datenaufbereitungsprojekt in Kooperation mit dem Archiv
für Gesprochenes Deutsch
-
ErstellungsprojektTitel=Untersuchungen zur Sprachsituation im thüringisch-bayerischen Grenzgebiet
Ort
Passau
Institut
Universität Passau
Typ
Datenaufbereitungsprojekt
Leiter
Rüdiger Harnisch
Auskunft
ruediger.harnisch@uni-passau.de ; agd@ids-mannheim.de
Laufzeit
2005-2011
Zentrale_Publikationen
Harnisch, Rüdiger (2008): Zur Sprachsituation im ehemaligen deutsch-deutschen Grenzgebiet
nach 40 Jahren politischer Spaltung. In: Canisius, Peter / Hammer, Erika (Hrsg.):
50 Jahre Germanistik in Pécs. Akten eines internationalen Kongresses, Oktober 2006.
Wien: Praesens, S. 83–97.
Harnisch, Rüdiger (2015): Untersuchungen zur Sprachsituation im thüringisch-bayerischen
Grenzgebiet (SPRiG). In: Kehrein, Roland / Lameli, Alfred / Rabanus, Stefan (Hrsg.):
Regionale Variation des Deutschen – Projekte und Perspektiven. Berlin/Boston: de Gruyter,
S. 219–240.
Harnisch, Rüdiger / Reinhold, Frank / Schnabel, Michael (2008): Neue Dialektgrenzen
an der ehemaligen deutsch-deutschen Grenze? In: Ernst, Peter / Patocka, Franz (Hrsg.):
Dialektgeographie der Zukunft. Akten des 2. Kongresses der Internationalen Gesellschaft
für Dialektologie des Deutschen (IGDD), Wien, September 2006. Stuttgart: Steiner,
S. 203–218.
Schnabel, Michael (2006): Dialektspaltung im thüringisch-bayerischen Grenzgebiet am
Beispiel des Ortspaars Sparnberg/Rudolphstein. Wie eine politische Grenze zur Sprachgrenze
wurde. In: Zeitschrift für Dialektologie und Linguistik 73, S. 30–54.
Anmerkungen
DFG-gefördertes Datenaufbereitungsprojekt
-
ErstellungsprojektTitel=Erhebungen zur Dialektsituation im thüringisch-bayerischen Grenzgebiet
Ort
Jena
Institut
Friedrich-Schiller-Universität Jena ; Universität Bayreuth
Typ
Datenerhebungsprojekt
Leiter
Robert Hinderling ; Wolfgang Lösch
Auskunft
agd@ids-mannheim.de
Laufzeit
1992-1994
Anmerkungen
DFG-gefördertes Datenerhebungsprojekt, zugleich Kooperationsprojekt unter Mitwirkung
von Mitarbeitenden des Thüringischen Wörterbuchs und des Sprachatlas von Nordostbayern
-
Aufzeichnungsobjekte
+
Ereignisse_Basisdaten
Anzahl
274
Beschreibung
Geplante Aufnahmeaktion
Länder_Regionen_Orte
Deutschland ; Bayern ; Thüringen
Institutionen
Nicht vorhanden
Räumlichkeiten
Private Räume der Gewährspersonen
Zeit
1992-1995
Rundfunksendungen
Nicht vorhanden
+
Sprechereignisse
+
Basisdaten
Anzahl
274
Arten
Dialektübersetzung ; soziolinguistischer Fragebogen ; Sozialdatenabfrage ; Erzählung
Forscherbeteiligung
Verbal beteiligt
Elizitiertheit
Elizitiert
Mediale_Realisierung
Face-to-face
Öffentlichkeitsgrad
Nicht öffentlich
Vorgaben
Übersetzungssätze ; Fragebogen
Sprachen
Deutsch
+
Inhalte
Beschreibung
Die Aufnahmen bestehen aus vier Teilen: 1. Abfrage von Wörtern/Satzgruppen und Übertragung
von standardsprachlichen Sätzen in den Ortsdialekt; 2. Fragen zur Sprachverwendung
und Dialektbwertung anhand eines soziolinguistischen Fragebogens; 3. Abfrage von Sozialdaten
und 4. eine freie Erzählung im Dialekt.
Themen
Übersetzung in den Ortsdialekt ; Fragen zur Sprachverwendung und Dialektbewertung
; Sozialdaten ; freie Erzählung im Dialekt
+
Sprecher
Anzahl
350
Beschreibung
342 Gewährspersonen plus 8 Explorator:innen. Die ursprünglichen 501 Gewährspersonen
des Erhebungsprojekts ergaben 20 Gewährspersonen pro Ortspunkt, die sich auf vier
Altersgruppen verteilten. In der veröffentlichten Version des Korpus entfallen Gewährspersonen
nicht zuordenbarer Aufnahmen.
-
Korpusbestandteile
+
SE-AufnahmenTyp=Audio
+
Basisdaten
Anzahl
274
+
Dauer
Einzelne_Aufnahmen
4 Minuten bis 47 Minuten
Gesamtdauer
124:58:41
Schutzbedürftige_Daten
Personennamen, weitere personenbezogene Angaben
Relation_zu_Quellaufnahmen
Nicht vorhanden
Relation_zu_Sprechereignissen
Vollständig
+
Transkribierte_SE-Aufnahmen
Anzahl
265
SE-Arten
Gesamtaufnahmen
Dauer
71 Stunden, 38 Minuten
Anmerkungen
Für die Aufnahmeereignisse sind stets nur die Dialekterzählungen zur Grenzöffnung
transkribiert.
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
482
DateigrößeEinheit=Byte
0
Datenschutz
Schutzbedürftige Daten pseudonymisiert
+
Tontechnische_Daten
Format
WAVE
Codec
PCM
Kanäle
Stereo
AbtastrateEinheit=Hz
48000
QuantisierungsrateEinheit=Bit
16
DatenrateEinheit=kBit/s
1536
Datenrate_Modus
konstant
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Anhören von Aufnahmeausschnitten in DGD
Kontakt
dgd-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Erwerb im Rahmen des AGD-Service
Kontakt
agd@ids-mannheim.de
Kosten
Gemäß Preisliste
Kosten_URL
http://agd.ids-mannheim.de/konditionen.shtml
Zugang_URL
Nicht vorhanden
+
TranskripteTyp=TT_01
+
Basisdaten
Anzahl
482
Schutzbedürftige_Daten
Personennamen, weitere personenbezogene Angaben
Relation_zu_SE-Aufnahmen
Unvollständige Transkripte
+
AnnotationenTyp=ANT_01
+
Basisdaten
Bezeichnung_in_Transkripten
Nicht vorhanden
Spezifikation
orthographische Transkription; orthographische Normalisierung ; Lemmatisierung ; POS-Tagging
Konventionen
Projektspezifisch
Zeicheninventar
Deutsches Alphabet
+
ErstellungTyp=ERT_01
Spezifikation
Ersterstellung
Projekt
Untersuchungen zur Sprachsituation im thüringisch-bayerischen Grenzgebiet
Instrumente
Microsoft Word
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
24412
Tokens:
667780
Anmerkungen
Die Transkripte lagen in Form von Worddateien ohne Zeitstempel vor.
+
ErstellungTyp=ERT_02
Spezifikation
Überarbeitung von ERT_01
Projekt
Sprachsituation an der innerdeutschen Grenze (SPRiG) ; Archiv für Gesprochenes Deutsch
Instrumente
EXMARaLDA Partitur-Editor ; Skripte
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
24412
Tokens:
667780
Anmerkungen
Überarbeitung innerhalb von aus dem DOC-Format via TXT-Format konvertierten EXB-Dateien.
+
ErstellungTyp=ERT_DB1
Spezifikation
Konvertierung von ERT_02
Projekt
Archiv für Gesprochenes Deutsch
Instrumente
Stuttgart-Tübingen-Tagset (STTS-2.0) ; TreeTagger ; Skripte
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
24412
Tokens:
667780
+
AlignmentTyp=ALT_01
Spezifikation
Automatisch
+
HerstellungErstellung_Typ=ERT_02
Anzahl:
482
Projekt:
Archiv für Gesprochenes Deutsch
Verfahren_Instrumente:
Skripte
Anmerkungen
Pseudo-Alignierung der Transkripte ohne Zeitstempel in Relation zur Gesamtlänge.
+
AlignmentTyp=ALT_02
Spezifikation
Manuell segmentweise
+
HerstellungErstellung_Typ=ERT_02
Anzahl:
482
Projekt:
Sprachsituation an der innerdeutschen Grenze (SPRiG) ; Archiv für Gesprochenes Deutsch
Verfahren_Instrumente:
EXMARaLDA Partitur-Editor
Anmerkungen:
Manuelle Nachkorrektur der Alignierung durch Hilfskräfte im Projekt sowie, nach teilweise
nötiger Realignierung infolge notwendiger Redigitalisierungen von Aufnahmen, an zu
maskierenden Stellen am AGD.
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
482
DateigrößeEinheit=Byte
0
Inhalt
ANT_01, ERT_DB1, ALT_01, ALT_02
Datenschutz
Schutzbedürftige Daten maskiert
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Recherchen in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Wortlisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Jan Gorisch
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
1184468
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Lemmalisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Jan Gorisch
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
967610
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Soziolinguistischer Fragebogen
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Beteiligte Projekte und Archiv für Gesprochenes Deutsch
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
452210
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Fragebogen mit Übersetzungsstimuli
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Beteiligte Projekte und Archiv für Gesprochenes Deutsch
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
609748
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Liste unveröffentlichter Aufnahmen
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Archiv für Gesprochenes Deutsch
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
454857
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Liste unveröffentlichter Sprecher
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Archiv für Gesprochenes Deutsch
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
796152
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
-
Dokumentationsgeschichte