-
Versionen
VersionDatum=19-12-2012ID=2.0
Erstes Release
VersionDatum=04-02-2022ID=2.17
Hinzufügen von Koordinaten zu den Ortsdaten in den Ereignis- und Sprecherdokumenten
sowie Verlinkung der Orte mit der Wissensbasis Wikidata, 93 alignierte Transkripte
im FLN-Format integriert
Namelang=de
Deutsche Mundarten: Südwestdeutschland und Vorarlberg
Namelang=en
German Dialects: Southwest Germany and Vorarlberg
Sonstige_Bezeichnungen
SV ; XI
Korpus_Projekt_Kurzbeschreibunglang=de
Das Korpus Deutsche Mundarten: Südwestdeutschland und Vorarlberg (SV--) wurde im Rahmen
eines Projekts der Tübinger Arbeitsstelle Sprache in Südwestdeutschland (damals Außenstelle
des Deutschen Spracharchivs DSAv) erstellt. Projektleiter waren Arno Ruoff und Eugen
Gabriel (für Vorarlberg). Die Tonaufnahmen dienten der Verdichtung und Ergänzung des
Korpus Deutsche Mundarten: Zwirner-Korpus (ZW--) in verschiedenen Gebieten Baden-Württembergs
und in Vorarlberg (Österreich). Die Aufnahmeaktion orientierte sich an den für das
Korpus ZW-- in Südwestdeutschland gemachten Aufnahmen. Bis zur organisatorischen Trennung
der Tübinger Arbeitsstelle vom Deutschen Spracharchiv 1970 wurden 250 Aufnahmen in
das DSAv übernommen, danach wurde das Korpus von der Tübinger Arbeitsstelle allein
mit weiteren Aufnahmen fortgeführt. Im Rahmen des gemeinsamen Transkriptionsprojekts
wurden 2021 weitere 25 Aufnahmen aus dem nur von der Tübinger Arbeitsstelle verantworteten
Teil des Korpus in das Archiv für Gesprochenes Deutsch (AGD; Nachfolger des DSAv)
übernommen. Weitere Informationen über das Projekt sind veröffentlicht in: Ruoff,
Arno (1973): Grundlagen und Methoden der Untersuchung gesprochener Sprache. IDIOMATICA
Bd. 1; Tübingen: Niemeyer. Das Korpus SV-- umfasst nach der Erweiterung 275 Tonaufnahmen,
davon sind 267 Tonaufnahmen aus der Zeit von 1963 bis 1987 mit einer Gesamtdauer von
78 Stunden und 45 Minuten extern zugänglich. Es handelt sich um Aufnahmen mit 267
Sprechern (Frauen und Männer), z.T. Gewährsleute für den Sprachatlas von Vorarlberg
und Liechtenstein und z.T. Personen aus Bessarabien (Ukraine), die nach dem Zweiten
Weltkrieg nach Württemberg umgesiedelt wurden. Aufgenommen wurden Erzählungen und
Standardtexte (Wochentage, Zahlen). Die ersten 250 Aufnahmen wurden im Archiv für
Gesprochenes Deutsch (AGD) (früher: Deutsches Spracharchiv) digitalisiert, die übrigen
25 Aufnahmen wurden in Tübingen digitalisiert und in dieser Form ins AGD übernommen.
Literarische Transkripte zu 17 Aufnahmen wurden in den beiden von der Tübinger Arbeitsstelle
zusammengestellten Alltagstext-Bänden publiziert (Ruoff, Arno (Hrsg.) (1984/1985)
Alltagstexte I und II. IDIOMATICA Bd. 10 und Bd. 11; Tübingen: Niemeyer). In einem
gemeinsamen Projekt mit dem AGD wurden 2015-2021 vom Arno-Ruoff-Archiv/Ludwig-Uhland-Institut
der Universität Tübingen (Nachfolger der Tübinger Arbeitsstelle) 93 Aufnahmen aus
Baden-Württemberg neu transkribiert, darunter die 25 neu aus Tübingen ins AGD übernommenen
Aufnahmen sowie 68 Aufnahmen aus dem älteren Bestand (an der neuen Orthografie orientierte
hochsprachliche Übertragung (Token für Token), Erläuterungen der Transkribenten, Lemmatisierung,
POS-Tagging). Die 93 Transkripte wurden mit dem Ton synchronisiert (aligniert). Anhand
der Metadaten wurden eine Themenliste und eine Liste der Berufe der Sprecher erstellt.
Das Korpus SV-- wird in der Datenbank für Gesprochenes Deutsch (DGD) bereitgestellt,
einzelne Aufnahmen können auch im persönlichen Service des AGD weitergegeben werden.
Korpus_Projekt_Kurzbeschreibunglang=en
The corpus "German Dialects: Southwest Germany and Vorarlberg" (SV--) was compiled
within the framework of a project at the Tübingen Centre for Language in Southwestern
Germany. (At the time, the Centre was a branch of the German Language Archive [Deutsches
Spracharchiv, DSAv]). The project's leaders were Arno Ruoff and Eugen Gabriel (the
latter in charge of Vorarlberg).
The sound recordings were intended to supplement the corpus of "German dialects: Zwirner-Korpus"
(ZW--) so that the combination of SV and ZW would yield denser spatial coverage of
Southwest Germany and Vorarlberg than ZW alone did. Accordingly, the recording campaign
was based on the recordings made for the corpus
ZW-- in southwest Germany. Further information about the project is published in:
Ruoff, Arno (1973): Grundlagen und Methoden der Untersuchung gesprochener Sprache
[Fundamentals and Methods of the Study of Spoken Language]. Tübingen. (Idiomatica
Vol. 1).
Up until the organizational separation of the Tübinger Arbeitsstelle [Tübingen branch]
from the Deutsches Spracharchiv in 1970, 250 recordings were transferred to the DSAv,
after which the corpus was continued by the Tübingen branch alone with further recordings.
As part of a joint transcription project, in 2021 another 25 recordings from the part
of the corpus whose collection the Tübingen branch had directed were transferred to
the Archive for Spoken German (AGD; successor to the DSAv). Following this last expansion,
the corpus SV-- comprises 275 sound recordings. 267 recordings from the period 1963
to 1987 with a total duration of 78 hours and 45 minutes are accessible externally.
The recordings feature 267 speakers (women and men), some of whom were informants
for the language atlas of Vorarlberg and Liechtenstein and some of whom were persons
from Bessarabia (Ukraine) who were resettled in Württemberg after the Second World
War. Recorded were narratives and standard texts (days of the week, numbers). The
first 250 recordings were digitized at the Archive for Spoken German (AGD) (formerly:
German Language Archive), the remaining 25 recordings were digitized at Tübingen and
transferred to the AGD in this form. Literary transcripts of 17 recordings were published
as part of the two volumes of Alltagstexte [Everyday texts] compiled by the Tübinger
Arbeitsstelle (Ruoff, Arno (ed.) (1984/1985) Alltagstexte I und II. IDIOMATICA vol.
10 and vol. 11; Tübingen: Niemeyer).
93 recordings from the Baden-Württemberg are were newly transcribed during the period
2015-2021 by the Arno Ruoff Archive/Ludwig Uhland Institute of the University of Tübingen
(successor to the Tübinger Arbeitsstelle) as part of a cooperative project with the
AGD. These transcripts cover the 25 recordings newly transferred from Tübingen to
the AGD and 68 recordings from the older holdings (high-level transcription oriented
to the new orthography (token for token), transcribers' explanations, lemmatization,
POS tagging). The 93 transcripts were synchronized (aligned) with the audio. Based
on the metadata, a list of topics and a list of speakers' occupations were generated.
The corpus SV-- is made available in the Database for Spoken German (DGD), individual
recordings can also be shared by way of the AGD' s personal service.
Deskriptoren
gesprochene deutsche Sprache ; Dialekt ; Südwestdeutschland ; Vorarlberg ; Tonaufnahme
; Themenliste ; Liste der Berufe der Sprecher
-
ErstellungsprojektTitel=Mundarten in Südwestdeutschland und Vorarlberg
Ort
Tübingen
Institut
Tübinger Arbeitsstelle Sprache in Südwestdeutschland
Typ
DFG
Leiter
Arno Ruoff
Auskunft
Nicht vorhanden
Laufzeit
Nicht dokumentiert
Zentrale_Publikationen
Ruoff, Arno (1973): Grundlagen und Methoden der Untersuchung gesprochener Sprache.
Tübingen. (Idiomatica Bd. 1).
-
Aufzeichnungsobjekte
+
Ereignisse_Basisdaten
Anzahl
267
Beschreibung
Geplante Aufnahmeaktionen
Länder_Regionen_Orte
Deutschland (Baden-Württemberg) ; Österreich (Tirol, Vorarlberg)
Institutionen
Tübinger Arbeitsstelle Sprache in Südwestdeutschland
Räumlichkeiten
Nicht dokumentiert
Zeit
1966-1970
Anmerkungen
In den Ereignisdokumenten werden z.T. historische Ortsbezeichnungen verwendet.
Rundfunksendungen
Nicht vorhanden
+
Sprechereignisse
+
Basisdaten
Anzahl
267
Arten
Erzählung ; Standardtexte (Wochentage, Zahlen)
Forscherbeteiligung
Nicht dokumentiert
Elizitiertheit
Elizitiert
Mediale_Realisierung
Face-to-face
Öffentlichkeitsgrad
Nicht öffentlich
Vorgaben
Nicht dokumentiert
Sprachen
Deutsch
+
Inhalte
Beschreibung
Nicht vorhanden
Themen
vgl. Zusatzmaterial - Themenliste
+
Sprecher
Anzahl
267
Beschreibung
Gewährsleute für den Sprachatlas von Vorarlberg und Liechtenstein
Anmerkungen
Es gibt detaillierte Sprecherdaten. In den Sprecherdokumenten werden z.T. historische
Ortsbezeichnungen verwendet.
-
Korpusbestandteile
+
QuellaufnahmenTyp=Audio
+
Basisdaten
Anzahl
242
Relation_zu_Ereignissen
Nicht dokumentiert
Herkunft
Erstellungsprojekt
+
Aufnahmetechnik
Aufnahmegeräte
Nicht dokumentiert
Mikrofone
Nicht dokumentiert
AufnahmegeschwindigkeitEinheit=cm/s
19,05
+
DistributionStelle=Nicht vorhanden
+
ZugänglichkeitArt=Nicht vorhanden
Kontakt
Nicht vorhanden
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
Nicht vorhanden
+
SE-AufnahmenTyp=Audio
+
Basisdaten
Anzahl
267
+
Dauer
Einzelne_Aufnahmen
4 Minuten, 47 Sekunden bis 1 Stunde
Gesamtdauer
78 Stunden, 43 Minuten
Schutzbedürftige_Daten
Nicht vorhanden
Relation_zu_Quellaufnahmen
Vollständig
Relation_zu_Sprechereignissen
Vollständig
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
267
DateigrößeEinheit=Byte
27567197918
Datenschutz
Nicht vorhanden
+
Tontechnische_Daten
Format
WAVE
Codec
PCM
Kanäle
Mono
AbtastrateEinheit=Hz
44100
QuantisierungsrateEinheit=Bit
16
DatenrateEinheit=kBit/s
705
Datenrate_Modus
konstant
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Anhören von Aufnahmeausschnitten in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Erwerb im Rahmen des AGD-Service
Kontakt
agd@ids-mannheim.de
Kosten
Gemäß Preisliste
Kosten_URL
http://agd.ids-mannheim.de/konditionen.shtml
Zugang_URL
Nicht vorhanden
+
TranskripteTyp=TT_01
+
Basisdaten
Anzahl
93
Schutzbedürftige_Daten
Nicht vorhanden
Relation_zu_SE-Aufnahmen
Vollständig
+
AnnotationenTyp=ANT_01
+
Basisdaten
Bezeichnung_in_Transkripten
Nicht vorhanden
Spezifikation
Wortlaut in neuer Orthographie ; Satzzeichen nach Standard-Interpunktion ; zusätzliche
Notationen ; Lemmatisierung ; POS-Tagging
Konventionen
Projektspezifisch
Zeicheninventar
Deutsches Alphabet
+
ErstellungTyp=ERT_01
Spezifikation
Ersterstellung
Projekt
Sprachalltag II
Instrumente
EXMARaLDA Partitur-Editor
+
Ergebnisse_UmfangDefinition_Einheiten=Wort(segment/verschleifung)
Types:
13802
Tokens:
251920
+
ErstellungTyp=ERT_DB1
Spezifikation
Konvertierung der ERT_01-Fassung
Projekt
Archiv für Gesprochenes Deutsch
Instrumente
Java/python/xslt ; Stuttgart-Tübingen-Tagset (STTS) ; TreeTagger
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
13802
Tokens:
251920
Anmerkungen
Manuelle Nachkorrektur von Verweisen ins Ruoff-Glossar.
+
AlignmentTyp=ALT_01
Spezifikation
Manuell segmentweise
+
HerstellungErstellung_Typ=ERT_01
Anzahl:
93
Projekt:
Sprachalltag II
Verfahren_Instrumente:
EXMARaLDA Partitur-Editor
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
126
DateigrößeEinheit=Byte
24745005
Inhalt
ANT_01, ERT_DB1, ALT_01
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Recherchen in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Themenliste
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
44340
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Liste der sprachlichen Besonderheiten
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
36049
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Liste der Berufe der Sprecher
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
12471
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Notizen für interne Zwecke
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
59701
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Nicht vorhanden
+
ZugänglichkeitArt=Nicht vorhanden
Kontakt
Nicht vorhanden
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
Nicht vorhanden
-
Dokumentationsgeschichte
UpdateDatum=2021-01-22
Anmerkungen
Im Gesamtkatalog der Tonaufnahmen des Deutschen Spracharchivs sind acht SV-Aufnahmen
mit Sperrvermerken verzeichnet. Diese Materialien wurden in der DGD nicht berücksichtigt.
Im Jahr 2015 wurden die Ortsangaben in Ereignis- und Sprecherdokumenten überprüft
und an die aktuelle Verwaltungsliederung angepasst. In 2021 kamen neue Transkripte
aus einer Kooperation mit dem Arno-Ruoff-Archiv an der Universität Tübingen hinzu.