-
Versionen
VersionDatum=19-12-2012ID=2.0
Erstes Release
VersionDatum=04-02-2022ID=2.17
Hinzufügen von Koordinaten zu den Ortsdaten in den Ereignis- und Sprecherdokumenten
sowie Verlinkung der Orte mit der Wissensbasis Wikidata, 126 alignierte Transkripte
im FLN-Format integriert
Namelang=de
Deutsche Mundarten: Schwarzwald
Namelang=en
German Dialects: Black Forest
Sonstige_Bezeichnungen
SW ; X
Korpus_Projekt_Kurzbeschreibunglang=de
Das Korpus Deutsche Mundarten: Schwarzwald (SW--) wurde im Rahmen eines Projekts der
Tübinger Arbeitsstelle Sprache in Südwestdeutschland (damals Außenstelle des Deutschen
Spracharchivs DSAv) erstellt. Projektleiter war Arno Ruoff. Die Aufnahmen dienten
der Verdichtung und Ergänzung des Korpus Deutsche Mundarten: Zwirner-Korpus (ZW--).
Die Aufnahmeaktion orientierte sich an den für das Korpus ZW-- gemachten Aufnahmen.
Die Daten sollten u.a. Analysen der Ortssprachen von drei Weilern im nördlichen Schwarzwald
(Schönmünz, Romishorn und St. Roman) ermöglichen. Die etwas abseits gelegenen Orte
wurden bewusst ausgewählt, weil dort noch in weitaus reinerer Form erhaltene Ortsmundarten
vermutet wurden. Weitere Informationen über das Projekt sind veröffentlicht in: Ruoff,
Arno (1973): Grundlagen und Methoden der Untersuchung gesprochener Sprache. IDIOMATICA
Bd. 1; Tübingen: Niemeyer. Das Korpus SW-- umfasst 130 Tonaufnahmen, davon sind 126
Tonaufnahmen aus den Jahren 1964 und 1974 mit einer Gesamtdauer von 36 Stunden und
31 Minuten extern zugänglich. Es handelt sich um Aufnahmen mit (122) Sprechern (Frauen
und Männer) aus den damaligen Kreisen Freudenstadt und Wolfach. Bei 5 Sprechern wurde
1974 mit 10 Jahren Abstand eine zweite Aufnahme durchgeführt. Aufgenommen wurden die
Vorlesesprache, Erzählungen und Standardtexte (Wochentage, Zahlen). Die Aufnahmen
wurden im Archiv für Gesprochenes Deutsch (AGD) (früher: Deutsches Spracharchiv) digitalisiert.
Literarische Transkripte zu 10 Aufnahmen wurden in den beiden von der Tübinger Arbeitsstelle
zusammengestellten Alltagstext-Bänden publiziert (Ruoff, Arno (Hrsg.) (1984/1985)
Alltagstexte I und II. IDIOMATICA Bde. 10 und 11; Tübingen: Niemeyer). 126 Aufnahmen
wurden in einem gemeinsamen Projekt mit dem AGD 2015-2021 vom Arno-Ruoff-Archiv/Ludwig-Uhland-Institut
der Universität Tübingen (Nachfolger der Tübinger Arbeitsstelle) neu transkribiert
(an der neuen Orthografie orientierte hochsprachliche Übertragung (Token für Token),
Erläuterungen der Transkribenten, Lemmatisierung, POS-Tagging). Die Transkripte wurden
mit dem Ton synchronisiert (aligniert). Anhand der Metadaten wurden eine Themenliste
und eine Liste der Berufe der Sprecher erstellt. Das Korpus SW-- wird in der Datenbank
für Gesprochenes Deutsch (DGD) bereitgestellt, einzelne Aufnahmen können auch im persönlichen
Service des AGD weitergegeben werden.
Korpus_Projekt_Kurzbeschreibunglang=en
The corpus "German Dialects: Black Forest" (SW--) was created within the framework
of a project of the Tübingen Center for the Language of Southwestern Germany. (At
the time, the Center was a branch of the German Language Archive [DSAv]). The project's
leader was Arno Ruoff.
The recordings for SW were intended to supplement the corpus "German dialects: Zwirner
corpus" (ZW--), leading to denser spatial coverage of the Black Forest area. The recording
campaign thus took the recordings made for the ZW-- corpus as a point of reference.
The data should, among other things, enable analyses of the local languages of three
hamlets (Schönmünz, Romishorn and St. Roman). These more remote places were chosen
deliberately, because it was suspected that local dialects were still preserved there
in much purer form.
Further information about the project is published in: Ruoff, Arno (1973): Grundlagen
und Methoden der Untersuchung gesprochener Sprache [Fundamentals and Methods of the
Investigation of Spoken Language]. Tübingen. (Idiomatica vol. 1).
The corpus SW-- is made up of 130 sound recordings. 126 of these, collected during
the period 1964 to 1974 with a total duration of 36 hours and 31 minutes, are externally
accessible. These are recordings with (122) speakers (women and men) from the former
districts of Freudenstadt and Wolfach. For 5 speakers, a second recording was made
in 1974, 10 years after the first. Recorded were read-aloud speech, narrations and
standard texts (days of the week, numbers). The recordings were digitized at the Archive
for Spoken German (AGD) (formerly: German Language Archive). Literary transcripts
of 10 recordings were published in the two volumes of Alltagstexte [Everyday texts]
compiled by the Tübinger Arbeitsstelle (Ruoff, Arno (ed.) (1984/1985) Alltagstexte
I und II. IDIOMATICA vols. 10 and 11; Tübingen: Niemeyer).
126 recordings were newly transcribed (high-level transcription oriented to the new
orthography (tokens for tokens), transcribers' explanations, lemmatization, POS tagging)
by the Arno-Ruoff-Archiv/Ludwig-Uhland-Institut of the University of Tübingen (successor
to the Tübingen Arbeitsstelle) in a joint project with the AGD during the period 2015-2021.
The transcripts were synchronized (aligned) with the audio. A list of topics and a
list of speakers' occupations were created based on the available metadata. The corpus
SW-- is made available as part of the Database for Spoken German (DGD), individual
recordings can also be shared through the personal service of the AGD.
Deskriptoren
gesprochene deutsche Sprache ; Dialekt ; Schwarzwald ; Tonaufnahme ; Themenliste ;
Liste der Berufe der Sprecher
-
ErstellungsprojektTitel=Mundarten im Schwarzwald
Ort
Tübingen
Institut
Tübinger Arbeitsstelle Sprache in Südwestdeutschland
Typ
DFG
Leiter
Arno Ruoff
Auskunft
Nicht vorhanden
Laufzeit
Nicht dokumentiert
Zentrale_Publikationen
Ruoff, Arno (1973): Grundlagen und Methoden der Untersuchung gesprochener Sprache.
Tübingen. (Idiomatica Bd. 1).
-
Aufzeichnungsobjekte
+
Ereignisse_Basisdaten
Anzahl
126
Beschreibung
Geplante Aufnahmeaktionen
Länder_Regionen_Orte
Deutschland (Baden-Württemberg)
Institutionen
Tübinger Arbeitsstelle Sprache in Südwestdeutschland
Räumlichkeiten
Nicht dokumentiert
Zeit
1964/1974
Anmerkungen
In den Ereignisdokumenten werden z.T. historische Ortsbezeichnungen verwendet.
Rundfunksendungen
Nicht vorhanden
+
Sprechereignisse
+
Basisdaten
Anzahl
126
Arten
Erzählung ; Vorlesen ; Standardtexte (Zahlen, Wochentage, Testsätze)
Forscherbeteiligung
Nicht dokumentiert
Elizitiertheit
Elizitiert
Mediale_Realisierung
Face-to-face
Öffentlichkeitsgrad
Nicht öffentlich
Vorgaben
Nicht dokumentiert
Sprachen
Deutsch
+
Inhalte
Beschreibung
Nicht vorhanden
Themen
vgl. Zusatzmaterial - Themenliste
+
Sprecher
Anzahl
122
Beschreibung
Fast alle Einwohner ab dem fünften Lebensjahr in drei Weilern.
Anmerkungen
Es gibt detaillierte Sprecherdaten. In den Sprecherdokumenten werden z.T. historische
Ortsbezeichnungen verwendet.
-
Korpusbestandteile
+
QuellaufnahmenTyp=Audio
+
Basisdaten
Anzahl
126
Relation_zu_Ereignissen
Nicht dokumentiert
Herkunft
Erstellungsprojekt
+
Aufnahmetechnik
Aufnahmegeräte
Nicht dokumentiert
Mikrofone
Nicht dokumentiert
AufnahmegeschwindigkeitEinheit=cm/s
19,05
+
DistributionStelle=Nicht vorhanden
+
ZugänglichkeitArt=Nicht vorhanden
Kontakt
Nicht vorhanden
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
Nicht vorhanden
+
SE-AufnahmenTyp=Audio
+
Basisdaten
Anzahl
126
+
Dauer
Einzelne_Aufnahmen
1 Minute, 55 Sekunden bis 1 Stunde, 21 Minuten
Gesamtdauer
36 Stunden, 31 Minuten
Schutzbedürftige_Daten
Nicht vorhanden
Relation_zu_Quellaufnahmen
Vollständig
Relation_zu_Sprechereignissen
Vollständig
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
126
DateigrößeEinheit=Byte
11645354196
Datenschutz
Nicht vorhanden
+
Tontechnische_Daten
Format
WAVE
Codec
PCM
Kanäle
Mono
AbtastrateEinheit=Hz
44100
QuantisierungsrateEinheit=Bit
16
DatenrateEinheit=kBit/s
705
Datenrate_Modus
konstant
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Anhören von Aufnahmeausschnitten in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Erwerb im Rahmen des AGD-Service
Kontakt
agd@ids-mannheim.de
Kosten
Gemäß Preisliste
Kosten_URL
http://agd.ids-mannheim.de/konditionen.shtml
Zugang_URL
Nicht vorhanden
+
TranskripteTyp=TT_01
+
Basisdaten
Anzahl
126
Schutzbedürftige_Daten
Nicht vorhanden
Relation_zu_SE-Aufnahmen
Vollständig
+
AnnotationenTyp=ANT_01
+
Basisdaten
Bezeichnung_in_Transkripten
Nicht vorhanden
Spezifikation
Wortlaut in neuer Orthographie ; Satzzeichen nach Standard-Interpunktion ; zusätzliche
Notationen ; Lemmatisierung ; POS-Tagging
Konventionen
Projektspezifisch
Zeicheninventar
Deutsches Alphabet
+
ErstellungTyp=ERT_01
Spezifikation
Ersterstellung
Projekt
Sprachalltag II
Instrumente
EXMARaLDA Partitur-Editor
+
Ergebnisse_UmfangDefinition_Einheiten=Wort(segment/verschleifung)
Types:
14297
Tokens:
322223
+
ErstellungTyp=ERT_DB1
Spezifikation
Konvertierung der ERT_01-Fassung
Projekt
Archiv für Gesprochenes Deutsch
Instrumente
Java/python/xslt ; Stuttgart-Tübingen-Tagset (STTS) ; TreeTagger
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
14297
Tokens:
322223
Anmerkungen
Manuelle Nachkorrektur von Verweisen ins Ruoff-Glossar.
+
AlignmentTyp=ALT_01
Spezifikation
Manuell segmentweise
+
HerstellungErstellung_Typ=ERT_01
Anzahl:
126
Projekt:
Sprachalltag II
Verfahren_Instrumente:
EXMARaLDA Partitur-Editor
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
126
DateigrößeEinheit=Byte
31327891
Inhalt
ANT_01, ERT_DB1, ALT_01
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Recherchen in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Themenliste
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
21153
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Liste der sprachlichen Besonderheiten
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
22817
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Liste der Berufe der Sprecher
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
7189
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Notizen für interne Zwecke
+
Basisdaten
Anzahl
1
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Sylvia Dickgießer
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
1
DateigrößeEinheit=Byte
7504
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
PDF
Character_Encoding
Ansi
+
DistributionStelle=Nicht vorhanden
+
ZugänglichkeitArt=Nicht vorhanden
Kontakt
Nicht vorhanden
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
Nicht vorhanden
-
Dokumentationsgeschichte
UpdateDatum=2022-01-22
Anmerkungen
Im Gesamtkatalog der Tonaufnahmen des Deutschen Spracharchivs sind vier SW-Aufnahmen
mit Sperrvermerken verzeichnet. Diese Materialien wurden in der DGD nicht berücksichtigt.
Im Jahr 2015 wurden die Ortsangaben in Ereignis- und Sprecherdokumenten überprüft
und an die aktuelle Verwaltungsliederung angepasst. In 2021 kamen neue Transkripte
aus einer Kooperation mit dem Arno-Ruoff-Archiv an der Universität Tübingen hinzu.