-
Versionen
VersionDatum=13-04-2016ID=2.6
Erstes Release
VersionDatum=24-11-2017ID=2.9
Orthographische Normalisierung manuell korrigiert
Namelang=de
Mehrsprachige Kinder im Vorschulalter
Namelang=en
Multilingual Children at Pre-school Age (MEKI)
Sonstige_Bezeichnungen
MEKI
Korpus_Projekt_Kurzbeschreibunglang=de
Das Korpus Mehrsprachige Kinder im Vorschulalter (MEKI) wurde im Rahmen einer Begleitstudie
zur Implementierung von Sprachfördermaßnahmen erstellt. Ziel war es, über einen Zeitraum
von neun Monaten die sprachliche Entwicklung von Kindern im Alter von 5-7 Jahren vor
Eintritt in die Grundschule unter Förderbedingungen zu untersuchen
Die Datenerhebung erfolgte über einen Zeitraum von 10 Monaten im Rahmen sprachdidaktischer
Angebote in Kindertagesstätten bzw. in einem Vorlaufkurs einer Grundschule.
Die beobachteten Kindergruppen bestanden aus acht bis zwölf Kindern. Das Gruppengeschehen
wurde mit Videokameras dokumentiert. Als teilnehmende Beobachterin war die Forscherin
am Rande in das Geschehen einbezogen. Auf- und Abbau der Videoausrüstung erfolgte
gemeinsam mit den Kindern, wodurch die Kinder die Aufnahmesituation als Teil der Gesamtsituation
erlebten. Neben dem Geschehen in der Sprachfördergruppe wurden Erzählungen in Elizitationssituationen
aufgenommen. Die im IDS archivierte Version des Korpus MEKI umfasst 85 Aufnahmen
mit einer Gesamtdauer von 3 Stunden, 8 Minuten, 82 Transkripte sowie alphabetisch
und nach Frequenzen geordnete Wort- und Lemmalisten. Die Aufnahmen wurden im Archiv
für Gesprochenes Deutsch (AGD) tontechnisch bearbeitet und anonymisiert. Die Transkripte
(orthographische Transkription; orthographische Normalisierung ; Lemmatisierung ;
POS-Tagging) wurden im AGD überprüft, ggf. ergänzt, korrigiert und mit dem Ton synchronisiert
(aligniert). Die im IDS archivierte Version des Korpus MEKI wird in der Datenbank
für Gesprochenes Deutsch (DGD) bereitgestellt.
Korpus_Projekt_Kurzbeschreibunglang=en
The Corpus Multilingual Children at Pre-school Age (MEKI) was created as part of a
study that accompanied the implementation of a language support program. The aim of
the study was to examine the linguistic development of children aged 5-7 years who
had not yet entered primary school under the conditions of a language support program
over a period of nine months. The data was collected over a period of 10 months in
the context of language didactic offerings made at day-care centres or as part of
a preparatory course at a primary school.
The groups of children observed consisted of eight to twelve children. The group events
were documented with video cameras. As a participating observer, the researcher was
marginally involved in the events.
The video equipment was set up and disassembled together with the children, so that
the children experienced the recording situation as part of the overall situation.
In addition to the events in the language support group, stories were recorded in
elicitation settings.
The version of the MEKI corpus that is archived at the IDS contains 85 recordings
with a total duration of 3 hours and 8 minutes.
82 transcripts are available as well as word and lemma lists ordered alphabetically
and according to frequencies.
The recordings have been sound-edited and anonymized at the Archive for Spoken German
(AGD).
The transcripts (orthographic transcription; orthographic normalization; lemmatization;
POS tagging) were checked in the AGD,
amended as necessary, corrected and synchronized with the audio signal (aligned).
The version of the corpus MEKI archived at the IDS is available online via the Database
for Spoken German (DGD).
Deskriptoren
gesprochene deutsche Sprache ; kindlicher Spracherwerb ; mehrsprachige Kinder ; Migranten
; Tonaufnahme ; Transkript ; Wortliste ; Lemmaliste
-
ErstellungsprojektTitel=Sprachförderung in Rheinland-Pfalz
Ort
München
Institut
Ludwig-Maximilians-Universität, LIPP
Typ
Eigenprojekt ; gefördert von Ministerium für Kinder, Familie und Soziales Rheinland-Pfalz
Leiter
Elke Montanari
Auskunft
agd@ids-mannheim.de
Laufzeit
2004-2006
Zentrale_Publikationen
Montanari, E. (2007): Begleitstudie zu den Sprachfördermaßnahmen in Rheinland-Pfalz.
Bericht an das Ministerium für Bildung, Wissenschaft, Jugend und Kultur (MBWJK) in
Rheinland-Pfalz.
Montanari, Elke (2010): Kindliche Mehrsprachigkeit – Determination und Genus. Münster:
Waxmann
Montanari, Elke (2012): Determination im mehrsprachigen Deutscherwerb. In: Hoffmann,
L. (Hg.) Migration – Mehrsprachigkeit – Bildung. Tübingen: Stauffenburg, 345–359.
Montanari, Elke (2013): Kinder erzählen von Gewalterfahrungen. In: Kühndel, D., Naglo,
K. und Rink, E. (Hgg.), Sieben Säulen DaF. Aspekte einer Transnationalen Germanistik.
Heidelberg: Synchron.
Montanari, Elke (2014): Zwischen Frosch und Kaulquappe: Genus als Kongruenzproblem
mehrsprachiger Kinder in der Sprachdidaktik. In: Bredel, U., Ezhova-Heer, I. und Schlickau,
S. (Hgg.), Zur Sprache.kɔm. Deutsch als Fremd- und Zweitsprache. FADAF.
Montanari, E. (2014): Grammatical gender in discourse in child multilingual acquisition
of German. Linguistics Online, Language Convergence in Bi- and Multilinguals. www.linguistik-online.de/64_14.
-
Aufzeichnungsobjekte
+
Ereignisse_Basisdaten
Anzahl
55
Beschreibung
Geplante Aufnahmeaktion
Länder_Regionen_Orte
Deutschland (Hessen, Rheinland-Pfalz)
Institutionen
Kindertagesstätten ; Grundschule
Räumlichkeiten
Räume in Kindertagesstätten und in einer Grundschule
Zeit
2005-2006
Rundfunksendungen
Nicht vorhanden
+
Sprechereignisse
+
Basisdaten
Anzahl
85
Arten
Evokatives Feldexperiment - Erzählung ; Sprachstandserhebung - HAVAS
Forscherbeteiligung
Verbal beteiligt ; Nicht verbal beteiligt
Elizitiertheit
Elizitiert
Mediale_Realisierung
Face-to-face
Öffentlichkeitsgrad
Nicht öffentlich
Vorgaben
für Sprachstandserhebung: sechsteiligen Bildfolge "Katze und Vogel"
Sprachen
Deutsch
+
Inhalte
Beschreibung
HAVAS (Hamburger Verfahren zur Analyse des Sprachstands) ; Nicht vorhanden
Themen
vgl. Ereignisdokumente
+
Sprecher
Anzahl
28
Beschreibung
Mehrsprachige Kinder mit unterschiedlichen Erstsprachen und Deutsch als Zweitsprache
sowie einige Kontaktpersonen dieser Kinder. Von einer Ausnahme abgesehen sind alle
Kinder in Deutschland geboren. Nur ein Junge migrierte mit seiner Familie nach Deutschland,
als er ein Jahr alt war. Die Kinder waren zu Beobachtungsbeginn zwischen fünf und
sechs Jahren alt. Sie besuchten eine Kindertagesstätte (seit mindestens zwei Jahren)
und Sprachfördermaßnahmen in Kindertagesstätten in Rheinland-Pfalz bzw. in einem Vorlaufkurs
einer Grundschule in Hessen. Der sozioökonomische Status von fast allen Eltern war
niedrig, nur bei einen Elternpaar wurde dieser Status im mittleren Bereich angesiedelt.
Alle Elternteile sprachen Deutsch (auf unterschiedlichem Niveau) als Zweitsprache,
in den Familien wurde neben anderen Sprachen auch Deutsch gesprochen. Die Kinder lebten
in einem multiethnischen und multilingualen Wohngebiet, in dem Deutsch die Verkehrssprache
des Alltags war.
-
Korpusbestandteile
+
QuellaufnahmenTyp=Video
+
Basisdaten
Anzahl
85
Relation_zu_Ereignissen
Nicht dokumentiert
Herkunft
Elke Montanari
+
Aufnahmetechnik
Aufnahmegeräte
Sony
Mikrofone
Nicht dokumentiert
+
DistributionStelle=Nicht vorhanden
+
ZugänglichkeitArt=Nicht vorhanden
Kontakt
Nicht vorhanden
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
Nicht vorhanden
+
SE-AufnahmenTyp=Tonkopie von Video
+
Basisdaten
Anzahl
85
+
Dauer
Einzelne_Aufnahmen
15 Sekunden bis 14 Minuten, 51 Sekunden
Gesamtdauer
3 Stunden, 8 Minuten
Schutzbedürftige_Daten
Personennamen und Ortsnamen
Relation_zu_Quellaufnahmen
Segmente
Relation_zu_Sprechereignissen
Vollständig
+
Transkribierte_SE-Aufnahmen
Anzahl
82
SE-Arten
Evokatives Feldexperiment - Erzählung ; Sprachstandserhebung - HAVAS
Dauer
2 Stunden, 48 Minuten
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
85
DateigrößeEinheit=Byte
2166204588
Datenschutz
Schutzbedürftige Daten anonymisiert
+
Tontechnische_Daten
Format
WAVE
Codec
PCM
Kanäle
Stereo
AbtastrateEinheit=Hz
48000
QuantisierungsrateEinheit=Bit
16
DatenrateEinheit=kBit/s
1536
Datenrate_Modus
konstant
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Anhören von Aufnahmeausschnitten in DGD
Kontakt
dgd-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Erwerb im Rahmen des AGD-Service
Kontakt
agd@ids-mannheim.de
Kosten
Gemäß Preisliste
Kosten_URL
http://agd.ids-mannheim.de/konditionen.shtml
Zugang_URL
Nicht vorhanden
+
TranskripteTyp=TT_01
+
Basisdaten
Anzahl
82
Schutzbedürftige_Daten
Personennamen und Ortsnamen
Relation_zu_SE-Aufnahmen
Teiltranskript ; vollständige Transkripte
+
AnnotationenTyp=ANT_01
+
Basisdaten
Bezeichnung_in_Transkripten
Nicht vorhanden
Spezifikation
orthographische Transkription; orthographische Normalisierung ; Lemmatisierung ; POS-Tagging
Konventionen
HIAT
Zeicheninventar
Deutsches Alphabet
+
ErstellungTyp=ERT_01
Spezifikation
Ersterstellung
Projekt
Sprachförderung in Rheinland-Pfalz
Instrumente
EXMARaLDA Partitur-Editor
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
Nicht dokumentiert
Tokens:
Nicht dokumentiert
+
ErstellungTyp=ERT_01
Spezifikation
Ersterstellung
Projekt
Archiv für Gesprochenes Deutsch
Instrumente
EXMARaLDA Partitur-Editor
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
Nicht dokumentiert
Tokens:
Nicht dokumentiert
Anmerkungen
9 Transkripte
+
ErstellungTyp=ERT_02
Spezifikation
Überarbeitung von ERT_01
Projekt
Archiv für Gesprochenes Deutsch
Instrumente
EXMARaLDA Partitur-Editor
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
2108
Tokens:
17473
+
ErstellungTyp=ERT_DB1
Spezifikation
Konvertierung von ERT_02
Projekt
Archiv für Gesprochenes Deutsch
Instrumente
OrthoNormal ; Stuttgart-Tübingen-Tagset (STTS) ; TreeTagger
+
Ergebnisse_UmfangDefinition_Einheiten=Wörter
Types:
2108
Tokens:
17473
+
AlignmentTyp=ALT_01
Spezifikation
Manuell segmentweise
+
HerstellungErstellung_Typ=ERT_02
Anzahl:
82
Projekt:
Archiv für Gesprochenes Deutsch
Verfahren_Instrumente:
EXMARaLDA Partitur-Editor
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
82
DateigrößeEinheit=Byte
2351448
Inhalt
ANT_01, ERT_DB1, ALT_01
Datenschutz
Schutzbedürftige Daten maskiert
+
Technische_Daten
Format
XML
Character_Encoding
UTF-8
Anmerkungen
Format, das das Tool OrthoNormal schreiben und lesen kann.
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZugänglichkeitArt=Recherchen in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Wortlisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Thomas Schmidt
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
89057
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
+
ZusatzmaterialArt=Lemmalisten
+
Basisdaten
Anzahl
2
Schutzbedürftige_Daten
Nicht vorhanden
Sprache
Deutsch
Urheber
Thomas Schmidt
+
Digitale_FassungenTyp=DFT_01
+
Basisdaten
Anzahl
2
DateigrößeEinheit=Byte
48568
Datenschutz
Nicht vorhanden
+
Technische_Daten
Format
TXT
Character_Encoding
UTF-8
+
DistributionStelle=Archiv für Gesprochenes Deutsch
+
ZugänglichkeitArt=Ansicht und Download in DGD
Kontakt
dgd@ids-mannheim.de
Kosten
Nicht vorhanden
Kosten_URL
Nicht vorhanden
Zugang_URL
http://dgd.ids-mannheim.de
-
Dokumentationsgeschichte