Parallel European Corpus of Informal Interaction Parallel European Corpus of Informal Interaction (PECII)

Korpusxsi:noNamespaceSchemaLocation=http://agd.ids-mannheim.de/xml/IDS_corpus_catalogue_extern_v2.17.xsdKennung=PECIin_DGD_seit=2.25

Versionen

VersionID=2.25Datum=23-02-2026

Erstveröffentlichung

Namelang=de

Parallel European Corpus of Informal Interaction

Namelang=en

Parallel European Corpus of Informal Interaction

Sonstige_Bezeichnungen

PECII

Korpus_Projekt_Kurzbeschreibunglang=de

Das „Parallel European Corpus of Informal Interaction“ (PECI) geht zurück auf eine Initiative von Lorenza Mondada (Universität Basel), Giovanni Rossi (University of California), Anna Vatanen (University Helsinki), Matylda Weidner (University Bydgoszcz) und Jörg Zinken (IDS Mannheim). Das Korpus soll eine Datengrundlage für vergleichende Forschung zu sozialer Interaktion bereitstellen. In der hier zur Verfügung gestellten Version umfasst das Korpus soziale Interaktionen in vier Sprachen: Deutsch, Englisch (in erster Linie britisches Englisch), Italienisch und Polnisch. Das Korpus wurde im Rahmen des von der Leibniz-Gemeinschaft im SAW-Wettbewerbsverfahren geförderten Projekts „Norms, rules and morality across languages“ (2020–2023) fertig gestellt. Projektleiter war Jörg Zinken (IDS Mannheim). Projektmitarbeiter*innen waren Laurenz Kornfeld, Uwe-A. Küttner, Christina Mack und Jowita Rogowska. Kooperationspartner*innen waren Giovanni Rossi (University of California), Matylda Weidner (University Bydgoszcz), Lorenza Mondada (University Basel) und Marja-Leena Sorjonen (University Helsinki). Das Korpus umfasst Videoaufnahmen von drei sozialen Aktivitäten: Familien, die am Wochenende gemeinsam frühstücken (zu einem kleinen Teil auch andere Arten von gemeinsamen Mahlzeiten); Freund*innen und Verwandte, die gemeinsam ein Brettspiel spielen; und Freund*innen, die gemeinsam eine längere Autofahrt unternehmen. Die Aufnahmen wurden in Deutschland, England, Italien und Polen gemacht. Einige der Aufnahmen wurden im Zeitraum zwischen 2015 und 2018 erhoben; die restlichen Aufnahmen während der Projektlaufzeit im Rahmen von Feldaufenthalten in den Jahren 2021 und 2022. Insgesamt umfasst das Korpus 83 Audio-/Videoaufnahmen von 254 beteiligten Sprecher*innen mit einer Gesamtlänge von 76:51 Stunden. Alle Aufnahmen liegen als Videodateien (zwei Kameraperspektiven) und als Audiodateien vor. Zu 81 der 83 Aufnahmen liegen an die cGAT-Konventionen angelehnte Transkriptionen vor. Die Transkripte sind mit drei weiteren Annotationsebenen versehen: orthographische Normalisierung, Lemmatisierung und sprachspezifisches Part-of-Speech-Tagging. Darüber hinaus stehen ausführliche Metadaten zu den Sprechereignissen und den beteiligten Sprecher*innen zur Verfügung, die per Fragebogen erhoben wurden. Die Metadaten wurden mithilfe maschineller Übersetzung übersetzt und werden viersprachig bereitgestellt. Als Zusatzmaterial stehen Wort- und Lemmalisten, Übersichten der Aufnahmesettings und eine Liste der verwendeten Spiele in den Spieleaufnahmen zur Verfügung. Einzelne deutschsprachige Ereignisse des PECI-Korpus sind zugleich Teil des FOLK-Korpus (s. sonstige Bezeichnungen). Wenn Sie Daten aus dem PECI-Korpus verwenden, zitieren Sie bitte den folgenden Artikel: Küttner, Uwe-A. / Kornfeld, Laurenz / Mack, Christina / Mondada, Lorenza / Rogowska, Jowita / Rossi, Giovanni / Sorjonen, Marja-Leena / Weidner, Matylda / Zinken, Jörg (2024): Introducing the “Parallel European Corpus of Informal Interaction” (PECII). A novel resource for exploring cross-situational and cross-linguistic variability in social interaction. In: Margret Selting und Dagmar Barth-Weingarten (eds.): New Perspectives in Interactional Linguistic Research. Amsterdam/Philadelphia: John Benjamins (Studies in Language and Social Interaction, vol. 36), pp. 132–160.

Korpus_Projekt_Kurzbeschreibunglang=en

The “Parallel European Corpus of Informal Interaction” (PECI) has its origins in an initiative by Lorenza Mondada (University of Basel), Giovanni Rossi (University of California), Anna Vatanen (University of Helsinki), Matylda Weidner (University of Bydgoszcz) and Jörg Zinken (IDS Mannheim). The corpus is intended to provide a data basis for comparative research on social interaction. In the version provided here, the corpus contains social interactions in four languages: German, English (primarily British English), Italian and Polish. The corpus was completed as part of the project “Norms, rules and morality across languages” (2020–2023), funded by the Leibniz Association in the SAW competition process. The project was led by Jörg Zinken (IDS Mannheim). Team members working on the project were Laurenz Kornfeld, Uwe-A. Küttner, Christina Mack and Jowita Rogowska. Cooperation partners were Giovanni Rossi (University of California), Matylda Weidner (University of Bydgoszcz), Lorenza Mondada (University of Basel) and Marja-Leena Sorjonen (University of Helsinki). The corpus comprises video recordings of three social activities: families having breakfast together at the weekend (and, to a small extent, other meal time events); friends and relatives playing a board game together; and friends taking a car trip out of town together. The recordings were made in Germany, England, Italy and Poland. Some of the recordings were collected during a pilot phase of the project, between 2015 and 2018; the remaining recordings during fieldwork in 2021 and 2022. In total, the corpus comprises 83 audio/video recordings from 254 participating speakers with a total length of 76:51 hours. All recordings are available as video files (two camera angles) and audio files. Transcriptions based on cGAT conventions are available for 81 of the 83 recordings. The transcripts are annotated with three additional annotation levels: orthographic normalisation, lemmatisation, and a language-specific part-of-speech tagging. In addition, detailed metadata on the speech events and the speakers involved, collected via questionnaires, is available. The metadata has been translated using machine translation and is available in four languages. Additional material includes word and lemma lists, overviews of the recording settings, and a list of the games used in the game recordings. Individual German-language events in the PECI corpus are also part of the FOLK corpus (see other designations). If you use data from the PECI corpus, please cite the following article: Küttner, Uwe-A. / Kornfeld, Laurenz / Mack, Christina / Mondada, Lorenza / Rogowska, Jowita / Rossi, Giovanni / Sorjonen, Marja-Leena / Weidner, Matylda / Zinken, Jörg (2024): Introducing the “Parallel European Corpus of Informal Interaction” (PECII). A novel resource for exploring cross-situational and cross-linguistic variability in social interaction. In: Margret Selting and Dagmar Barth-Weingarten (eds.): New Perspectives in Interactional Linguistic Research. Amsterdam/Philadelphia: John Benjamins (Studies in Language and Social Interaction, vol. 36), pp. 132–160.

Deskriptoren

gesprochene deutsche Sprache ; gesprochene englische Sprache ; gesprochene italienische Sprache ; gesprochene polnische Sprache ; Vergleichskorpus ; private Interaktion ; Tonaufnahme ; Videoaufnahme ; Transkript ; Wortliste ; Lemmaliste

ErstellungsprojektTitel=Normen, Regeln und Moral im alltäglichen Leben (NoRM-aL)

Ort

Mannheim

Institut

Leibniz-Institut für Deutsche Sprache

Typ

Drittmittelprojekt ; gefördert vom Senatsausschuss Wettbewerb (SAW) der Leibniz-Gemeinschaft ; Korpuserstellung

Leiter

Jörg Zinken

Auskunft

agd@ids-mannheim.de ; zinken@ids-mannheim.de

Laufzeit

2020-2023

Zentrale_Publikationen

Kornfeld, Laurenz / Küttner, Uwe-A. / Zinken, Jörg (2023): Ein Korpus für die vergleichende Interaktionsforschung. Das 'Parallel European Corpus of Informal Interaction' (PECII). In: Arnulf Deppermann, Christian Fandrych, Marc Kupietz und Thomas Schmidt (Hg.): Korpora in der germanistischen Sprachwissenschaft. Mündlich, schriftlich, multimedial. Berlin/Boston: de Gruyter, S. 103–128.
Küttner, Uwe-A. / Kornfeld, Laurenz / Mack, Christina / Mondada, Lorenza / Rogowska, Jowita / Rossi, Giovanni / Sorjonen, Marja-Leena / Weidner, Matylda / Zinken, Jörg (2024): Introducing the 'Parallel European Corpus of Informal Interaction' (PECII). A novel resource for exploring cross-situational and cross-linguistic variability in social interaction. In: Margret Selting und Dagmar Barth-Weingarten (eds.): New Perspectives in Interactional Linguistic Research. Amsterdam/Philadelphia: John Benjamins (Studies in Language and Social Interaction, vol. 36), pp. 132–160.

Aufzeichnungsobjekte

Ereignisse_Basisdaten

Rundfunksendungen

Nicht vorhanden

Sprechereignisse

Sprecher

Korpusbestandteile

SE-AufnahmenTyp=Audio

Basisdaten

Transkribierte_SE-Aufnahmen

Digitale_FassungenTyp=DFT_01

DistributionStelle=Archiv für Gesprochenes Deutsch (AGD)

SE-AufnahmenTyp=Video

Basisdaten

Transkribierte_SE-Aufnahmen

Digitale_FassungenTyp=DFT_01

Basisdaten

Technische_Daten_AV

Tontechnische_Daten

Videotechnische_Daten

DistributionStelle=Archiv für Gesprochenes Deutsch (AGD)

TranskripteTyp=TT_01

Basisdaten

AnnotationenTyp=ANT_01

Basisdaten

ErstellungTyp=ERT_01

ErstellungTyp=ERT_DB1

AlignmentTyp=ALT_01

Digitale_FassungenTyp=DFT_01

DistributionStelle=Archiv für Gesprochenes Deutsch (AGD)

ZusatzmaterialArt=Aufnahmesettings

ZusatzmaterialArt=Spieleliste

ZusatzmaterialArt=UPOS-Mappings

ZusatzmaterialArt=Wortlisten

ZusatzmaterialArt=Lemmalisten

Dokumentationsgeschichte

UpdateDatum=2026-02-03

Letzte Aktualisierung: 10.02.2026