Das Kiezdeutschkorpus (KiDKo)

Korpus / Textsammlung

Das Kiezdeutschkorpus (KiDKo)

Titel

Das Kiezdeutschkorpus (KiDKo) eng

Beschreibung

A multi-modal digital corpus of spontaneous discourse data from informal, oral peer group in multi- and monoethnic speech communities. Multimodales, digitales Korpus spontansprachlicher Gesprächsdaten aus informellen, mündlichen Peer-Group-Situationen in multi- und monoethnischen Sprechergemeinschaften. CLARIN Metadata summary for Das Kiezdeutschkorpus (KiDKo) (CMDI-based) Title: Das Kiezdeutschkorpus (KiDKo) Description: A multi-modal digital corpus of spontaneous discourse data from informal, oral peer group situations in multi- and monoethnic speech communities. Description: Multimodales, digitales Korpus spontansprachlicher Gesprächsdaten aus informellen, mündlichen Peer-Group-Situationen in multi- und monoethnischen Sprechergemeinschaften. Publication date: 2016-11-21 Data owner: Heike Wiese Contributors: Heike Wiese, heike.wiese@uni-potsdam.de) (compiler), Oliver Bunk (compiler), Ulrike Freywald (compiler), Sophie Hamm (compiler), Banu Hueck (compiler), Anne Junghans (compiler), Jana Kiolbassa (compiler), Julia Kostka (compiler), Marlen Leisner (compiler), Nadine Lestmann (compiler), Katharina Mayr (compiler), Tiner Özçelik (compiler), Charlotte Pauli (compiler), Gergana Popova (compiler), Ines Rehbein (compiler), Nadja Reinold (compiler), Franziska Rohland (compiler), Sören Schalowski (compiler), Kathleen Schumann (compiler), Kristina Tjona Sommer (compiler), Emiel Visser (compiler) Project: B6: Analysis on the periphery, German Research Foundation (DFG) Keywords: spoken language, urban youth language, Kiezdeutsch, Sprachliche Entwicklung im Gegenwartsdeutschen, informeller Sprachgebrauch, Jugendsprache im urbanen Raum, Kiezdeutsch Language: German (deu) Size: 23 speakers (8 female, 15 male), 270 communications, 270 recordings, 66 hours, 270 transcriptions, 333000 words Segmentation units: lexeme Annotation types: non-verbal layer, transcription (manual): literary transcription for spoken language/GAT2, n: normalisation (automatic, dictionary lookup)orthographic norminalisation of non-canonical pronunciations, punctuations and capitalisations to Standard German, pos: automated part of speech tagging using adapted SSTS-tagset for spoken language developed for KiDKo, macro: marking of repairs, tr: transcription of Turkish language material, trnorm: norminalisation to Standard Turkish, trdtwwue: literal translation of Turkish to Standard German, trdtue: free translation of Turkish to Standard German Temporal Coverage: 2008/2011 Spatial Coverage: Berlin-Kreuzberg, DE Genre: discourse Modality: spoken eng

Größe

23 speakers (8 female, 15 male), 270 communications, 270 recordings, 66 hours, 270 transcriptions, 333000 words

Lizenz

restricted for individual

Volltext verfügbar

vorhanden

PID

https://dx.doi.org/10.25592/uhhfdm.8247

Zugang

https://dx.doi.org/10.25592/uhhfdm.8247

Kollektionstyp

Textsammlung

Erstellungsdatum

2016-11-21

Datentyp

collection

Lizenz-URL

https://www.fdr.uni-hamburg.de/record/8247/accessrequest

Modalität

gesprochen

Veröffentlichungsdatum

2016

Abgedeckter Zeitraum

2008/2011

entityId

790a7a80-4472-4d4e-af4c-0a350b7643f1

_extId

https://dx.doi.org/10.25592/uhhfdm.8247

Erstellungsdatum

2025-04-02T18:21:34.227Z

definition_name

collection

sourceId

406feb1c-ba76-41ba-a308-d8b1c956aa92

Keine verknüpften Ressourcen sind verfügbar!