Korpora

Korpora des DAKODA-Projekts.

In DAKODA wurden sehr verschiedene Lernerkorpora des Deutschen technisch konsolidiert. Die DAKODA-Datenbasis umfasst über 20 Korpora, darunter Erwerbskorpora, wie DiGS (Diehl et al. 20001), Leonide (Glaznieks et al. 20222); geschriebene DaF-Korpora, z.B. DISKO (Wisniewski et al. 20223), FALKO-Familie (Hirschmann et al. 20224), MERLIN (Wisniewski et al. 20135) und weitere; gesprochene DaF-Korpora, wie BeMaTaC (Sauer & Lüdeling 20166) und gemischte Designs, wie RUEG (Wiese et al. 20217) oder MULTILIT (Schroeder & Schellhardt, 20158). Die Korpora sind im DAKODA-Dashboard hinsichtlich der L2-Erwerbsstufen durchsuchbar. Eine detaillierte Korpusübersicht, die Zugänge zur Analyse, die verfügbaren Metadaten und die herunterladbaren Dateien und Annotationen finden Sie im Repositorium. Nicht alle Korpora können aus datenschutz- und lizenzrechtlichen Gründen frei durchsucht und heruntergeladen werden. Ein Ampelsystem hilft Ihnen als Nutzer:innen bei der Orientierung.

Literatur:

  1. Diehl, E., Christen, H., Leuenberger, S., Pelvat, I. & Studer, T. (2000). Grammatikunterricht: Alles für der Katz? Untersuchungen zum Zweitsprachenerwerb Deutsch. Reihe germanistische Linguistik: Bd. 220. Niemeyer. 

  2. Glaznieks, A., Frey, J.-C., Stopfner, M., Zanasi, L. & Nicolas, L. (2022): LEONIDE: A longitudinal trilingual corpus of young learners of Italian, German and English. International Journal of Learner Corpus Research 8:1, 97-120. https://doi.org/10.1075/ijlcr.21004.gla 

  3. Wisniewski, K., Muntschick, E. & Portmann, A. (2022). Das Lernerkorpus DISKO. In K. Wisniewski, W. Lenhard, L. Spiegel & J. Möhring (Hrsg.), Sprache und Studienerfolg bei Bildungsausländer/-innen (S. 283-304). Waxmann. 

  4. Hirschmann, H., Lüdeling, A., Shadrova, A., Bobeck, D., Klotz, M., Akbari, R., Schneider, S. & Wan, S. (2022). FALKO. Eine Familie vielseitig annotierter Lernerkorpora des Deutschen als Fremdsprache. Vorab-Onlinepublikation. https://doi.org/10.48694/kordaf.3552 (Korpora Deutsch als Fremdsprache). 

  5. Wisniewski, K., Schöne, K., Nicolas, L., Vettori, C., Boyd, A., Meurers, D., Abel, A. & Hana, J. (2013). MERLIN: An Online Trilingual Learner Corpus Empirically Grounding the European Reference Levels in Authentic Learner Data. In ICT for Language Learning 2013: Conference Proceedings. https://conference.pixel-online.net/conferences/ICT4LL2013/common/download/Paper_pdf/322-CEF03-FP-Wisniewski-ICT2013.pdf 

  6. Sauer, S. & Lüdeling, A. (2016). Flexible Multi-Layer Spoken Dialogue Corpora. International Journal of Corpus Linguistics, 21(3), 419–438. 

  7. Wiese, H., Alexiadou, A., Allen, S., Bunk, O., Gagarina, N., Iefremenko, K., Martynova, M., Pashkova, T., Rizou, V., Schroeder, C., Shadrova, A., Szucsich, L., Tracy, R., Tsehaye, W., Zerbian, S. & Zuban, Y. (2021). Heritage Speakers as Part of the Native Language Continuum. Frontiers in psychology, 12, 717973. https://doi.org/10.3389/fpsyg.2021.717973 

  8. Schellhardt, C., & Schroeder, C. (2015). Nominalphrasen in deutschen und türkischen Texten mehrsprachiger SchülerInnen. In A. Ziegler & K.-M. Köpcke (eds.), Deutsche Grammatik im Kontakt in Schule und Unterricht (pp. 241–262). De Gruyter.