ALesKo corpus – An annotated learner corpus
ALeSKo ist eine Kooperation von Margit Breckle und Heike Zinsmeister zur Analyse von Lernersprache. Das Projekt erarbeitete ein kleines Lernerkorpus, das aus Aufsätzen Chinesischer Deutschlernender (L2-Texte) und muttersprachlichen Vergleichstexten (L1-Texte) zusammengestellt wurde. Das L2-Subkorpus besteht aus 43 Erörterungen mit einem Umfang von insgesamt 13.587 Token. Die in ALeSKo annotierten L1-Texte mit einem Umfang von 34.155 Token wurden ursprünglich für das FalkoEssays L1 corpus erhoben.
ALeSKo hat das Ziel, Kohärenz in Lernertexten zu untersuchen. Unter der Annahme, dass verschiedene Ebenen eines Texts die Kohärenzwahrnehmung beeinflussen, wurden die Korpustexte auf syntaktischer, referenzieller und Diskursebene annotiert. Die Annotationen ermöglichen qualitative und quantitative Untersuchungen zur referenziellen und zur satzübergreifenden Diskursstruktur.