3 Korpusbeschreibung
KoLaS enthält zum jetzigen Zeitpunkt 454 Texte aus dem Zeitraum September 2011 bis Dezember 2013. Die Texte stammen von insgesamt 49 unterschiedlichen Ratsuchenden. Die Anzahl der Texte oder Textversionen pro Ratsuchenden liegt im Durchschnitt bei 9,27 (schwarze Linie), ist aber großen Schwankungen unterworfen, wie die nachfolgende Abbildung "Anzahl Texte pro Ratsuchender/m" verdeutlicht.
Von einer/m Ratsuchender/m liegen ganze 59 Texte vor, von 8 Personen nur ein einziger Text. Damit liegen von 41 Ratsuchenden mindestens zwei Texte oder Textversionen vor, was die Bearbeitung interessanter Forschungsfragen ermöglicht.
Die zeitliche Verteilung der Daten kann Tabelle 1 entnommen werden. Aus dem Jahr 2011 liegen nur wenige Dateien vor, da die Schreibwerkstatt Mehrsprachigkeit erst Ende des Jahres ihre Tätigkeit aufgenommen hat und die ersten Schreibberater/innen ausgebildet wurden. In den beiden Folgejahren liegen die Zahlen bei knapp 200 Beratungen und etwas mehr Texten. Die Diskrepanz entsteht dadurch, dass Beratungen maximal wöchentlich stattfinden, ggf. aber auch dazwischen neue Textversionen entstehen, die den Schreibberater/innen zur Verfügung gestellt werden.
Jahr | Texte | textbezogene Beratungen |
2011 | 29 | 25 |
2012 | 229 | 190 |
2014 | 196 | 168 |
Summe | 454 | 383 |
Zu den Ratsuchenden liegen eine Reihe von Metadaten vor, die spezifischere Analysen ermöglichen. Hierzu gehören insbesondere Informationen zum Studium (Fach, angestrebter Abschluss) und zur Sprachbiografie (Sprachen, mit denen die RS aufgewachsen sind, die sie in der Schule gelernt haben, Erstsprachen der Eltern…). Die im Korpus erfassten Ratsuchenden haben im Feld “aufgewachsen mit” 26 unterschiedliche Sprachen angegeben (Mehrfachnennungen möglich). Mit jeweils 11 Ratsuchenden sind Deutsch und Russisch die am häufigsten genannten Sprachen, darauf folgen zahlreiche weitere Sprachen: Bassa, Chinesisch, Deutsch, Englisch, Farsi/Persisch, Französisch, Griechisch, Hindi, Indonesisch, Japanisch, Kandahari, Kasachisch, Katalanisch, Kirgisisch, Kroatisch, Kurdisch, Multani, Russisch, Slowakisch, Spanisch, Sundanesisch, Tschechisch, Türkisch, Twi, Ukrainisch, Yuruba. Diese große Sprachenvielfalt ist vorteilhaft, da viele Sprach- und Kulturregionen einbezogen werden. Allerdings liegen dadurch momentan nur wenige Texte zu einer einzelnen Sprache vor, sodass das Erstellen von Teilkorpora nach Sprache bisher nur eingeschränkt möglich ist.
Die Ratsuchenden sind in ihrem Studium sehr unterschiedlich weit vorangeschritten, es sind Studierende vom ersten bis zum dreißigsten Semester vertreten, der Durchschnitt liegt bei 7,2. In Bezug auf das Studienfach stammen die meisten Ratsuchenden aus der Fakultät für Erziehungswissenschaft sowie der für Sprach- und Kulturwissenschaften. Dieser Schwerpunkt hängt mit der ursprünglichen Zielgruppendefinition der Schreibwerkstatt Mehrsprachigkeit zusammen, die sich zunächst nur an “Lehramtsstudierende mit Migrationshintergrund” richtete.
Die Textarten, mit denen die Studierenden in die Beratung kommen, sind ebenfalls sehr vielfältig. Die mit Abstand häufigste Textart ist die Hausarbeit, gefolgt von unterschiedlichen Typen von Abschlussarbeiten. In geringerer Häufigkeit kommen Praktikumsberichte, Exposés, Protokolle, Essays oder auch Fragebögen vor.