<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.2 20120330//EN" "http://jats.nlm.nih.gov/publishing/1.2/JATS-journalpublishing1.dtd">
<!--<?xml-stylesheet type="text/xsl" href="article.xsl"?>-->
<article article-type="research-article" dtd-version="1.2" xml:lang="de" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id journal-id-type="issn">1205-6545</journal-id>
<journal-title-group>
<journal-title>Zeitschrift f&#252;r Interkulturellen Fremdsprachenunterricht</journal-title>
</journal-title-group>
<issn pub-type="epub">1205-6545</issn>
<publisher>
<publisher-name>Universit&#228;ts- und Landesbibliothek Darmstadt</publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/zif.4262</article-id>
<article-categories>
<subj-group>
<subject>Aufsatz zum Themenschwerpunkt</subject>
</subj-group>
</article-categories>
<title-group>
<article-title>So viele L&#252;cken, so wenig Zeit: Die Rolle der Zeit im Konstrukt des deutschen C-Tests anhand der Analyse der Verarbeitungsprozesse</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author" corresp="yes">
<contrib-id contrib-id-type="orcid">https://orcid.org/0009-0000-1883-4343</contrib-id>
<name>
<surname>Timukova</surname>
<given-names>Anna</given-names>
</name>
<email>Anna.Timukova@ruhr-uni-bochum.de</email>
<xref ref-type="aff" rid="aff-1">1</xref>
</contrib>
<contrib contrib-type="author">
<name>
<surname>Yazdanfar</surname>
<given-names>Oleksandra</given-names>
</name>
</contrib>
<contrib contrib-type="author">
<contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-9649-2972</contrib-id>
<name>
<surname>Drackert</surname>
<given-names>Anastasia</given-names>
</name>
</contrib>
</contrib-group>
<aff id="aff-1"><label>1</label>Gesellschaft f&#252;r Akademische Studienvorbereitung und Testentwicklung</aff>
<pub-date publication-format="electronic" date-type="pub" iso-8601-date="2026-03-02">
<day>02</day>
<month>03</month>
<year>2026</year>
</pub-date>
<pub-date pub-type="collection">
<year>2026</year>
</pub-date>
<volume>31</volume>
<issue>1</issue>
<fpage>1</fpage>
<lpage>28</lpage>
<permissions>
<copyright-statement>Copyright: &#x00A9; 2026 The Author(s)</copyright-statement>
<copyright-year>2026</copyright-year>
<license license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
<license-p>CC BY 4.0 International - Creative Commons, Namensnennung. See <uri xlink:href="http://creativecommons.org/licenses/by/4.0/">http://creativecommons.org/licenses/by/4.0/</uri>.</license-p>
</license>
</permissions>
<self-uri xlink:href="https://zif.tujournals.ulb.tu-darmstadt.de/articles/10.48694/zif.4262"/>
<abstract>
<p>Zeitreduzierte C-Tests sind eine relativ neue Variante des seit Jahrzehnten etablierten und erforschten Messverfahrens zur reliablen und &#246;konomischen Erfassung allgemeiner Sprachkompetenz. Die Rolle der Zeit im Konstrukt ist bislang wenig untersucht, insbesondere ihre Auswirkungen auf die Verarbeitungsprozesse. Die vorliegende Studie liefert Belege f&#252;r die Prozessvalidit&#228;t von zeitreduzierten C-Tests, indem sie das Bearbeitungsverhalten von 16 relativ fortgeschrittenen DaF-Lernenden beobachtet. Die Analyse von Bildschirmaufnahmen der Bearbeitung eines kanonischen und eines zeitreduzierten C-Tests zeigt eine vorwiegend lineare Bearbeitung unabh&#228;ngig von der Zeit. Unter erh&#246;htem Zeitdruck l&#228;sst sich zudem weniger <italic>Backtracking</italic> (Zur&#252;ckspringen im Text) beobachten, selbst bei kontextabh&#228;ngigen L&#252;cken. Der zeitreduzierte C-Test scheint die automatisierte Verarbeitung zu beg&#252;nstigen und den Zugriff auf nicht-automatisiertes, deklaratives Sprachwissen zu erschweren. Dies legt nahe, dass er ein vom kanonischen C-Test teilweise abweichendes Konstrukt erfasst.</p>
</abstract>
<trans-abstract xml:lang="en">
<p><bold>So Many Gaps, So Little Time: The Role of Time in the Construct of the German C-Test Based on the Analysis of Response Processes</bold></p>
<p>Time-reduced C-Tests are a recent variation of the long-established and researched method for a reliable and efficient assessment of general language proficiency. The role of time in the construct remains underexplored, particularly its impact on response processes. This study provides evidence for the process validity of time-reduced C-Tests by observing the behaviour of 16 fairly advanced learners of German as a foreign language (DaF). Analysis of screen recordings from completing a canonical and a speeded C-Test reveals a predominantly linear approach to test completion, regardless of time. With increased time pressure, less backtracking is observed, even with context-dependent gaps. The time-reduced C-Test appears to favour automated processing, making access to non-automatised, declarative language knowledge more difficult. This suggests that it captures a construct that partially deviates from that of the canonical C-Test.</p>
</trans-abstract>
<kwd-group>
<kwd>Sprachtestforschung</kwd>
<kwd>Testkonstrukt</kwd>
<kwd>Konstruktvalidit&#228;t</kwd>
<kwd>kognitive Verarbeitung</kwd>
<kwd>Bildschirmaufzeichnung</kwd>
<kwd>deklaratives Wissen</kwd>
<kwd>Automatisierung</kwd>
</kwd-group>
<kwd-group xml:lang="en">
<kwd>language assessment</kwd>
<kwd>test construct</kwd>
<kwd>construct validity</kwd>
<kwd>response processes</kwd>
<kwd>screen recording</kwd>
<kwd>declarative knowledge</kwd>
<kwd>automaticity</kwd>
</kwd-group>
</article-meta>
</front>
<body>
<sec>
<title>1 Einleitung</title>
<p>Sprachenzentren und Sprachschulen weltweit stufen j&#228;hrlich Tausende Lernende in ihre Sprachkurse ein. Daf&#252;r brauchen sie valide, reliable und praktikable Instrumente. Seit Jahrzehnten werden zu Einstufungszwecken C-Tests genutzt (<xref ref-type="bibr" rid="B18">Grotjahn/Drackert 2022</xref>). Sie k&#246;nnen schnell erstellt und ausgewertet werden, wobei computerbasierte C-Tests auch eine (teil)automatisierte Erstellung und automatische Auswertung zulassen. Beim C-Test erg&#228;nzen Sprachlernende partiell getilgte W&#246;rter in mehreren kurzen Texten und haben in der Regel f&#252;nf Minuten Bearbeitungszeit pro Text (Testbearbeitungszeit von bis 40 Minuten), was sich in der Praxis nicht immer als &#246;konomisch herausstellt. Was passiert, wenn man die Bearbeitungszeit reduziert? Werden Testteilnehmende dieselbe Leistung zeigen? Und vor allem &#8211; wird der Test dasselbe messen? Die Beantwortung dieser Fragen ist Teil der Validierung der neuen zeitreduzierten (<italic>speeded</italic>) Formatvariante des C-Tests.</p>
<p>Obwohl moderne Validit&#228;tsmodelle (z.B. <xref ref-type="bibr" rid="B23">Kane 2016</xref>) die Bedeutung der Testverwendung und somit der mit der Testleistung verbundenen Interpretationen und Entscheidungen betonen, bleibt es essenziell zu kl&#228;ren, was ein Testformat tats&#228;chlich misst. Abh&#228;ngig vom Testzweck werden dazu verschiedene Belege gesammelt, etwa zur Inhaltsvalidit&#228;t, konvergenten Validit&#228;t, &#220;bereinstimmungsvalidit&#228;t oder zur Validit&#228;t der Verarbeitungsprozesse (<xref ref-type="bibr" rid="B1">American Educational Research Association, American Psychological Association, &amp; National Council on Measurement in Education 2014</xref>). Die letzte Art der Validit&#228;t, auch substanzielle Validit&#228;t (<italic>substantive validity</italic>) genannt (<xref ref-type="bibr" rid="B30">Messick 1989</xref>) fokussiert auf Nachweise f&#252;r die (kognitiven) Prozesse der Testbearbeitung. Sie umfasst theoretische Erkl&#228;rungen f&#252;r beobachtete Regelm&#228;&#223;igkeiten in den Testantworten, einschlie&#223;lich Prozessmodellen der Aufgabenbearbeitung (<xref ref-type="bibr" rid="B12">Embretson 1983</xref>), sowie empirische Belege daf&#252;r, dass die postulierten kognitiven Prozesse bei der Aufgabenl&#246;sung tats&#228;chlich ablaufen. Obwohl erste Erkenntnisse zum Konstrukt von zeitreduzierten C-Tests vorliegen (<xref ref-type="bibr" rid="B35">Timukova/M&#246;ller/Drackert im Druck</xref>; <xref ref-type="bibr" rid="B39">Zimmermann 2019</xref>), fehlen bislang Belege f&#252;r ihre Prozessvalidit&#228;t &#8211; eine L&#252;cke, die diese Studie adressiert.</p>
</sec>
<sec>
<title>2 Verarbeitungsprozesse im Konstrukt des C&#8209;Tests</title>
<sec>
<title>2.1 Konstrukt des C-Tests</title>
<p>C-Tests werden zur integrativen Messung allgemeiner Sprachkompetenz eingesetzt (<xref ref-type="bibr" rid="B18">Grotjahn/Drackert 2022</xref>). Sie operationalisieren das Prinzip der reduzierten sprachlichen Redundanz: Sprachkompetente Personen k&#246;nnen durch antizipatorische Verarbeitung auch wenig redundante Mitteilungen entschl&#252;sseln (<xref ref-type="bibr" rid="B26">Klein-Braley 1994</xref>). F&#252;r die Rekonstruktion der L&#252;cken ist eine integrierte Anwendung sprachlicher Wissensbest&#228;nde und Fertigkeiten in Schriftform erforderlich (<xref ref-type="bibr" rid="B20">Hastings 2002</xref>), wobei die Verarbeitung auf allen Ebenen vom Buchstaben bis zum Text erfolgt (<xref ref-type="bibr" rid="B33">Sigott 2004</xref>) und Strategien einschlie&#223;t (<xref ref-type="bibr" rid="B19">Harsch/Schr&#246;der 2007</xref>).</p>
<p>Lernende m&#252;ssen das partiell getilgte Wort im mentalen Lexikon haben, es kontextbasiert identifizieren und grammatikalisch sowie orthographisch korrekt rekonstruieren (<xref ref-type="bibr" rid="B8">Drackert/Timukova 2020</xref>). Dabei wird sowohl deklaratives (z.B. Wortschatz, explizite Regeln) als auch prozedurales (z.B. syntaktische Verarbeitung, Rechtschreibung) Wissen aktiviert<xref ref-type="fn" rid="n1">1</xref>.</p>
<p>Raatz (<xref ref-type="bibr" rid="B32">2002</xref>) zeigt in einer Faktorenanalyse hohe Ladungen auf den Faktor <italic>verbal intelligence</italic> f&#252;r Deutsch als Erstsprache und erkl&#228;rt die C-Test-L&#246;sung durch eine konzeptgesteuerte Verarbeitung. Dabei bildet die Analyse des vorhandenen sprachlichen Materials die Basis f&#252;r Hypothesen zu fehlenden Wortteilen, w&#228;hrend gr&#246;&#223;eres Sprachwissen eine schnellere und effizientere Verarbeitung erm&#246;glicht.</p>
<p>Zahlreiche empirische Befunde belegen die &#220;bereinstimmungsvalidit&#228;t (konkurrente Validit&#228;t) von C-Tests, verstanden als der Grad der &#220;bereinstimmung mit den Ergebnissen etablierter Sprachtestverfahren. McKay et al. (<xref ref-type="bibr" rid="B29">2021</xref>) analysierten Korrelationen zwischen C-Tests in verschiedenen Sprachen und anderen Sprachtests aus 239 Studien und kamen zum Schluss, dass das Konstrukt des C-Tests allgemeine Sprachkompetenz umfasst, die aus mehreren Komponenten besteht. Auch Faktorenanalysen st&#252;tzen diese Annahme (z.B. <xref ref-type="bibr" rid="B10">Eckes/Grotjahn 2006</xref>).</p>
<p>Studien zu den kognitiven Prozessen beim L&#246;sen von C-Tests sind seltener und ihre Ergebnisse uneinheitlich. W&#228;hrend die Komplexit&#228;t der notwendigen Sprachverarbeitung eine Synthese verschiedener Verarbeitungsprozesse nahelegt, wird weiterhin diskutiert, ob sich Testpersonen prim&#228;r auf mikro- oder makrostrukturelle Prozesse konzentrieren. Die Tiefe der Verarbeitung h&#228;ngt zudem von Textschwierigkeit und Sprachkompetenz der Testpersonen ab &#8211; ein Merkmal, das Sigott (<xref ref-type="bibr" rid="B33">2004</xref>) als <italic>fluid construct</italic> bezeichnet (f&#252;r m&#246;gliche Auspr&#228;gungen von diesem Merkmal im Kontext der herkunftssprachlichen Sprachkompetenz siehe z.B. <xref ref-type="bibr" rid="B8">Drackert/Timukova 2020</xref>). Da Verarbeitungsprozesse im Fokus der Untersuchung stehen, werden sie in Kap. 2.3 n&#228;her erl&#228;utert.</p>
</sec>
<sec>
<title>2.2 Konstrukt des C-Tests mit Zeitreduktion</title>
<p>Die zeitreduzierte Variante des C-Tests wurde urspr&#252;nglich in Intelligenzstudien zur Messung der Sprachkompetenz in der Erstsprache verwendet, um Deckeneffekte bei Muttersprachler*innen zu vermeiden (<xref ref-type="bibr" rid="B32">Raatz 2002</xref>; <xref ref-type="bibr" rid="B38">Wockenfu&#223; 2008</xref>). Aguado, Grotjahn und Schlak (<xref ref-type="bibr" rid="B2">2005</xref>) setzten einen zeitlimitierten C-Test f&#252;r Deutsch als Fremdsprache (L2) bei weit fortgeschrittenen Sprachlernenden ein, um ihr deklaratives Sprachwissen und dessen Prozeduralisierungsgrad integriert zu messen.</p>
<p>Erste Erkenntnisse zum Konstrukt zeitreduzierter C-Tests in der L2-Forschung zeigen, dass diese neben Sprachwissen auch Automatisierung sowie Verarbeitungseffizienz messen k&#246;nnen. Zimmermann (<xref ref-type="bibr" rid="B39">2019</xref>) pr&#252;fte Grotjahns (<xref ref-type="bibr" rid="B16">2010</xref>) Hypothese, dass zeitreduzierte C-Tests st&#228;rker mit m&#252;ndlichen Fertigkeiten zusammenh&#228;ngen. Sie korrelierte die Punktwerte aus kanonischen und zeitreduzierten C-Tests mit den Ergebnissen aus Pr&#252;fungsteilen H&#246;rverstehen und Sprechen des Goethe-Zertifikats bei DaF-Lernenden (B2-Niveau). Die Ergebnisse st&#252;tzen Grotjahns Annahme teilweise: Die Korrelationen fielen etwas &#8211; jedoch nicht signifikant &#8211; h&#246;her f&#252;r den zeitreduzierten C-Test aus.</p>
<p>Timukova et al. (im Druck) untersuchten Testergebnisse von &#252;ber 400 Studierenden mit L2 Englisch oder Deutsch in computerbasierten C-Tests unter zwei Zeitbedingungen. Zeitlimitierte Tests erwiesen sich in beiden Sprachen als signifikant schwieriger und sensibel f&#252;r das Sprachniveau der Lernenden sowie die Textschwierigkeit (im Deutschen). Sie korrelierten etwas st&#228;rker mit dem <italic>Oral Elicited Imitation Test</italic><xref ref-type="fn" rid="n2">2</xref> und sagten dessen Ergebnisse besser voraus. Die Autorinnen interpretieren diese Befunde als Hinweis auf einen h&#246;heren Anteil automatisierter Sprachf&#228;higkeiten im zeitlimitierten Konstrukt, betonen jedoch die Notwendigkeit, das Antwortverhalten zu untersuchen.</p>
<p>Zu den Verarbeitungsprozessen bei zeitreduzierten C-Tests gibt es bislang nur erste, vorl&#228;ufige Ergebnisse, die auf dem berichteten Verhalten der Testteilnehmenden basieren. In Zimmermanns Studie (<xref ref-type="bibr" rid="B39">2019</xref>) beantworteten 120 Proband*innen nach der Bearbeitung beider Testversionen (kanonisch und zeitreduziert) eine Einzelfrage zu ihrem L&#246;sungsverhalten anhand vorgegebener Antwortoptionen. Weniger als die H&#228;lfte gab an, die L&#252;cken linear (d.h. in der Reihenfolge ihres Auftretens im Text) bearbeitet zu haben, unabh&#228;ngig von der Zeit, w&#228;hrend R&#252;ckw&#228;rtsbewegungen (<italic>Backtracking</italic>) im kanonischen C-Test h&#228;ufiger als im zeitreduzierten vorkamen. Zimmermann schloss daraus, dass der Zeitfaktor das L&#246;sungsverhalten zwar beeinflusst, die Methode jedoch keine eindeutigen R&#252;ckschl&#252;sse auf zugrunde liegende Prozesse zul&#228;sst.</p>
<p>Diese Forschungsl&#252;cke steht im Mittelpunkt der vorliegenden Studie. Da bereits Untersuchungen zu Verarbeitungsprozessen im kanonischen C-Test existieren, werden diese im folgenden Kapitel vorgestellt.</p>
</sec>
<sec>
<title>2.3 Verarbeitungsprozesse in der C-Test-Forschung</title>
<sec>
<title>2.3.1 Konzepte, Methoden, Klassifikationen</title>
<p>Die C-Test-Forschung st&#252;tzt sich bei der Beschreibung von Verarbeitungsprozessen auf Modelle kognitiver Prozesse beim (Testen von) Lesen, welche Bottom-up- und Top-down-Verarbeitung, Schemaaktivierung sowie das Zusammenspiel zwischen den Eigenschaften der Lesenden und der Texte betonen (vgl. <xref ref-type="bibr" rid="B22">Jang 2017</xref>). Khalifa und Weir (<xref ref-type="bibr" rid="B25">2009</xref>) unterscheiden zwischen hierarchieniedrigen Prozessen wie Dekodieren, Worterkennung und Bedeutungsbildung auf Satzebene und hierarchiehohen Prozessen wie Textverkn&#252;pfung und inferentiellem Lesen. Hierarchieniedrige Prozesse k&#246;nnen automatisiert werden und unbewusst ablaufen (<xref ref-type="bibr" rid="B15">Grabe/Yamashita 2022</xref>).</p>
<p>Trotz verwandter Begriffe lassen sich Erkenntnisse aus der Leseforschung nach unserer Einsch&#228;tzung nur bedingt auf das L&#246;sen von C-Tests &#252;bertragen: Die unvollst&#228;ndigen Texte m&#252;ssen rekonstruiert werden, was die ablaufenden Leseprozesse notwendigerweise beeinflusst und zus&#228;tzlich eine produktive (z.B. morphologische) Verarbeitung erfordert. Ein &#252;bertragbarer Befund der Lesetestforschung betrifft jedoch die Interaktion zwischen Texteigenschaften und der Sprachkompetenz der Testteilnehmenden, welche die zum Einsatz kommenden Prozesse steuert.</p>
<p>Drei methodische Ans&#228;tze dominieren die Literatur zu L&#246;sungsprozessen in C-Tests. Teilnehmende verbalisieren ihr Vorgehen direkt (Lautes Denken) oder retrospektiv (<italic>stimulated recall</italic>) (<xref ref-type="bibr" rid="B3">Babaii/Ansary 2001</xref>; <xref ref-type="bibr" rid="B34">Stemmer 1991</xref>), ihr Bearbeitungsverhalten wird z.B. mit Key-Stroke-Logging (Aufzeichnung von Tastenanschl&#228;gen) verfolgt und protokolliert (<xref ref-type="bibr" rid="B14">Germann/Grotjahn 1994</xref>), oder die Antworten werden im Nachhinein analysiert (<xref ref-type="bibr" rid="B20">Hastings 2002</xref>; <xref ref-type="bibr" rid="B26">Klein-Braley 1994</xref>; <xref ref-type="bibr" rid="B33">Sigott 2004</xref>). Diese Verfahren erlauben Zugang zu unterschiedlichen Untersuchungsebenen, weshalb L&#246;sungsprozesse unterschiedlich klassifiziert werden.</p>
<p><bold>Analysen der Lernendenantworten</bold>, wie etwa Fehleranalysen, richten den Fokus auf den Text und unterscheiden die Prozesse meist anhand des Umfangs des f&#252;r die L&#246;sung herangezogenen Kontexts. Dabei sprechen Forschende von Verarbeitung auf niedrigerer und h&#246;herer Ebene (z.B. <xref ref-type="bibr" rid="B26">Klein-Braley 1994</xref>; <xref ref-type="bibr" rid="B33">Sigott 2004</xref>), Mikro- vs. Makroebene (z.B. <xref ref-type="bibr" rid="B5">Beinborn/Zesch/Gurevych 2014</xref>), Textebene (<italic>text-level processing</italic>) vs. Satzebene und darunter (<xref ref-type="bibr" rid="B33">Sigott 2004</xref>) oder von Mikro- vs. Makrokontext (z.B. <xref ref-type="bibr" rid="B17">Grotjahn/Schiller 2014</xref>).</p>
<p>Beobachtungen des <bold>Bearbeitungsverhaltens</bold> liefern alternative Klassifikationen. Germann und Grotjahn (<xref ref-type="bibr" rid="B14">1994</xref>) untersuchen in einer Pilotstudie mit acht fortgeschrittenen Englischlernenden die Bearbeitungsprozesse mithilfe der Protokollierung von Tastatureingaben am Computer und identifizieren drei Vorgehensweisen: lineare Bearbeitung der L&#252;cken nacheinander, wiederholtes Zur&#252;ckspringen zu ungel&#246;sten L&#252;cken vor Erreichen des letzten Items und h&#228;ufiges &#220;berspringen ohne anschlie&#223;ende zeitnahe Bearbeitung (<xref ref-type="bibr" rid="B14">Germann/Grotjahn 1994: 288</xref>).</p>
<p><bold>Introspektive Verfahren</bold> f&#252;hren zwangsl&#228;ufig zu eigenen, je nach Studie variierenden Klassifikationen. Stemmer (<xref ref-type="bibr" rid="B34">1991</xref>) identifizierte in den Aussagen von 30 Personen beim L&#246;sen franz&#246;sischer C-Tests nur in 41% der F&#228;lle eine der drei Verhaltensweisen: <italic>recall strategies</italic> (Abruf des gesuchten Elements durch R&#252;ckgriff auf das Element selbst oder den unmittelbaren Kontext), <italic>evaluation strategies</italic> (Einbezug weiterer Ko- und Kontexte zur &#220;berpr&#252;fung der Passung der gefundenen L&#246;sung) und &#8222;<italic>superstrategy</italic>&#8220; (z.B. Vorlesen des (ganzen) Textes). Abh&#228;ngig davon, ob sich diese Strategien innerhalb einer Proposition bewegen oder &#252;ber Propositionsgrenzen hinausgehen, ordnete sie diese in <italic>low-level</italic> und <italic>higher-level comprehension</italic> ein. Babaii und Ansary (<xref ref-type="bibr" rid="B3">2001: 215&#8211;216</xref>) erstellten anhand retrospektiver verbaler Protokolle von 32 Teilnehmenden beim L&#246;sen eines englischen C-Tests eine andere Klassifikation: 1) automatische Verarbeitung, 2) Nutzung des unmittelbaren Kontexts der L&#252;cke (<italic>lexical adjacency</italic>), 3) Nutzung des grammatikalischen Kontexts und der Bedeutung benachbarter S&#228;tze (<italic>sentential cues</italic>) und 4) Nutzung von Hintergrundwissen und des Gesamttexts (<italic>top-down cues</italic>). Die ersten beiden L&#246;sungsprozesse ordnen sie der Mikro- und die letzten beiden der Makroebene zu, liefern jedoch keine Begr&#252;ndung f&#252;r diese Zuordnung.</p>
<p>Diese Klassifikationen zeigen, dass Konzepte aus der Leseforschung von den Forschenden unterschiedlich interpretiert und verwendet werden, oft ohne explizite Begr&#252;ndung. Sigott (<xref ref-type="bibr" rid="B33">2004</xref>) folgt offenbar der Unterscheidung von Khalifa und Weir (<xref ref-type="bibr" rid="B25">2009</xref>) in <italic>lower</italic>- und <italic>higher-level processing</italic>, indem er die Grenze zwischen der Verarbeitung auf Text- und Satzebene zieht. Hingegen ordnen Babaii und Ansary (<xref ref-type="bibr" rid="B3">2001</xref>) ihre Kategorie &#8222;<italic>sentential cues</italic>&#8220; der Makroebene zu. Beinborn et al. (<xref ref-type="bibr" rid="B5">2014</xref>) beschr&#228;nken den Mikrokontext auf die L&#252;cke mit je einem Wort links und rechts davon, alles andere z&#228;hlt als Makrokontext.</p>
<p>Es &#252;berrascht kaum, dass unterschiedliche Methoden mit variierenden Klassifikationen zu uneinheitlichen Ergebnissen &#252;ber die prim&#228;r genutzten Verarbeitungsprozesse beim L&#246;sen von C-Tests f&#252;hren. Diese Ergebnisse werden im Folgenden kurz zusammengefasst.</p>
</sec>
<sec>
<title>2.3.2 Erkenntnisse</title>
<p>Introspektive Verfahren von Stemmer (<xref ref-type="bibr" rid="B34">1991</xref>) sowie Babaii und Ansary (<xref ref-type="bibr" rid="B3">2001</xref>) weisen auf eine bevorzugte Verarbeitung auf lokaler Ebene beim C-Test hin: Der unmittelbare Kontext wird am h&#228;ufigsten (ca. 55 %) und die Makroebene seltener (<italic>sentential cues</italic> - 22 %, Top-down-Verarbeitung - ca. 6 %) einbezogen (<xref ref-type="bibr" rid="B3">Babaii/Ansary 2001</xref>). Beide Studien zeigen, dass die Makroebene vor allem dann aktiviert wird, wenn die automatische, serielle Bearbeitung scheitert. Stemmer (<xref ref-type="bibr" rid="B34">1991</xref>) beobachtete, dass der breitere Kontext meist zur L&#246;sungsevaluation dient, w&#228;hrend die Verarbeitung auf Textebene vor allem bei Schwierigkeiten in der lokalen L&#246;sungssuche als probleml&#246;sende Strategie eingesetzt wird.</p>
<p>Klein-Braley (<xref ref-type="bibr" rid="B26">1994</xref>) und Hastings (<xref ref-type="bibr" rid="B20">2002</xref>) analysierten Lernendenantworten und betonten hingegen die Relevanz makrostruktureller Verarbeitungsprozesse. Lokale Verarbeitung dominierte bei Testpersonen mit schlechten Ergebnissen, w&#228;hrend leistungsst&#228;rkere Lernende den Makrokontext ber&#252;cksichtigten. Schw&#228;chere Teilnehmende erkannten oft nur einzelne W&#246;rter und erfassten den Text nicht als Ganzes, was entweder zu einer vorschnellen Festlegung auf eine L&#246;sung ohne Ber&#252;cksichtigung der nachfolgenden Textbez&#252;ge (<italic>early closure</italic>) oder zu einer Bearbeitung mit ausschlie&#223;lich lokalem Fokus auf die unmittelbare L&#252;ckenumgebung (<italic>narrow focus</italic>) f&#252;hrte (<xref ref-type="bibr" rid="B26">Klein-Braley 1994</xref>). Gleichzeitig wird argumentiert, dass die K&#252;rze der C-Test-Texte eine eindeutige Best&#228;tigung der Nutzung globaler, integrativer Verarbeitungsprozesse erschwert.</p>
<p>Mehrere Studien betonen den Zusammenhang zwischen den Verarbeitungsprozessen und Lernendenkompetenz. Grotjahn und Schiller (<xref ref-type="bibr" rid="B17">2014</xref>) zeigten, dass steigende Sprachkompetenz der Testpersonen mit besserer Nutzung gr&#246;&#223;erer Rekonstruktionskontexte korrespondiert. Laut Babaii und Fatahi-Majd (<xref ref-type="bibr" rid="B4">2014</xref>) f&#252;hren Kompetenzunterschiede zu verschiedenen Fehlerquellen: W&#228;hrend kompetente Lernende vor allem lexikalische Abrufprobleme haben und feine Grammatikfehler &#252;bersehen, gelingt es leistungsschw&#228;cheren Lernenden h&#228;ufig nicht, den Gesamtzusammenhang des Textes aufzubauen, sodass sie sich auf unsystematische, lokale Rekonstruktionen st&#252;tzen. F&#252;r Sigott (<xref ref-type="bibr" rid="B33">2004</xref>) stellt die Abh&#228;ngigkeit der Verarbeitungsprozesse vom Kompetenzniveau sogar ein zentrales Merkmal des Konstrukts (<italic>fluid construct</italic>) dar. Er berichtete folgende Ergebnisse: Schw&#228;chere Lernende ben&#246;tigen mehr Kontext, um fehlendes Sprachwissen zu kompensieren, w&#228;hrend fortgeschrittene Lernende in der Lage sind, einige L&#252;cken allein durch den unmittelbaren Kontext zu schlie&#223;en.</p>
<p>Germann und Grotjahn (<xref ref-type="bibr" rid="B14">1994</xref>) sahen in der Top-down-Verarbeitung eine der erfolgreicheren L&#246;sungsstrategien, betonten jedoch den Einfluss individueller und textueller Faktoren auf deren Wahl. Sie stellten nur exemplarische Bez&#252;ge zwischen beobachtetem Verhalten und zugrundeliegenden Prozessen her und bedauerten die fehlende Erhebung temporaler Daten.</p>
<p>Da die Eigenschaften von Texten und L&#252;cken die Verarbeitungsprozesse beeinflussen, werden sie sowohl zur Kategorisierung der Prozesse herangezogen als auch direkt untersucht. Stemmer (<xref ref-type="bibr" rid="B34">1991</xref>) identifizierte z.B. die Anzahl m&#246;glicher Vervollst&#228;ndigungen der L&#252;cke und koh&#228;sive Verkn&#252;pfungen im Text als Faktoren, die die Verarbeitungslast erh&#246;hen. Klein-Braley (<xref ref-type="bibr" rid="B26">1994</xref>) zeigte, dass Strukturw&#246;rter (<italic>function words</italic>) wie Pr&#228;positionen und Konjunktionen zwar oft leichter zu rekonstruieren sind als Inhaltsw&#246;rter, die L&#252;ckenschwierigkeit jedoch von der Wort-Kontext-Interaktion abh&#228;ngt. Sigott (<xref ref-type="bibr" rid="B33">2004</xref>) best&#228;tigte, dass beide Wortarten je nach Kontext die Verarbeitung auf Textebene ausl&#246;sen k&#246;nnen. Nach Kaufmann (<xref ref-type="bibr" rid="B24">2016</xref>) stellen bestimmte Merkmale der deutschen Sprache, die f&#252;r DaF-Lernende besonders herausfordernd sind, potenzielle Fehlerquellen in einem C-Test dar. F&#252;r Beinborn et al. (<xref ref-type="bibr" rid="B5">2014</xref>) ergibt sich die Schwierigkeit einzelner L&#252;cken aus Wortmerkmalen (z.B. Vertrautheit, Flexion) sowie Makrofaktoren wie Interl&#252;ckendependenz und Textschwierigkeit.</p>
</sec>
</sec>
</sec>
<sec>
<title>3 Vorhaben dieser Studie</title>
<sec>
<title>3.1 Untersuchungsgegenstand und Methode</title>
<p>Bisher liegen keine Erkenntnisse zu den Verarbeitungsprozessen in zeitlimitierten C-Tests vor (vgl. <xref ref-type="bibr" rid="B39">Zimmermann 2019</xref>). Daraus ergibt sich die Notwendigkeit einer theoretischen und empirischen Kl&#228;rung hinsichtlich der Prozessvalidit&#228;t &#8211; und damit auch die Begr&#252;ndung f&#252;r unsere Studie. Da bestehende Studien zu Prozessen im kanonischen C-Test uneinheitliche Definitionen und teils vage Kategorisierungen verwenden (Kap. 2.3.1), pr&#228;zisieren wir zun&#228;chst den Untersuchungsrahmen, definieren den Gegenstand unserer Analyse und erl&#228;utern die Beziehungen zwischen den Untersuchungsebenen.</p>
<p>Der Gegenstand unserer Untersuchung sind Bearbeitungsprozesse (<italic>response processes</italic>) nach Hubley und Zumbo (<xref ref-type="bibr" rid="B21">2017: 2</xref>): &#8222;the mechanisms that underlie what people do, think, or feel when interacting with, and responding to, the item or task and are responsible for generating observed test score variation.&#8220; Diese Definition umfasst neben kognitiven Prozessen auch das Verhalten sowie Motivation und Emotionen. Die Untersuchung der Bearbeitungsprozesse liefert &#252;ber die Analyse der Testpunktwerte hinaus wertvolle Einblicke in das zugrunde liegende Konstrukt und tr&#228;gt somit wesentlich zur Validierung bei.</p>
<p>Um diese Bearbeitungsprozesse empirisch zug&#228;nglich zu machen, verfolgen wir das Bearbeitungsverhalten, in dem sie sich manifestieren. Diese Methode erm&#246;glicht einen direkteren Zugang zu den Prozessen im Vergleich zu einer Fehleranalyse. Gleichzeitig ist sie weniger intrusiv als das Verbalisieren mentaler Vorg&#228;nge und umgeht einige Einschr&#228;nkungen introspektiver Methoden, wie etwa die M&#246;glichkeit, nur bewusst ablaufende Prozesse zu verbalisieren, und den potenziellen Einfluss der Verbalisierung auf das Verhalten<xref ref-type="fn" rid="n3">3</xref> (<xref ref-type="bibr" rid="B14">Germann/Grotjahn 1994</xref>). Das beobachtbare Bearbeitungsverhalten wird durch Bildschirmaufnahmen der Testpersonen in Form von Videos dokumentiert. Da die Bearbeitung durch die Videoaufnahme in ihrem zeitlichen Ablauf erfasst wird, beseitigt diese Methode eine wichtige Einschr&#228;nkung fr&#252;herer Studien (vgl. <xref ref-type="bibr" rid="B14">Germann/Grotjahn 1994</xref>; <xref ref-type="bibr" rid="B34">Stemmer 1991</xref>).</p>
<p>Eine relativ homogene Stichprobe von Teilnehmenden mit Deutschkompetenz auf B2-C1-Niveau des Gemeinsamen europ&#228;ischen Referenzrahmens f&#252;r Sprachen (GeR; <xref ref-type="bibr" rid="B13">Europarat 2020</xref>) wurde gew&#228;hlt, um den Einfluss der Sprachkompetenz auf die genannten Prozesse zu kontrollieren. Der Einfluss der L&#252;ckeneigenschaften auf die Verarbeitungsprozesse wird durch eine Klassifikation der L&#252;cken nach dem minimal erforderlichen L&#246;sungskontext ber&#252;cksichtigt: Die Unterscheidung zwischen Mikro- und Makrol&#252;cken (s. Kap. 4.2) flie&#223;t in unsere Forschungsfragen ein.</p>
</sec>
<sec>
<title>3.2 Annahmen und Forschungsfragen</title>
<p>Der C-Test elizitiert realit&#228;tsnahe Sprachverarbeitung: Umfangreicheres linguistisches Wissen f&#252;hrt zu besserem Umgang mit reduzierter Redundanz und schnellerer Verarbeitung (Kap. 2.1). Wir erwarten, dass hochkompetente Sprachnutzer*innen die meisten L&#252;cken durch automatischen Abruf ihres Sprachwissens l&#246;sen. Manche L&#246;sungen werden (schnell) evaluiert, w&#228;hrend komplexe und zeitaufwendige L&#246;sungssuchprozesse selten auftreten &#8211; etwa bei kontextabh&#228;ngigen L&#252;cken oder schwierigen Texten. Probleml&#246;sungsstrategien und strategisches Antwortverhalten (<italic>test wiseness</italic>) spielen nur in Ausnahmef&#228;llen eine Rolle. Mit abnehmender Sprachkompetenz ver&#228;ndert sich die Verteilung der Testl&#246;sungsprozesse: Geringeres und weniger prozeduralisiertes Sprachwissen erschwert und verlangsamt die Verarbeitung, die dann st&#228;rker auf deklarativem, nicht-automatisiertem Wissen basiert und h&#228;ufiger Evaluations- und Suchprozesse erfordert.</p>
<p>Bei der C-Testbearbeitung werden niedrigere kognitive Prozesse der Worterkennung und der syntaktischen Analyse durch h&#246;here Prozesse der Hypothesenbildung und Textverkn&#252;pfung erg&#228;nzt, um Redundanzverluste auszugleichen. Je nach L&#252;ckenart erfolgt die Wiederherstellung eines getilgten Wortteils automatisch &#252;ber das mentale Lexikon oder erfordert eine syntaktische Verarbeitung der Umgebung (in Echtzeit oder verz&#246;gert). L&#246;sungsevaluation und -suche k&#246;nnen lokal durch syntaktische Analyse auf Teilsatzebene oder global durch Inferenzbildung auf Textebene ablaufen. Somit n&#228;hert sich die C-Testbearbeitung auf dem Kontinuum zwischen Leseverstehensaufgaben und <italic>language-in-use tasks</italic><xref ref-type="fn" rid="n4">4</xref> tendenziell eher Letzteren an.</p>
<p>Aus diesem Grund und aufgrund der K&#252;rze der Texte schlagen wir vor, zwischen der automatisierten Beseitigung reduzierter Redundanz und der aufmerksamen, zeit- sowie kognitiv anspruchsvolleren Verarbeitung zu unterscheiden. Diese Unterscheidung erscheint uns zielf&#252;hrender als eine Einteilung in hierarchieniedrige und -hohe Ebenen. Daher untersuchen wir in unserer Studie zwei Arten von Verarbeitungsprozessen beim L&#246;sen eines C-Tests:</p>
<list list-type="bullet">
<list-item><p>Automatisierte Verarbeitung: schnelle, serielle, unbewusste Verarbeitung &#252;berwiegend auf lokaler Ebene</p></list-item>
<list-item><p>Kognitiv anspruchsvolle Verarbeitung: verz&#246;gerte, nicht-lineare, bewusste Verarbeitung, die i.d.R. einen breiteren Kontext analysiert, evaluiert und/oder integriert</p></list-item>
</list>
<p>Welche Prozesse dominieren, h&#228;ngt von Faktoren wie der Lernendenkompetenz, den L&#252;cken- und Texteigenschaften sowie der Bearbeitungszeit ab. Die Bearbeitung von Mikrol&#252;cken f&#246;rdert automatisierte Prozesse, w&#228;hrend Makrol&#252;cken eine bewusste und zeitintensive Verarbeitung beg&#252;nstigen. Eine automatisierte Verarbeitung dominiert bei hoher Sprachkompetenz und nimmt mit geringerer Kompetenz ab, w&#228;hrend Zeitreduktion automatisierte Prozesse verst&#228;rkt aktiviert.</p>
<p>Daraus ergeben sich folgende Forschungsfragen:</p>
<list list-type="simple">
<list-item><p>1) Wie unterscheidet sich die Bearbeitung vom kanonischen im Vergleich zum zeitreduzierten C-Test?</p></list-item>
</list>
<p>Hypothese: Der zeitreduzierte C-Test wird vorwiegend linear bearbeitet, mit wenig &#220;berspringen und Zur&#252;ckkehren. Beim kanonischen C-Test findet h&#228;ufiger eine nicht-lineare Bearbeitung statt.</p>
<list list-type="simple">
<list-item><p>2) Wie unterscheidet sich das Antwortverhalten beim erfolgreichen Ausf&#252;llen von Mikrol&#252;cken?</p></list-item>
</list>
<p>Hypothese: Die z&#252;gige, lineare erfolgreiche Bearbeitung der Mikrol&#252;cken wird im zeitreduzierten C-Test und im kanonischen C-Test vergleichbar h&#228;ufig vorkommen.</p>
<list list-type="simple">
<list-item><p>3) Wie unterscheidet sich das Antwortverhalten beim erfolgreichen Ausf&#252;llen von Makrol&#252;cken?</p></list-item>
</list>
<p>Hypothese: Im kanonischen C-Test wird die nicht-lineare sowie verz&#246;gerte erfolgreiche Bearbeitung der Makrol&#252;cken h&#228;ufiger vorkommen als im zeitreduzierten C-Test.</p>
</sec>
</sec>
<sec>
<title>4 Methodik</title>
<sec>
<title>4.1 Proband*innen, Instrumente und Datenerhebung</title>
<p>An der Studie nahmen 16 ausl&#228;ndische Studierende (9 weiblich, 7 m&#228;nnlich; Alter zwischen 19 und 31 Jahren (<italic>M</italic> = 22,75 Jahre); unterschiedliche L1s) einer gro&#223;en Universit&#228;t in Deutschland teil, die ihre Deutschkenntnisse auf B2 (10 Personen) oder C1-Niveau (sechs Personen) des GeR einsch&#228;tzten.</p>
<p>Um die Sprachkompetenz der Testpersonen zu kontrollieren, setzten wir die neue Variante der <italic>Elicited Imitation Task</italic> in schriftlicher Form ein. Der WEIT (<italic>Written Elicited Imitation Task</italic>)<xref ref-type="fn" rid="n5">5</xref> ist ein Messverfahren, das prozedurales Sprachwissen erfasst, welches sich im Umgang mit schriftsprachlichen Mustern entwickelt und bei der Bearbeitung der Testaufgaben in schriftlicher Form weitgehend automatisiert aktiviert wird. Die WEIT-Ergebnisse betrugen zwischen 17 und 67 Punkten (<italic>M</italic> = 45,8; <italic>SD</italic> = 13,7 auf einer Skala von 80 Punkten).</p>
<p>Die eingesetzten C-Tests bestanden jeweils aus vier unterschiedlichen Texten mit je 20 L&#252;cken. Insgesamt wurden also acht Texte aus der Datenbank des Online-Spracheinstufungstests (onSET)<xref ref-type="fn" rid="n6">6</xref> ausgew&#228;hlt und nach aufsteigender Schwierigkeit angeordnet, sodass sich zwei parallele Testversionen mit vergleichbarem Schwierigkeitsgrad und thematischer Vielfalt ergaben. Mit &#8222;Schwierigkeit&#8220; ist hier die Rasch-Itemschwierigkeit gemeint: Die Texte werden auf einer gemeinsamen Logit-Skala angeordnet, auf der schwierigere Texte niedrigere erwartete Punktwerte bei Personen mit derselben Auspr&#228;gung auf dem zugrunde liegenden F&#228;higkeitskontinuum hervorrufen (Eckes, 2011). Linguistische Merkmale (z.B. Satzl&#228;nge, lexikalische Diversit&#228;t, Worth&#228;ufigkeit) sind m&#246;gliche Quellen dieser empirisch bestimmten Schwierigkeit (vgl. <xref ref-type="bibr" rid="B5">Beinborn et al. 2014</xref>; <xref ref-type="bibr" rid="B24">Kaufmann 2016</xref>).</p>
<p>Alle Testteilnehmenden haben alle acht Texte in den beiden Testversionen bearbeitet. F&#252;r die Analyse wurden Bildschirmaufnahmen der Texte 2 und 4 sowohl aus der kanonischen als auch aus der zeitreduzierten Testversion herangezogen. Text 1 diente als Icebreaker und zur Familiarisierung sowohl mit dem C-Testformat als auch mit dem Aufnahme-Tool. Der mittelschwere Text 3 wurde ausgeschlossen, um einen deutlicheren Kontrast in Bezug auf die Schwierigkeit zu erzielen.</p>
<p>Die Bearbeitungszeit war textspezifisch festgelegt: jeweils 5 Minuten f&#252;r die Texte der kanonischen Testversion und zwischen 1:30 und 2:00 Minuten f&#252;r die Texte der zeitreduzierten Version (1:40 Minuten f&#252;r Text 2; 2:00 Minuten f&#252;r Text 4)<xref ref-type="fn" rid="n7">7</xref>. Eine vorzeitige Abgabe war m&#246;glich, sodass die durchschnittlichen Bearbeitungszeiten in der kanonischen Version bei 3:17 Minuten (<italic>SA</italic> = 0,93) f&#252;r Text 2 und 3:51 Minuten (<italic>SA</italic> = 0,94) f&#252;r Text 4 lagen. In der zeitreduzierten Version betrugen sie 1:38 Minuten (<italic>SA</italic> = 0,16) f&#252;r Text 2 und 1:58 Minuten (<italic>SA</italic> = 0,07) f&#252;r Text 4. Die Reihenfolge der Texte war innerhalb einer Testversion fixiert.</p>
<p>Die Datenerhebung fand in einem Computerraum der Universit&#228;t statt und dauerte eine Stunde. Nach einer Einf&#252;hrung in den Zweck der Studie und die Nutzung des Screen-Recorders bearbeiteten die Teilnehmenden die Tests auf der <italic>Moodle</italic>-Plattform. Die Bildschirme wurden bei der Bearbeitung mit dem vorinstallierten frei zug&#228;nglichen Screen-Recorder <italic>DemoAir</italic> (Wondershare; <xref ref-type="bibr" rid="B37">Wondershare n.d.</xref>) aufgenommen.</p>
</sec>
<sec>
<title>4.2 Klassifikation der L&#252;cken</title>
<p>Alle L&#252;cken in den vier analysierten C-Test-Texten wurden in die Kategorien &#8222;Mikro-&#8220; und &#8222;Makrol&#252;cken&#8220; unterteilt. Die Zuordnung erfolgte basierend auf dem minimalen Kontext, den hochkompetente Sprachnutzer*innen zur L&#246;sung der L&#252;cke ben&#246;tigen. Mikrol&#252;cken k&#246;nnen mithilfe des Mikrokontextes gel&#246;st werden, w&#228;hrend Makrol&#252;cken einen breiteren Kontext erfordern. Abweichend von Beinborn et al. (<xref ref-type="bibr" rid="B5">2014</xref>) definieren wir <italic>Mikrokontext</italic> als die L&#252;cke selbst plus bis zu <bold>zwei</bold> W&#246;rter davor und danach; alles dar&#252;ber hinaus gilt als <italic>Makrokontext</italic>. Die Erweiterung des Mikrokontexts auf bis zu zwei W&#246;rter vor und nach der L&#252;cke ergibt sich aus der von den Autorinnen durchgef&#252;hrten L&#252;ckenanalyse. Diese zeigte, dass viele L&#252;cken zwar ein etwas weiter entferntes als das unmittelbar angrenzende Wort f&#252;r die Rekonstruktion erfordern, dennoch lokal l&#246;sbar sind und nicht als Makrol&#252;cken (im Sinne text&#252;bergreifender, kontextuell komplexer L&#252;cken; vgl. <xref ref-type="bibr" rid="B5">Beinborn et al. 2014</xref>) bezeichnet werden k&#246;nnen.<xref ref-type="fn" rid="n8">8</xref></p>
<p>Der minimal erforderliche Kontext wurde durch Triangulation verschiedener Datenquellen bestimmt. Die Analyse der Lernendenantworten<xref ref-type="fn" rid="n9">9</xref> lieferte Schwierigkeitsindizes und h&#228;ufige Antworten. Die Untersuchung jedes getilgten Wortes und seiner Position im Text zeigte, welche alternativen Fortsetzungen lokal m&#246;glich w&#228;ren und welche durch den Kontext ausgeschlossen werden (vgl. <xref ref-type="bibr" rid="B33">Sigott 2004</xref>). Auf dieser Grundlage erfolgte die Zuordnung in Mikro- vs. Makrol&#252;cken sowie die Bestimmung der linguistischen Wissensbest&#228;nde f&#252;r das erfolgreiche Ausf&#252;llen. <xref ref-type="table" rid="T1">Tabelle 1</xref> veranschaulicht die analysierten Daten und die resultierende Zuordnung anhand von vier L&#252;cken eines Textes.</p>
<table-wrap id="T1">
<caption>
<p>Tab. 1: Beispiel f&#252;r die L&#252;ckenanalyse</p>
</caption>
<table>
<tbody>
<tr>
<td align="left" valign="top"><bold>L&#252;cke</bold></td>
<td align="left" valign="top"><bold>Schwierigkeit</bold></td>
<td align="left" valign="top"><bold>h&#228;ufigste</bold><break/><bold>falsche Antworten</bold></td>
<td align="left" valign="top"><bold>Wort-art</bold></td>
<td align="left" valign="top"><bold>minimal erforderlicher Kontext</bold></td>
<td align="left" valign="top"><bold>Interl&#252;ckendependenz</bold></td>
<td align="left" valign="top" style="background-color:#f3f3f4;"><bold>L&#252;cken-art</bold></td>
<td align="left" valign="top"><bold>erford. Wissen</bold></td>
</tr>
<tr>
<td align="left" valign="top">i<italic>[m]</italic></td>
<td align="left" valign="top">45,4</td>
<td align="left" valign="top">in(s) - 21,3<break/>ich - 12,9<break/>ist - 11,9</td>
<td align="left" valign="top">Pr&#228;p</td>
<td align="left" valign="top">Ob i___ Konzertsaal od___ <bold>im</bold> Kaufh___, Musik <bold>begl</bold>___</td>
<td align="left" valign="top">begl___</td>
<td align="left" valign="top" style="background-color:#f3f3f4;"><bold>Makro</bold> (<italic>Kontext nach-folgend</italic>)</td>
<td align="left" valign="top">lexik.; syntakt.; morph.</td>
</tr>
<tr>
<td align="left" valign="top">od<italic>[er]</italic></td>
<td align="left" valign="top">90,7</td>
<td align="left" valign="top">-</td>
<td align="left" valign="top">Konj</td>
<td align="left" valign="top">(im) Konzertsaal od___ im Kaufh___</td>
<td align="left" valign="top"></td>
<td align="left" valign="top" style="background-color:#f3f3f4;"><bold>Mikro</bold></td>
<td align="left" valign="top">lexik.; syntakt.</td>
</tr>
<tr>
<td align="left" valign="top">begl<italic>[eitet]</italic></td>
<td align="left" valign="top">33,0</td>
<td align="left" valign="top"><italic>keine Antwort - 13,9</italic><break/>begleiten - 11,3</td>
<td align="left" valign="top">Verb</td>
<td align="left" valign="top"><italic>Einleitungssatz und Satzteil vor der L&#252;cke, sonst &#8220;begl&#252;ckt&#8221; m&#246;glich</italic></td>
<td align="left" valign="top">Ob i___ Konzertsaal od___ im Kaufh___</td>
<td align="left" valign="top" style="background-color:#f3f3f4;"><bold>Makro</bold> (<italic>Kontext voran-gehend</italic>)</td>
<td align="left" valign="top">lexik.; syntakt.; morph.</td>
</tr>
<tr>
<td align="left" valign="top">Emot<italic>[ionen]</italic></td>
<td align="left" valign="top">72,2</td>
<td align="left" valign="top">-</td>
<td align="left" valign="top">Subst</td>
<td align="left" valign="top">Emot___</td>
<td align="left" valign="top"></td>
<td align="left" valign="top" style="background-color:#f3f3f4;"><bold>Mikro</bold></td>
<td align="left" valign="top">lexik.</td>
</tr>
</tbody>
</table>
</table-wrap>
<p>Die Ergebnisse der L&#252;ckenklassifikation in <xref ref-type="table" rid="T2">Tabelle 2</xref> zeigen, dass Makrol&#252;cken etwa ein Drittel aller L&#252;cken (14 von 40) in den analysierten Texten in beiden Testversionen ausmachen, wobei es in den schwierigeren Texten (Text 4) mehr Makrol&#252;cken gibt (jeweils acht) als in den einfacheren Texten (Text 2, jeweils sechs). Makrol&#252;cken waren im Durchschnitt schwieriger als Mikrol&#252;cken, wie die niedrigeren Schwierigkeitsindices<xref ref-type="fn" rid="n10">10</xref> verdeutlichen (<italic>M<sub>makro</sub></italic> = 39,1 vs. <italic>M<sub>mikro</sub></italic> = 51,2; &#8776; 24 % niedriger).</p>
<table-wrap id="T2">
<caption>
<p>Tab. 2: Verteilung der Mikro- und Makrol&#252;cken in den analysierten Texten</p>
</caption>
<table>
<tbody>
<tr>
<td align="left" valign="top"></td>
<td align="left" colspan="3" valign="top">kanonischer C-Test</td>
<td align="left" colspan="3" valign="top">zeitreduzierter C-Test</td>
</tr>
<tr>
<td align="left" valign="top"></td>
<td align="left" valign="top">Text 2</td>
<td align="left" valign="top">Text 4</td>
<td align="left" valign="top">Gesamt</td>
<td align="left" valign="top">Text 2</td>
<td align="left" valign="top">Text 4</td>
<td align="left" valign="top">Gesamt</td>
</tr>
<tr>
<td align="left" valign="top">Mikro</td>
<td align="left" valign="top">14</td>
<td align="left" valign="top">12</td>
<td align="left" valign="top">26</td>
<td align="left" valign="top">14</td>
<td align="left" valign="top">12</td>
<td align="left" valign="top">26</td>
</tr>
<tr>
<td align="left" valign="top">Makro</td>
<td align="left" valign="top">6</td>
<td align="left" valign="top">8</td>
<td align="left" valign="top">14</td>
<td align="left" valign="top">6</td>
<td align="left" valign="top">8</td>
<td align="left" valign="top">14</td>
</tr>
<tr>
<td align="left" valign="top">Gesamt</td>
<td align="left" valign="top">20</td>
<td align="left" valign="top">20</td>
<td align="left" valign="top">40</td>
<td align="left" valign="top">20</td>
<td align="left" valign="top">20</td>
<td align="left" valign="top">40</td>
</tr>
</tbody>
</table>
</table-wrap>
</sec>
<sec>
<title>4.3 Kodieren der Bildschirmaufnahmen</title>
<p>Das Bearbeitungsverhalten der Teilnehmenden wurde in den Bildschirmaufnahmen anhand folgender Daten dokumentiert<xref ref-type="fn" rid="n11">11</xref>: Cursorbewegung im Text; Entwicklung und &#196;nderungen einer Antwort (z.B. Korrekturen, L&#246;schen) und temporale Daten (Verweildauer in einer L&#252;cke, Bearbeitungszeiten).</p>
<p>Das Kodierschema zur Erfassung des Bearbeitungsverhaltens wurde iterativ auf Grundlage bestehender Theorien und vorliegender Daten entwickelt. Die Hauptkategorien &#8222;Lineare Bearbeitung&#8220;, &#8222;&#220;berspringen&#8220; u.&#196;. wurden <italic>a priori</italic> festgelegt (<xref ref-type="bibr" rid="B14">Germann/Grotjahn 1994</xref>; <xref ref-type="bibr" rid="B39">Zimmermann 2019</xref>). Nach der ersten Anwendung auf die Daten (f&#252;nf Aufnahmen) durch drei Autorinnen und eine weitere Kodierperson wurde das vorl&#228;ufige Schema in einem Treffen diskutiert und verfeinert. So entstand z.B. die Unterkategorie &#8222;Direkte Revision&#8220; in der Kategorie &#8222;Lineare Bearbeitung&#8220;. Verhaltensweisen wie &#8222;Verschlimmbesserungen&#8220; (<italic>disimprovement</italic>) und l&#228;ngeres Verweilen in einer L&#252;cke vor der Eingabe einer Antwort wurden ebenso als Beobachtungskategorien definiert.</p>
<p>Anschlie&#223;end kodierten zwei Personen die restlichen der 64 Aufnahmen. Die beiden Kodierenden machten sich im Vorfeld mit dem Kodierschema vertraut und trafen sich w&#228;hrend des Verfahrens mehrfach, um eine einheitliche Kodierung zu gew&#228;hrleisten. <xref ref-type="table" rid="T3">Tabelle 3</xref> veranschaulicht das Kodierschema.</p>
<table-wrap id="T3">
<caption>
<p>Tab. 3: Kodierschema f&#252;r Bildschirmaufnahmen</p>
</caption>
<table>
<tbody>
<tr>
<td align="left" valign="top">Code</td>
<td align="left" valign="top">Bearbeitungsvorgang</td>
</tr>
<tr>
<td align="left" valign="top"><italic>Correct in 1st linear attempt</italic></td>
<td align="left" valign="top">Richtige Antwort im ersten linearen Bearbeitungsdurchgang</td>
</tr>
<tr>
<td align="left" valign="top"><italic>Wrong in 1st linear attempt</italic></td>
<td align="left" valign="top">Falsche Antwort im ersten linearen Bearbeitungsdurchgang</td>
</tr>
<tr>
<td align="left" valign="top"><italic>Direct revision</italic></td>
<td align="left" valign="top">&#220;berarbeitung einer Antwort unmittelbar nach der Eingabe</td>
</tr>
<tr>
<td align="left" valign="top"><italic>Skipped</italic></td>
<td align="left" valign="top">&#220;berspringen (keine Bearbeitung) einer L&#252;cke im ersten Bearbeitungsdurchgang</td>
</tr>
<tr>
<td align="left" valign="top"><italic>Backtracking: delayed revision</italic></td>
<td align="left" valign="top">Zur&#252;ckkehren zu und nachtr&#228;gliche Revision einer bereits ausgef&#252;llten L&#252;cke</td>
</tr>
<tr>
<td align="left" valign="top"><italic>Backtracking to skipped gaps</italic></td>
<td align="left" valign="top">Zur&#252;ckkehren zu und nachtr&#228;gliches Ausf&#252;llen einer noch nicht ausgef&#252;llten L&#252;cke</td>
</tr>
<tr>
<td align="left" valign="top"><italic>Not attempted</italic></td>
<td align="left" valign="top">L&#252;cke, die aufgrund abgelaufener Testzeit nicht ausgef&#252;llt wurde</td>
</tr>
<tr>
<td align="left" valign="top"><italic>Disimprovement</italic></td>
<td align="left" valign="top">Korrektur einer Antwort (unmittelbar oder nachtr&#228;glich) zu einer falschen Antwort</td>
</tr>
</tbody>
</table>
</table-wrap>
<p>Zus&#228;tzlich zu den in <xref ref-type="table" rid="T3">Tabelle 3</xref> dargestellten Bearbeitungsvorg&#228;ngen wurden temporale Daten erfasst. Ermittelt wurde die Verweilzeit in einer L&#252;cke gemessen als Zeitspanne zwischen dem Aufleuchten des L&#252;ckenk&#228;stchens und der Eingabe der Antwort, sofern diese mehr als 3 Sekunden betrug. Diese Daten wurden in die Analysen einbezogen, um zwischen z&#252;gigen und verz&#246;gerten Verarbeitungsprozessen zu unterscheiden. Verz&#246;gerte Verarbeitung wurde weiter unterteilt in &#8222;schnelle&#8220; (bis 6 Sekunden) und &#8222;langsame&#8220; (ab 7 Sekunden) Bearbeitungsvorg&#228;nge<xref ref-type="fn" rid="n12">12</xref>.</p>
</sec>
<sec>
<title>4.4 Analysen</title>
<p>Die H&#228;ufigkeiten der verschiedenen Kategorien des Bearbeitungsverhaltens wurden berechnet und in <italic>Excel</italic> erfasst. Die statistischen Auswertungen (Durchschnittswerte, Standardabweichungen, t-Tests) erfolgten in <italic>Excel</italic> oder <italic>R</italic>.</p>
</sec>
</sec>
<sec>
<title>5 Ergebnisse</title>
<sec>
<title>5.1 Unterschiede in der Bearbeitung allgemein</title>
<p><xref ref-type="table" rid="T4">Tabelle 4</xref> gibt einen &#220;berblick &#252;ber die unterschiedlichen Bearbeitungsvorg&#228;nge nach Testversion, die als Referenzwerte dienen.</p>
<table-wrap id="T4">
<caption>
<p>Tab. 4: Bearbeitungsvorg&#228;nge nach Testversion</p>
</caption>
<table>
<tbody>
<tr>
<td colspan="2" align="left" valign="top"></td>
<td align="left" valign="top">kanonischer<break/>C-Test</td>
<td align="left" valign="top">zeitreduzierter C-Test</td>
</tr>
<tr>
<td colspan="2" align="left" valign="top">Lineare Bearbeitung</td>
<td align="left" valign="top">583</td>
<td align="left" valign="top">584</td>
</tr>
<tr>
<td rowspan="3" align="left" valign="top">Nicht-lineare Bearbeitung</td>
<td align="left" valign="top">&#220;berspringen</td>
<td align="left" valign="top">113</td>
<td align="left" valign="top">93</td>
</tr>
<tr>
<td align="left" valign="top">Nachtr&#228;gliche Revision</td>
<td align="left" valign="top">25</td>
<td align="left" valign="top">14</td>
</tr>
<tr>
<td align="left" valign="top">Nachtr&#228;gliches Ausf&#252;llen</td>
<td align="left" valign="top">119</td>
<td align="left" valign="top">48</td>
</tr>
<tr>
<td colspan="2" align="left" valign="top">Bearbeitungsvorg&#228;nge gesamt</td>
<td align="left" valign="top">840</td>
<td align="left" valign="top">739</td>
</tr>
</tbody>
</table>
</table-wrap>
<p>Die lineare Bearbeitung dominiert in beiden Testformen mit knapp 70 &#8211; 80 % aller Bearbeitungsvorg&#228;nge (<xref ref-type="fig" rid="F1">Abb. 1</xref>). Im kanonischen C-Test tritt nicht-lineare Bearbeitung h&#228;ufiger als im zeitreduzierten C-Test auf: Der Unterschied betr&#228;gt rund 9 % und ist laut t-Test f&#252;r abh&#228;ngige Stichproben signifikant mit einem gro&#223;en Effekt: <italic>t</italic>(15) = 2,67, <italic>p</italic> = ,017, <italic>d</italic> = 0,67.</p>
<fig id="F1">
<caption>
<p>Abb. 1: C-Testbearbeitung allgemein</p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="zif-4262_timukova-g1.png"/>
</fig>
<p>Beim Vergleich der Kategorien nicht-linearer Bearbeitung zwischen den Testformen (<xref ref-type="fig" rid="F2">Abb. 2</xref>) zeigt sich, dass Teilnehmende in der kanonischen Form h&#228;ufiger L&#252;cken &#252;berspringen und zu ihnen zur&#252;ckkehren. Der Unterschied im &#8222;Nachtr&#228;glichen Ausf&#252;llen&#8220; ist statistisch signifikant mit einer gro&#223;en Effektst&#228;rke: <italic>t</italic>(15) = 3,51, <italic>p</italic> &lt; ,005, <italic>d</italic> = 0,88. Hingegen unterscheiden sich die Testformen wenig in der H&#228;ufigkeit nachtr&#228;glicher Revision bereits ausgef&#252;llter L&#252;cken, die insgesamt selten auftritt. Im kanonischen C-Test zeigt sich das nachtr&#228;gliche Ausf&#252;llen von L&#252;cken h&#228;ufiger als das &#220;berspringen, da &#252;bersprungene L&#252;cken beim <italic>Backtracking</italic> mehr als einmal wieder bearbeitet werden.</p>
<fig id="F2">
<caption>
<p>Abb. 2: Nicht-lineare Bearbeitung nach Kategorien</p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="zif-4262_timukova-g2.png"/>
</fig>
</sec>
<sec>
<title>5.2 Antwortverhalten beim Bearbeiten von Mikrol&#252;cken</title>
<p>F&#252;r diese Analyse wurden nur Bearbeitungsvorg&#228;nge gez&#228;hlt, die zu einer korrekten Antwort f&#252;hrten. In beiden Testformen werden Mikrol&#252;cken &#252;berwiegend linear ausgef&#252;llt (&#252;ber 95 %, <xref ref-type="fig" rid="F3">Abb. 3</xref>). Eine z&#252;gige lineare Bearbeitung mit korrektem Ergebnis tritt im zeitreduzierten C-Test etwas h&#228;ufiger auf (89 % vs. 83 % der F&#228;lle), wobei der Unterschied nicht signifikant ist mit einer mittleren Effektgr&#246;&#223;e: <italic>t</italic>(15) = 1,91, <italic>p</italic> = ,080, d = 0,48.</p>
<fig id="F3">
<caption>
<p>Abb. 3: Bearbeitung der Mikrol&#252;cken</p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="zif-4262_timukova-g3.png"/>
</fig>
</sec>
<sec>
<title>5.3 Antwortverhalten beim Bearbeiten von Makrol&#252;cken</title>
<p>Beim Bearbeiten von L&#252;cken, die einen breiteren Kontext f&#252;r die L&#246;sung erfordern, zeigten sich keine signifikanten Unterschiede im linearen Vorgehen zwischen den C-Testformen, obwohl ein kleiner bis mittlerer Effekt erkennbar war (<italic>t</italic>(15) = &#8211;1,26, <italic>p</italic> = ,228, <italic>d</italic> = 0,32). In der H&#228;ufigkeit der nicht-linearen Bearbeitung (vgl. <xref ref-type="fig" rid="F4">Abb. 4</xref>) hingegen zeigte sich nicht nur ein signifikanter Unterschied zugunsten des kanonischen C-Tests (26&#8239;% vs. 10&#8239;%), sondern auch eine mittlere bis starke Effektgr&#246;&#223;e (<italic>t</italic>(15) = 2,42, <italic>p</italic> = ,029, <italic>d</italic> = 0,61). In die Analyse gingen nur korrekt ausgef&#252;llte L&#252;cken ein.</p>
<fig id="F4">
<caption>
<p>Abb. 4: Bearbeitung der Makrol&#252;cken</p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="zif-4262_timukova-g4.png"/>
</fig>
<p>R&#252;ckspr&#252;nge zu Makrol&#252;cken treten im kanonischen C-Test etwa 2,5-mal so h&#228;ufig auf wie im zeitreduzierten Format (74 vs. 29 Bearbeitungsvorg&#228;nge; vgl. <xref ref-type="fig" rid="F5">Abb. 5</xref>). Dieser Unterschied ist statistisch signifikant mit gro&#223;em Effekt: <italic>t</italic>(15) = 4,58, <italic>p</italic> &lt; ,001, <italic>d</italic> = 1,10. Solche R&#252;ckspr&#252;nge erfolgen entweder zur Revision einer bereits bearbeiteten L&#252;cke oder zum nachtr&#228;glichen Ausf&#252;llen einer bislang unbeantworteten L&#252;cke und k&#246;nnen als erfolgreich (richtige L&#246;sung) oder erfolglos (falsche oder keine L&#246;sung) klassifiziert werden. Unabh&#228;ngig vom Testformat liegt die Erfolgsquote dieser nachtr&#228;glichen Bearbeitungsvorg&#228;nge deutlich unterhalb der 50 %-Marke &#8211; bei 43,2 % im kanonischen und 41,4 % im zeitreduzierten C-Test.</p>
<fig id="F5">
<caption>
<p>Abb. 5: Zur&#252;ckspringen zu Makrol&#252;cken</p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="zif-4262_timukova-g5.png"/>
</fig>
<p>Wird die r&#252;ckl&#228;ufige Bearbeitung der Makrol&#252;cken nach Verweildauer in &#8222;schnell&#8220; (bis zu 6 Sekunden) und &#8222;langsam&#8220; (ab 7 Sekunden) unterteilt, zeigt sich eine tendenzielle Pr&#228;ferenz f&#252;r die langsame Bearbeitung im kanonischen C-Test (45 vs. 29 Vorg&#228;nge), <italic>t</italic>(15) = 2,03, <italic>p</italic> = ,060, <italic>d</italic> = 0,51. Dabei sinkt die Erfolgsrate leicht von 48 % bei schneller auf 40 % bei langsamer Bearbeitung (<xref ref-type="fig" rid="F6">Abb. 6</xref>), ohne signifikanten Unterschied (<italic>t</italic>(15) = 0,94, <italic>p</italic> = ,360, <italic>d</italic> = 0,23).</p>
<fig id="F6">
<caption>
<p>Abb. 6: Zur&#252;ckspringen zu Makrol&#252;cken nach Verweildauer</p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="zif-4262_timukova-g6.png"/>
</fig>
<p>Bei Zeitreduktion treten &#8222;schnelle&#8220; und &#8222;langsame&#8220; Bearbeitungen der Makrol&#252;cken in etwa gleich h&#228;ufig auf (13 vs. 16 Vorg&#228;nge), <italic>t</italic>(15) = 0,53, <italic>p</italic> = ,610, <italic>d</italic> = 0,13. Die Erfolgsrate sinkt mit zunehmender Verweildauer deutlich &#8211; von 62 % bei k&#252;rzerer auf nur 25 % bei l&#228;ngerer Verweildauer in der L&#252;cke (<xref ref-type="fig" rid="F6">Abb. 6</xref>). Dieser Unterschied ist statistisch jedoch nicht signifikant, <italic>t</italic>(15) = &#8211;1,07, <italic>p</italic> = ,300, <italic>d</italic> = &#8211;0,27.</p>
</sec>
</sec>
<sec>
<title>6 Diskussion</title>
<sec>
<title>6.1 Interpretation der Ergebnisse</title>
<p>Deutsche C-Tests mit und ohne Zeitbegrenzung werden von relativ fortgeschrittenen DaF-Lernenden &#252;berwiegend linear rekonstruiert: Rund 70 &#8211; 80 % aller Bearbeitungsvorg&#228;nge erfolgen linear, bei Mikrol&#252;cken sogar &#252;ber 95%. Lineares Vorgehen ist somit die dominante Bearbeitungsform, die unabh&#228;ngig von den Zeitbedingungen stabil bleibt. Dieses Ergebnis widerspricht den Befunden von Zimmermann (<xref ref-type="bibr" rid="B39">2019</xref>) und spricht f&#252;r die Konstruktvalidit&#228;t des C-Testformats: Offenbar wird das Format von den Testteilnehmenden mit fortgeschrittenen Sprachkenntnissen prim&#228;r als koh&#228;renter Text und nicht als Sprachr&#228;tsel wahrgenommen und bearbeitet. Die Dominanz linearer Bearbeitung d&#252;rfte auch mit den Texteigenschaften zusammenh&#228;ngen, da etwa zwei Drittel der L&#252;cken in den analysierten Texten Mikrol&#252;cken darstellen, die nur minimalen Kontext erfordern und lokal rekonstruierbar sind.</p>
<p>Gleichzeitig zeigen die Daten, dass Zeitbedingungen bestimmte Bearbeitungsweisen im C-Test beeinflussen, was auf Unterschiede in den zugrunde liegenden kognitiven Verarbeitungsprozessen hindeuten kann. Im zeitreduzierten C-Test werden L&#252;cken seltener &#252;bersprungen oder nachtr&#228;glich bearbeitet, was wiederum die Hypothese von Zimmermann (<xref ref-type="bibr" rid="B39">2019</xref>) st&#252;tzt. Bereits bearbeitete L&#252;cken werden dagegen nur selten revidiert, selbst wenn mehr Zeit zur Verf&#252;gung steht, was m&#246;glicherweise darauf zur&#252;ckzuf&#252;hren ist, dass Erstl&#246;sungen h&#228;ufig auf automatisierten, prozeduralen Prozessen beruhen und der zus&#228;tzliche kognitive Aufwand die Wahrscheinlichkeit einer Revision reduziert. Insgesamt scheint die l&#228;ngere verf&#252;gbare Bearbeitungszeit im kanonischen Format flexiblere Bearbeitungsmuster zu erm&#246;glichen, die exploratives Erg&#228;nzen offener L&#252;cken beg&#252;nstigen und dabei einen vermeintlichen Zugriff auf deklaratives Wissen nahelegen.</p>
<p>Bei Mikrol&#252;cken, die in beiden Formaten fast ausschlie&#223;lich linear bearbeitet werden, scheint die Verarbeitung unabh&#228;ngig von Zeitdruck stark automatisiert abzulaufen. Der geringe, nicht signifikante Unterschied zwischen kanonischer und zeitreduzierter Form legt nahe, dass diese lokal gebundenen L&#252;cken vor allem routinisierte sprachliche Prozesse aktivieren, die gegen&#252;ber Zeitrestriktionen vergleichsweise robust sind.</p>
<p>Ein anderes Bild ergibt sich bei Makrol&#252;cken, die einen breiteren Kontext f&#252;r die L&#246;sung erfordern. Zwar dominiert auch hier die lineare Bearbeitung (75 % im kanonischen vs. knapp 90 % im zeitreduzierten C-Test)<xref ref-type="fn" rid="n13">13</xref>, doch zeigen sich im kanonischen Format signifikant h&#228;ufiger nicht lineare Bearbeitungen, bei denen Teilnehmende L&#252;cken &#252;berspringen und sp&#228;ter nacharbeiten. Dies k&#246;nnte darauf hindeuten, dass das kanonische Format eher bewusst-strategisches Vorgehen bei diesen anspruchsvolleren L&#252;cken beg&#252;nstigt, das m&#246;glicherweise st&#228;rker auf deklarativem Wissen basiert.</p>
<p>Die vorwiegend lineare Bearbeitungsweise der Makrol&#252;cken im zeitreduzierten C-Test-Format k&#246;nnte mehrere Ursachen haben. Denkbar ist, dass Zeitdruck voreilige Eingaben beg&#252;nstigt, bevor der notwendige Kontext ber&#252;cksichtigt wird (<italic>early closure</italic>), oder Raten als konstruktirrelevante Bearbeitungsstrategie provoziert. Dagegen spricht jedoch die vernachl&#228;ssigbar geringe Differenz in der Gesamtzahl korrekt gel&#246;ster Makrol&#252;cken: 121 im kanonischen vs. 119 im zeitreduzierten C-Test. Naheliegender erscheint daher, dass Zeitrestriktion zu einem schnelleren, lineareren Bearbeitungsstil zwingt, der st&#228;rker automatisierte Prozesse und prozeduralisiertes Wissen aktiviert und dadurch eine schnelle antizipatorische Verarbeitung erm&#246;glicht.</p>
<p>Obwohl Teilnehmende im kanonischen C-Test h&#228;ufiger zu leeren oder bereits ausgef&#252;llten Makrol&#252;cken zur&#252;ckkehren, bleibt die Erfolgsrate beim <italic>Backtracking</italic> in beiden Testformen vergleichbar niedrig (ca. 43 % im kanonischen vs. ca. 41 % im zeitreduzierten C-Test). Zudem verweilen die Proband*innen im kanonischen C-Tests tendenziell l&#228;nger in den Makrol&#252;cken, wenngleich der Unterschied nicht signifikant ist. Eine l&#228;ngere Verweildauer f&#252;hrt jedoch nicht zu mehr richtigen Antworten, und zwar in den beiden Testformen. Im Gegenteil: Es zeigt sich ein negativer Zusammenhang (l&#228;ngere Verweildauer &#8211; geringere Erfolgsrate), besonders unter erh&#246;htem Zeitdruck. Im zeitreduzierten C-Test f&#252;hrte eine Verweildauer von weniger als 7 Sekunden in 62 % der F&#228;lle zu einer richtigen Antwort, w&#228;hrend beim l&#228;ngeren Verweilen die betroffene Makrol&#252;cke in 75 % der F&#228;lle leer oder falsch ausgef&#252;llt blieb. Zwar erreichte auch dieser Unterschied keine statistische Signifikanz, dennoch k&#246;nnte der Befund darauf hindeuten, dass l&#228;ngeres Verweilen in einer L&#252;cke weniger mit gr&#252;ndlicher Bearbeitung als mit L&#246;sungsschwierigkeiten zusammenh&#228;ngt. Dies k&#246;nnte wiederum darauf hinweisen, dass das kanonische Format eher m&#252;hevolle, auf deklarativem Wissen basierende Prozesse f&#246;rdert, w&#228;hrend Zeitdruck st&#228;rker automatisierte Prozesse beg&#252;nstigt, ohne dabei den Abruf notwendigen Wissens zu behindern &#8211; vorausgesetzt, dieses Wissen ist vorhanden und automatisiert.</p>
<p>Eine exemplarische Analyse der Lernendenantworten illustriert dies. F&#252;r die korrekte L&#246;sung der Makrol&#252;cke &#8222;a[<italic>uf</italic>]&#8220; im zeitreduzierten C-Test-Text 4 muss die Phrase &#8222;d___ Gehirn <bold>a___</bold> die akust___ Signale vorbe___&#8220; bis zum Verb &#8222;vorbereiten&#8220; rekonstruiert werden, welches die Pr&#228;position &#8222;auf&#8220; regiert. Auff&#228;llig ist jedoch, dass die H&#228;lfte der Teilnehmenden &#8222;an&#8220; einsetzte, obwohl f&#252;nf von diesen acht Personen &#8222;vorbereiten&#8220; korrekt rekonstruierten. In diesem Fall verhinderte eher fehlendes grammatikalisches Wissen die richtige L&#246;sung als die f&#252;r das Erfassen des notwendigen Kontexts mangelnde Zeit. Zudem k&#246;nnen Interdependenzen der L&#252;cken und fehlende oder falsche Antworten in den benachbarten L&#252;cken die L&#246;sung erschweren (vgl. <xref ref-type="bibr" rid="B5">Beinborn et al. 2014</xref>).</p>
<p>Unsere Ergebnisse st&#252;tzen auch die Beobachtung von Stemmer (<xref ref-type="bibr" rid="B34">1991</xref>), dass Verarbeitung des breiteren Kontexts vor allem als probleml&#246;sende Strategie eingesetzt wird. <italic>Backtracking</italic> (insbesondere mit l&#228;ngerem Verweilen) tritt auch bei schwierigen L&#252;cken auf, die eigentlich nur die Ber&#252;cksichtigung des Mikrokontexts erfordern &#8211; etwa wenn das gesuchte Wort vermutlich nicht direkt aus dem mentalen Lexikon abrufbar (z.B. Vielf[<italic>alt</italic>], tieri[<italic>scher</italic>]) oder das notwendige grammatikalische Wissen nicht prozeduralisiert bzw. nicht vorhanden war (wie im Beispiel oben mit &#8222;auf&#8220;).</p>
<p>Schlie&#223;lich verdeutlicht die Kategorie der &#8222;Verschlimmbesserungen&#8220; (korrekt gel&#246;ste L&#252;cken, die nachtr&#228;glich falsch korrigiert wurden), dass zus&#228;tzliche Bearbeitungszeit nicht automatisch zu besseren Ergebnissen f&#252;hrt. Im kanonischen Test traten sieben solcher F&#228;lle auf, im zeitreduzierten nur einer &#8211; auch wenn insgesamt im Durchschnitt mehr richtige Antworten ohne Zeitdruck produziert wurden.</p>
</sec>
<sec>
<title>6.2 Einschr&#228;nkungen und Ausblick</title>
<p>Unsere Studie analysierte das Bearbeitungsverhalten von 16 Proband*innen anhand von vier deutschsprachigen C-Test-Texten. Replikationen mit anderen Texten, mehr Teilnehmenden unterschiedlicher Kompetenz und in weiteren Sprachen w&#228;ren sinnvoll. Zudem k&#246;nnten weitere Datenanalysen erfolgen oder erg&#228;nzende Methoden wie retrospektive Interviews eingesetzt werden.</p>
<p>Weitere Beobachtungen und Daten w&#252;rden eine pr&#228;zisere Differenzierung in der L&#252;ckenklassifikation erm&#246;glichen. Besonders relevant w&#228;re eine separate Analyse von ausgef&#252;llten Makrol&#252;cken, welche die Ber&#252;cksichtigung des vorangehenden und nachfolgenden Kontexts erfordern, sowie die Einf&#252;hrung von Unterkategorien f&#252;r Mikro- und insbesondere f&#252;r Makrol&#252;cken (z.&#8239;B. auf Satzteil-, Satz- oder Textebene). Dar&#252;ber hinaus w&#228;re es sinnvoll, zwischen L&#252;cken zu unterscheiden, die gezielte Aufmerksamkeit auf sprachliche Form und deren Manipulation erfordern, und solchen, die es nicht tun.</p>
<p>Auch die Sprachkompetenz sollte in zuk&#252;nftigen Studien st&#228;rker ber&#252;cksichtigt werden. Unsere Annahmen beruhen auf der Vorstellung einer Testperson mit einer vollst&#228;ndig ausgebildeten Kompetenz in Deutsch als Fremdsprache, wie sie beispielsweise bei gebildeten Muttersprachler*innen vorhanden ist. Allerdings entsprach unsere Stichprobe &#8211; trotz der Selbsteinsch&#228;tzung auf B2-C1-Niveau &#8211; nur teilweise diesem Ma&#223;stab (vgl. WEIT-Ergebnisse in Kap. 4.1). Eine Analyse der C-Testbearbeitung durch gebildete Muttersprachler*innen k&#246;nnte als wertvolle Referenz dienen. Zudem w&#228;re ein Vergleich des Bearbeitungsverhaltens von sehr fortgeschrittenen Lernenden (C1-C2) und wenig kompetenten Lernenden (A2-B1) sinnvoll.</p>
<p>Weitere Analysen k&#246;nnten das Korrekturverhalten untersuchen, etwa wie oft und wann (direkte vs. nachtr&#228;gliche Revision) sowie was (Inhalt vs. Form) bevorzugt korrigiert wird, und welche L&#252;ckentypen dabei betroffen sind. Zudem ist zu kl&#228;ren, ob sich die Bearbeitung von bereits ausgef&#252;llten L&#252;cken und noch nicht ausgef&#252;llten L&#252;cken chronologisch unterscheidet. So k&#246;nnte es beispielsweise sein, dass nachtr&#228;gliche Korrekturen h&#228;ufiger im ersten Bearbeitungsdurchgang erfolgen, w&#228;hrend das Ausf&#252;llen leerer L&#252;cken eher nach Abschluss des ersten Durchgangs stattfindet, wenn mehr Kontext zur Verf&#252;gung steht.</p>
<p>Diese Analysen des Korrekturverhaltens sollten mit systematischen Antwortanalysen kombiniert werden, die zus&#228;tzlichen Aufschluss &#252;ber die eingesetzten und fehlenden Wissensbest&#228;nde geben k&#246;nnen. Dadurch lie&#223;e sich genauer untersuchen, welche Aspekte sprachlicher F&#228;higkeiten und Kenntnisse der C-Test im Allgemeinen und unter Zeitdruck erfasst.</p>
<p>Zuk&#252;nftige Studien sollten ein theoretisches Modell anstreben, das das Bearbeitungsverhalten systematisch mit den zugrunde liegenden Verarbeitungsprozessen und den dabei aktivierten linguistischen Wissensbest&#228;nden verkn&#252;pft und eine feinere Beschreibung der Verarbeitungsprozesse erm&#246;glicht, anstelle der bisherigen dichotomen Unterscheidung in automatisierte vs. nicht-automatisierte Bearbeitung. Dazu sind neben der Beobachtung des Bearbeitungsverhaltens auch introspektive Verfahren wie <italic>stimulated recall</italic> erforderlich. Der Einsatz solcher Verfahren w&#252;rde zudem erm&#246;glichen, den Einfluss personenspezifischer Merkmale wie Bearbeitungspr&#228;ferenzen auf die Verarbeitungsprozesse zu untersuchen.</p>
</sec>
<sec>
<title>6.3 Zusammenfassung</title>
<p>Die Studie belegt die prozessbezogene Validit&#228;t des C-Testformats, indem sie eine vorwiegend lineare Rekonstruktion der deutschen Texte durch eine kleine Stichprobe relativ fortgeschrittener Lernender als koh&#228;rente sprachliche Einheiten und nicht als Sprachr&#228;tsel nachweist. Abweichungen von der linearen Bearbeitung treten vor allem dann auf, wenn einzelne L&#252;cken nur unter Einbezug eines breiteren Kontexts geschlossen werden k&#246;nnen oder die lokale, serielle Wiederherstellung scheitert.</p>
<p>Je nach Zeitbedingung r&#252;cken bestimmte Verarbeitungsprozesse und Wissensbest&#228;nde unterschiedlich stark in den Vordergrund. Im kanonischen Format treten signifikant h&#228;ufiger nicht-lineare Bearbeitungen auf, was auf inferentielles, wissensgeleitetes Vorgehen verweist &#8211; besonders, aber nicht ausschlie&#223;lich bei Makrol&#252;cken. W&#228;hrend hier auch weniger automatisierte, deklarative Wissensbest&#228;nde st&#228;rker genutzt werden, sind diese unter Zeitdruck nur eingeschr&#228;nkt zug&#228;nglich, sodass automatisierte Prozesse und prozeduralisiertes Wissen eine gr&#246;&#223;ere Rolle &#252;bernehmen. Der zeitreduzierte und der kanonische C-Test erfassen damit ein stark &#252;berlappendes Kernkonstrukt, aktivieren jedoch automatisierte bzw. deklarative Verarbeitungsprozesse in unterschiedlichem Ausma&#223;. Die h&#246;heren Punktwerte im kanonischen C-Test erkl&#228;ren sich daher weniger durch den blo&#223;en Zeitvorteil, sondern durch den st&#228;rkeren Einbezug deklarativen Sprachwissens, das unter Zeitrestriktion nur begrenzt zug&#228;nglich ist. Dies st&#252;tzt den Befund von Timukova et al. (im Druck), dass zeitlimitierte C-Tests einen etwas gr&#246;&#223;eren Anteil automatisierter Sprachf&#228;higkeiten im Konstrukt abbilden als das kanonische Format.</p>
<p>Diese Erkenntnisse haben auch praktische Implikationen. Der Einsatz zeitreduzierter C-Tests zur Einstufung und in der Forschung kann nicht nur Zeit sparen, sondern auch Ergebnisse liefern, die das automatisierte und prozeduralisierte Sprachwissen der Teilnehmenden besser abbilden und damit genauere Aussagen &#252;ber deren abrufbereite Sprachkompetenz erm&#246;glichen.</p>
</sec>
</sec>
</body>
<back>
<fn-group>
<fn id="n1"><p>Diese Unterscheidung basiert auf dem <italic>Declarative/Procedural Model</italic> (<xref ref-type="bibr" rid="B36">Ullman 2020</xref>; <xref ref-type="bibr" rid="B31">Morgan-Short/Ullman 2022</xref>), das zwei miteinander interagierende Ged&#228;chtnissysteme beschreibt: Das deklarative Ged&#228;chtnis speichert bewusst zug&#228;ngliches Wissen wie Wortbedeutungen, unregelm&#228;&#223;ige Formen, <italic>chunks</italic> und gelernte Regeln. Das prozedurale Ged&#228;chtnis umfasst unbewusstes, automatisiertes Wissen und ist zentral f&#252;r die Verarbeitung regelhafter sprachlicher Strukturen und vorhersagbarer Elemente und Sequenzen wie Morphologie und Syntax.</p></fn>
<fn id="n2"><p>Im <italic>Oral Elicited Imitation Test</italic> (OEIT) h&#246;ren die Teilnehmenden gesprochene S&#228;tze in der Zielsprache und wiederholen sie nach einer kurzen Pause; die Antworten werden aufgezeichnet und von Rater*innen bewertet. Urspr&#252;nglich zur Messung allgemeiner Sprachkompetenz entwickelt, wird der OEIT inzwischen auch zur Einsch&#228;tzung globaler m&#252;ndlicher Sprachkompetenz in der L2 eingesetzt (z.B. <xref ref-type="bibr" rid="B7">Drackert 2016</xref>).</p></fn>
<fn id="n3"><p>Der Verzicht auf introspektive Verfahren schr&#228;nkt unseren Untersuchungsgegenstand insofern ein, als komplexe Testl&#246;sungsverhaltensweisen wie Strategien und die emotionale Komponente der <italic>response processes</italic> nicht ber&#252;cksichtigt werden.</p></fn>
<fn id="n4"><p><italic>Language-in-use tasks</italic> sind Aufgabenformate, die sprachliche Kompetenz nicht isoliert, sondern im funktionalen Gebrauchskontext pr&#252;fen &#8211; etwa durch das Verkn&#252;pfen, Erg&#228;nzen oder Interpretieren sprachlicher Einheiten im Kontext. Sie erfordern typischerweise ein Zusammenspiel von grammatischem, lexikalischem, pragmatischem und strategischem Wissen (vgl. <xref ref-type="bibr" rid="B11">Ellis 2003</xref>; <xref ref-type="bibr" rid="B28">McCray/Brunfaut 2018</xref>).</p></fn>
<fn id="n5"><p>Das Instrument f&#252;r Englisch, Deutsch und Russisch wurde im Rahmen des DFG-Projekts (<xref ref-type="bibr" rid="B9">Drackert n.d.</xref>) entwickelt, pilotiert und eingesetzt (f&#252;r Deutsch siehe <xref ref-type="bibr" rid="B6">Chifligarov/La&#226;guidi/Schellenberg/Dill/Timukova/Drackert/Laarmann-Quante 2025</xref>).</p></fn>
<fn id="n6"><p><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="https://www.onset.de/">https://www.onset.de/</ext-link> (25.10.2022)</p></fn>
<fn id="n7"><p>Die Zeitlimits wurden durch einen Pretest mit Muttersprachler*innen (<italic>N</italic> = 16) ermittelt, die gebeten wurden, die C-Test-Texte m&#246;glichst schnell und genau zu bearbeiten. Die durchschnittlichen Bearbeitungszeiten der Teilnehmenden, die mindestens 90 % der Aufgaben korrekt l&#246;sten, wurden berechnet und f&#252;r L2-Lernende um 20 % erh&#246;ht. Diese Zeiten (1:40 bis 2:50 Minuten) wurden in der Pilotstudie verwendet und basierend auf den Durchschnittswerten der L2-Pilotteilnehmer*innen (<italic>N</italic> = 21) weiter angepasst.</p></fn>
<fn id="n8"><p>So kann beispielsweise die Konjunktion &#8222;oder&#8220;, die zwei Substantive verbindet, mit sehr hoher Wahrscheinlichkeit lokal rekonstruiert werden. Sie kann jedoch auch in einem Satz wie &#8222;Ob im Konzertsaal od[er] im Kaufhaus, Musik begleitet uns t&#228;glich&#8220; vorkommen, in dem eines der Substantive von einer Pr&#228;position begleitet wird und daher nicht unmittelbar an die L&#252;cke grenzt, sondern das <bold>zweite</bold> Wort rechts davon ist.</p></fn>
<fn id="n9"><p>Die Antworten der Lernenden konnten dem gro&#223;en Datensatz (<italic>N</italic>=188) des Gesamtprojekts entnommen werden (vgl. Timukova et al. im Druck).</p></fn>
<fn id="n10"><p>Schwierigkeitsindex gibt die L&#246;sungsrate an, hier in einen Prozentwert umgerechnet.</p></fn>
<fn id="n11"><p>Eine Beispielaufnahme ist auf der Projektseite verf&#252;gbar (<xref ref-type="bibr" rid="B9">Drackert n.d.</xref>). Die Grenze zwischen &#8222;schneller&#8220; und &#8222;langsamer&#8220; Bearbeitung wurde empirisch anhand der Verteilung der Bearbeitungszeiten bestimmt: Werte oberhalb des 75. Perzentils wurden als &#8222;langsam&#8220; klassifiziert &#8211; ein Vorgehen, das in der empirischen Forschung bei fehlenden theoretisch fundierten Schwellenwerten h&#228;ufig Anwendung findet (vgl. <xref ref-type="bibr" rid="B27">MacCallum et al. 2002: 19</xref>).</p></fn>
<fn id="n12"><p>Die Grenze zwischen &#8222;schneller&#8220; und &#8222;langsamer&#8220; Bearbeitung wurde empirisch anhand der Verteilung der Bearbeitungszeiten bestimmt: Werte oberhalb des 75. Perzentils wurden als &#8222;langsam&#8220; klassifiziert &#8211; ein Vorgehen, das in der empirischen Forschung bei fehlenden theoretisch fundierten Schwellenwerten h&#228;ufig Anwendung findet (vgl. <xref ref-type="bibr" rid="B27">MacCallum et al. 2002: 19</xref>).</p></fn>
<fn id="n13"><p>Dabei ist zu ber&#252;cksichtigen, dass nicht alle Makrol&#252;cken r&#252;ckl&#228;ufige Bearbeitung erfordern. Nach unserer Klassifikation ben&#246;tigt etwa die H&#228;lfte dieser L&#252;cken den nachfolgenden Kontext zur L&#246;sung, w&#228;hrend die andere H&#228;lfte aus dem vorangehenden Textteil erschlie&#223;bar ist und vermutlich auch linear &#8211; gegebenenfalls mit Verz&#246;gerung &#8211; gel&#246;st werden kann.</p></fn>
</fn-group>
<ref-list>
<title>Literatur</title>
<ref id="B1"><mixed-citation publication-type="book"><collab>American Educational Research Association, American Psychological Association, &amp; easurement in Education.</collab> (<year>2014</year>): <source>Standards for educational and psychological testing</source>. <publisher-name>American Educational Research Association</publisher-name>.</mixed-citation></ref>
<ref id="B2"><mixed-citation publication-type="journal"><string-name><surname>Aguado</surname>, <given-names>Karin</given-names></string-name>; <string-name><surname>Grotjahn</surname>, <given-names>R&#252;diger</given-names></string-name> &amp; <string-name><surname>Schlak</surname>, <given-names>Torsten</given-names></string-name> (<year>2005</year>): <article-title>Erwerbsalter und Sprachlernerfolg. Theoretische und methodologische Grundlagen eines empirischen Forschungsprojekts</article-title>. <source>Zeitschrift f&#252;r Fremdsprachenforschung</source> <volume>16</volume>: <issue>2</issue>, <fpage>275</fpage>&#8211;<lpage>293</lpage>.</mixed-citation></ref>
<ref id="B3"><mixed-citation publication-type="journal"><string-name><surname>Babaii</surname>, <given-names>Esmat</given-names></string-name> &amp; <string-name><surname>Ansary</surname>, <given-names>Hasan</given-names></string-name> (<year>2001</year>): <article-title>The C-test: A valid operationalization of reduced redundancy principle?</article-title> <source>System</source> <volume>29</volume>: <issue>2</issue>, <fpage>209</fpage>&#8211;<lpage>219</lpage>.</mixed-citation></ref>
<ref id="B4"><mixed-citation publication-type="book"><string-name><surname>Babaii</surname>, <given-names>Esmat</given-names></string-name> &amp; <string-name><surname>Fatahi-Majd</surname>, <given-names>Mosayeb</given-names></string-name> (<year>2014</year>): Failed restorations in the C-test: Types, sources, and implications for C-test processing. In: <string-name><surname>Grotjahn</surname>, <given-names>R&#252;diger</given-names></string-name> (Hrsg.): <source>Der C-Test: Aktuelle Tendenzen/The C-Test: Current trends</source>. <publisher-loc>Frankfurt am Main</publisher-loc>: <publisher-name>Lang</publisher-name>, <fpage>263</fpage>&#8211;<lpage>276</lpage>.</mixed-citation></ref>
<ref id="B5"><mixed-citation publication-type="webpage"><string-name><surname>Beinborn</surname>, <given-names>Lisa</given-names></string-name>; <string-name><surname>Zesch</surname>, <given-names>Torsten</given-names></string-name> &amp; <string-name><surname>Gurevych</surname>, <given-names>Iryna</given-names></string-name> (<year>2014</year>): <article-title>Predicting the difficulty of language proficiency tests</article-title>. <source>Transactions of the Association for Computational Linguistics</source> <volume>2</volume>, <fpage>517</fpage>&#8211;<lpage>529</lpage>. <uri>https://tacl2013.cs.columbia.edu/ojs/index.php/tacl/article/view/414/88</uri></mixed-citation></ref>
<ref id="B6"><mixed-citation publication-type="book"><string-name><surname>Chifligarov</surname>, <given-names>Mihail</given-names></string-name>; <string-name><surname>La&#226;guidi</surname>, <given-names>Jammila</given-names></string-name>; <string-name><surname>Schellenberg</surname>, <given-names>Max</given-names></string-name>; <string-name><surname>Dill</surname>, <given-names>Alexander</given-names></string-name>; <string-name><surname>Timukova</surname>, <given-names>Anna</given-names></string-name>; <string-name><surname>Drackert</surname>, <given-names>Anastasia</given-names></string-name> &amp; <string-name><surname>Laarmann-Quante</surname>, <given-names>Ronja</given-names></string-name> (<year>2025</year>): <chapter-title>Automated Scoring of a German Written Elicited Imitation Test</chapter-title>. In: <source>Proceedings of the 20th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2025</source>), <fpage>237</fpage>&#8211;<lpage>247</lpage>, <publisher-loc>Vienna, Austria</publisher-loc>. <publisher-name>Association for Computational Linguistics</publisher-name>.</mixed-citation></ref>
<ref id="B7"><mixed-citation publication-type="book"><string-name><surname>Drackert</surname>, <given-names>Anastasia</given-names></string-name> (<year>2016</year>): <source>Validating language proficiency assessments in second language acquisition research</source>. <publisher-name>Peter Lang Verlag</publisher-name>.</mixed-citation></ref>
<ref id="B8"><mixed-citation publication-type="journal"><string-name><surname>Drackert</surname>, <given-names>Anastasia</given-names></string-name> &amp; <string-name><surname>Timukova</surname>, <given-names>Anna</given-names></string-name> (<year>2020</year>): <article-title>What does the analysis of C-test gaps tell us about the construct of a C-test? A comparison of foreign and heritage language learners&#8217; performance</article-title>. <source>Language Testing</source> <volume>37</volume>: <issue>1</issue>, <fpage>107</fpage>&#8211;<lpage>132</lpage>. <pub-id pub-id-type="doi">10.1177/0265532219861042</pub-id></mixed-citation></ref>
<ref id="B9"><mixed-citation publication-type="webpage"><string-name><surname>Drackert</surname>, <given-names>Anastasia</given-names></string-name> (n.d.): <source>Time to fill the gaps: A mixed-methods study into the role of the time variable in the construct of computerized C-Tests in three languages</source>. [DFG project 462766474, 2022 - 2025]. Gesellschaft f&#252;r Akademische Studienvorbereitung und Testentwicklung (g.a.s.t.). <uri>https://www.gast.de/de/forschung-entwicklung/forschung/forschungsprojekte/c-test-zeitfaktor/english-version</uri></mixed-citation></ref>
<ref id="B10"><mixed-citation publication-type="journal"><string-name><surname>Eckes</surname>, <given-names>Thomas</given-names></string-name> &amp; <string-name><surname>Grotjahn</surname>, <given-names>R&#252;diger</given-names></string-name> (<year>2006</year>): <article-title>A closer look at the construct validity of C-tests</article-title>. <source>Language Testing</source> <volume>23</volume>: <issue>3</issue>, <fpage>290</fpage>&#8211;<lpage>325</lpage>.</mixed-citation></ref>
<ref id="B11"><mixed-citation publication-type="book"><string-name><surname>Ellis</surname>, <given-names>Rod</given-names></string-name> (<year>2003</year>): <source>Task-Based Language Learning and Teaching</source>. <publisher-name>Oxford University Press</publisher-name>.</mixed-citation></ref>
<ref id="B12"><mixed-citation publication-type="journal"><string-name><surname>Embretson</surname>, <given-names>Susan. E.</given-names></string-name> (Whitely) (<year>1983</year>): <article-title>Construct validity: Construct representation versus nomothetic span</article-title>. <source>Psychological Bulletin</source> <volume>93</volume>: <issue>1</issue>, <fpage>179</fpage>&#8211;<lpage>197</lpage>. <pub-id pub-id-type="doi">10.1037/0033-2909.93.1.179</pub-id></mixed-citation></ref>
<ref id="B13"><mixed-citation publication-type="book"><collab>Europarat</collab> (<year>2020</year>): <source>Gemeinsamer europ&#228;ischer Referenzrahmen f&#252;r Sprachen: Lernen, lehren, beurteilen. Begleitband mit neuen Deskriptoren</source>. <publisher-name>Council of Europe Publishing</publisher-name>.</mixed-citation></ref>
<ref id="B14"><mixed-citation publication-type="book"><string-name><surname>Germann</surname>, <given-names>Ulrich</given-names></string-name> &amp; <string-name><surname>Grotjahn</surname>, <given-names>R&#252;diger</given-names></string-name> (<year>1994</year>): <chapter-title>Das L&#246;sen von C-Tests auf dem Computer: Eine Pilotuntersuchung zu den Bearbeitungsprozessen</chapter-title>. In: <string-name><surname>Grotjahn</surname>, <given-names>R&#252;diger</given-names></string-name> (Hrsg.): <source>Der C-Test. Theoretische Grundlagen und praktische Anwendungen</source> Bd. 2. <publisher-loc>Bochum</publisher-loc>: <publisher-name>Brockmeyer</publisher-name>, <fpage>279</fpage>&#8211;<lpage>304</lpage>.</mixed-citation></ref>
<ref id="B15"><mixed-citation publication-type="book"><string-name><surname>Grabe</surname>, <given-names>William</given-names></string-name> &amp; <string-name><surname>Yamashita</surname>, <given-names>Junko</given-names></string-name> (<year>2022</year>): <source>Reading in a Second Language: Moving from Theory to Practice</source>. [2. Aufl.]. <publisher-loc>Cambridge</publisher-loc>: <publisher-name>Cambridge University Press</publisher-name>. (Cambridge Applied Linguistics)</mixed-citation></ref>
<ref id="B16"><mixed-citation publication-type="book"><string-name><surname>Grotjahn</surname>, <given-names>R&#252;diger</given-names></string-name> (<year>2010</year>): <chapter-title>Gesamtdarbietung, Einzeltextdarbietung, Zeitbegrenzung und Zeitdruck: Auswirkungen auf Item- und Testkennwerte und C-Test-Konstrukt</chapter-title>. In: <string-name><surname>Grotjahn</surname>, <given-names>R&#252;diger</given-names></string-name> (Hrsg.): <source>Der C-Test: Beitr&#228;ge aus der aktuellen Forschung/The C-Test: Contributions from current research</source>. <publisher-loc>Frankfurt am Main</publisher-loc>: <publisher-name>Lang</publisher-name>, <fpage>265</fpage>&#8211;<lpage>296</lpage>.</mixed-citation></ref>
<ref id="B17"><mixed-citation publication-type="book"><string-name><surname>Grotjahn</surname>, <given-names>R&#252;diger</given-names></string-name> &amp; <string-name><surname>Schiller</surname>, <given-names>Cordula S</given-names></string-name>. (<year>2014</year>): <chapter-title>Zur Rolle des Makrokontexts bei der Bearbeitung spanischer C-Test-Texte: Fehleranalysen ausgew&#228;hlter L&#252;ckenw&#246;rter</chapter-title>. In: <string-name><surname>Grotjahn</surname>, <given-names>R&#252;diger</given-names></string-name> (Hrsg.): <source>Der C-Test: Aktuelle Tendenzen/The C-Test: Current trends</source>. <publisher-loc>Frankfurt am Main</publisher-loc>: <publisher-name>Lang</publisher-name>, <fpage>277</fpage>&#8211;<lpage>289</lpage>.</mixed-citation></ref>
<ref id="B18"><mixed-citation publication-type="webpage"><string-name><surname>Grotjahn</surname>, <given-names>R&#252;diger</given-names></string-name> &amp; <string-name><surname>Drackert</surname>, <given-names>Anastasia</given-names></string-name> (<year>2022</year>): <source>The electronic C-Test bibliography: version October 2022</source>. <uri>http://www.c-test.de</uri> &amp; <uri>https://www.gast.de/de/forschung-entwicklung/publikationen/veroeffentlichungen-von-gast</uri> (<day>19</day>.<month>10</month>.2024)</mixed-citation></ref>
<ref id="B19"><mixed-citation publication-type="journal"><string-name><surname>Harsch</surname>, <given-names>Claudia</given-names></string-name> &amp; Schr&#246;der, Konrad (<year>2007</year>): <article-title>Textrekonstruktion: C-Test</article-title>. In: <string-name><surname>Beck</surname>, <given-names>B&#228;rbel</given-names></string-name> &amp; <string-name><surname>Klieme</surname>, <given-names>Eckhard</given-names></string-name> (Hrsg.): <source>Sprachliche Kompetenzen: Konzepte und Messung. DESI-Studie (Deutsch Englisch Sch&#252;lerleistungen International</source>). Weinheim u.a.: Beltz, <fpage>212</fpage>&#8211;<lpage>225</lpage>. <pub-id pub-id-type="doi">10.25656/01:3140</pub-id></mixed-citation></ref>
<ref id="B20"><mixed-citation publication-type="journal"><string-name><surname>Hastings</surname>, <given-names>Ashley J</given-names></string-name>. (<year>2002</year>): <article-title>Error analysis of an English C-Test: Evidence for integrated processing</article-title>. In: <string-name><surname>Grotjahn</surname>, <given-names>R&#252;diger</given-names></string-name> (Hrsg): <source>Der C-Test. Theoretische Grundlagen und praktische Anwendungen</source> 4. Bochum: AKS-Verlag, <fpage>53</fpage>&#8211;<lpage>66</lpage>.</mixed-citation></ref>
<ref id="B21"><mixed-citation publication-type="webpage"><string-name><surname>Hubley</surname>, <given-names>Anita M.</given-names></string-name> &amp; <string-name><surname>Zumbo</surname>, <given-names>Bruno D</given-names></string-name>. (<year>2017</year>): <article-title>Response Processes in the Context of Validity: Setting the Stage</article-title>. In: <string-name><surname>Zumbo</surname>, <given-names>Bruno D.</given-names></string-name> &amp; <string-name><surname>Hubley</surname>, <given-names>Anita M.</given-names></string-name> (Hrsg.): <source>Understanding and Investigating Response Processes in Validation Research</source>. <fpage>1</fpage>&#8211;<lpage>12</lpage>. <uri>https://link.springer.com/chapter/10.1007/978-3-319-56129-5_1</uri></mixed-citation></ref>
<ref id="B22"><mixed-citation publication-type="book"><string-name><surname>Jang</surname>, <given-names>Eunice</given-names></string-name> (<year>2017</year>): <chapter-title>Cognitive Aspects of Language Assessment</chapter-title>. In: <string-name><surname>Shohamy</surname>, <given-names>Elana</given-names></string-name>; <string-name><surname>Or</surname>, <given-names>Iair</given-names></string-name> &amp; <string-name><surname>May</surname>, <given-names>Stephen</given-names></string-name> (Hrsg.): <source>Language Testing and Assessment</source>. <publisher-loc>Cham</publisher-loc>: <publisher-name>Springer</publisher-name>, <fpage>163</fpage>-<lpage>179</lpage>. <pub-id pub-id-type="doi">10.1007/978-3-319-02326-7_11-1</pub-id></mixed-citation></ref>
<ref id="B23"><mixed-citation publication-type="journal"><string-name><surname>Kane</surname>, <given-names>Michael T</given-names></string-name>. (<year>2016</year>): Explicating validity. <source>Assessment in Education: Principles, Policy, &amp; Practice</source> <volume>23</volume>: <issue>2</issue>, <fpage>198</fpage>&#8211;<lpage>211</lpage>. <pub-id pub-id-type="doi">10.1080/0969594X.2015.1060192</pub-id></mixed-citation></ref>
<ref id="B24"><mixed-citation publication-type="webpage"><string-name><surname>Kaufmann</surname>, <given-names>Nicole</given-names></string-name> (<year>2016</year>): <article-title>Die Vorhersage der Schwierigkeit deutscher C-Test-Texte: Untersuchungen am Beispiel des onDaF</article-title>. <source>Zeitschrift f&#252;r Interkulturellen Fremdsprachenunterricht</source> <volume>21</volume>: <issue>2</issue>, <fpage>111</fpage>&#8211;<lpage>126</lpage>. <uri>http://tujournals.ulb.tu-darmstadt.de/index.php/zif/</uri> (<day>25</day>.<month>03</month>.2025).</mixed-citation></ref>
<ref id="B25"><mixed-citation publication-type="book"><string-name><surname>Khalifa</surname>, <given-names>Hanan</given-names></string-name> &amp; <string-name><surname>Weir</surname>, <given-names>Cyril J</given-names></string-name>. (<year>2009</year>): <source>Examining Reading: Research and Practice in Assessing Second Language Reading</source> (Studies in Language Testing 29). <publisher-loc>Cambridge</publisher-loc>: <publisher-name>Cambridge University Press</publisher-name>.</mixed-citation></ref>
<ref id="B26"><mixed-citation publication-type="thesis"><string-name><surname>Klein-Braley</surname>, <given-names>Christine</given-names></string-name> (<year>1994</year>): <source>Language testing with the C-Test. A linguistic and statistical investigation into the strategies used by C-Test takers, and the prediction of C-Test difficulty</source>. Habilitationsschrift, <publisher-name>Universit&#228;t-Gesamthochschule Duisburg</publisher-name>.</mixed-citation></ref>
<ref id="B27"><mixed-citation publication-type="journal"><string-name><surname>MacCallum</surname>, <given-names>Robert C.</given-names></string-name>; <string-name><surname>Zhang</surname>, <given-names>Shaobo</given-names></string-name>; <string-name><surname>Preacher</surname>, <given-names>Kristopher J.</given-names></string-name> &amp; <string-name><surname>Rucker</surname>, <given-names>Derek D</given-names></string-name>. (<year>2002</year>): <article-title>On the practice of dichotomization of quantitative variables</article-title>. <source>Psychological Methods, 7</source>(1), <fpage>19</fpage>&#8211;<lpage>40</lpage>. <pub-id pub-id-type="doi">10.1037/1082-989X.7.1.19</pub-id></mixed-citation></ref>
<ref id="B28"><mixed-citation publication-type="journal"><string-name><surname>McCray</surname>, <given-names>Gareth</given-names></string-name> &amp; <string-name><surname>Brunfaut</surname>, <given-names>Tineke</given-names></string-name> (<year>2018</year>): <article-title>Investigating the construct measured by banked gap-fill items: Evidence from eye-tracking</article-title>. <source>Language Testing</source> <volume>35</volume>: <issue>1</issue>, <fpage>51</fpage>&#8211;<lpage>73</lpage>. <pub-id pub-id-type="doi">10.1177/0265532216677105</pub-id></mixed-citation></ref>
<ref id="B29"><mixed-citation publication-type="journal"><string-name><surname>McKay</surname>, <given-names>Todd</given-names></string-name>; <string-name><surname>Teimouri</surname>, <given-names>Yasser</given-names></string-name>; <string-name><surname>Sa&#287;di&#231;</surname>, <given-names>Ay&#351;enur</given-names></string-name>; <string-name><surname>Salen</surname>, <given-names>Bradford</given-names></string-name>; <string-name><surname>Reagan</surname>, <given-names>Derek</given-names></string-name> &amp; <string-name><surname>Malone</surname>, <given-names>Margaret E</given-names></string-name>. (<year>2021</year>): <article-title>The cagey C-test construct: Some evidence from a meta-analysis of correlation coefficients</article-title>. <source>System</source> <volume>99</volume>. <pub-id pub-id-type="doi">10.1016/j.system.2021.102526</pub-id></mixed-citation></ref>
<ref id="B30"><mixed-citation publication-type="book"><string-name><surname>Messick</surname>, <given-names>Samuel</given-names></string-name> (<year>1989</year>): <chapter-title>Validity</chapter-title>. In: <string-name><surname>Linn</surname>, <given-names>Robert L.</given-names></string-name> (Hrsg.): <source>Educational measurement</source>. [3. Aufl.]. <publisher-loc>New York</publisher-loc>: <publisher-name>American Council on Education and Macmillan</publisher-name>, <fpage>13</fpage>&#8211;<lpage>103</lpage>.</mixed-citation></ref>
<ref id="B31"><mixed-citation publication-type="book"><string-name><surname>Morgan-Short</surname>, <given-names>Kara</given-names></string-name> &amp; <string-name><surname>Ullman</surname>, <given-names>Michael T</given-names></string-name>. (<year>2022</year>): <chapter-title>Declarative and Procedural Memory in Second Language Learning. Psycholinguistic considerations</chapter-title>. In: <string-name><surname>Godfroid</surname>, <given-names>Aline</given-names></string-name> &amp; <string-name><surname>Hopp</surname>, <given-names>Holger</given-names></string-name> (Hrsg.): <source>The Routledge Handbook of Second Language Acquisition and Psycholinguistics</source>. <publisher-loc>New York</publisher-loc>: <publisher-name>Routledge</publisher-name>, <fpage>322</fpage>-<lpage>334</lpage>. <pub-id pub-id-type="doi">10.4324/9781003018872-30</pub-id></mixed-citation></ref>
<ref id="B32"><mixed-citation publication-type="webpage"><string-name><surname>Raatz</surname>, <given-names>Ulrich</given-names></string-name> (<year>2002</year>): <article-title>C-Tests and intelligence</article-title>. In: <string-name><surname>Coleman</surname>, <given-names>James A</given-names></string-name>; <string-name><surname>Grotjahn</surname>, <given-names>R&#252;diger</given-names></string-name> &amp; <string-name><surname>Raatz</surname>, <given-names>Ulrich</given-names></string-name> (Hrsg.): <source>University language testing and the C-test</source>. Bochum: AKS-Verlag, <fpage>169</fpage>&#8211;<lpage>185</lpage>. <uri>http://www.c-test.de/deutsch/index.php?lang=de&amp;section=originalia</uri></mixed-citation></ref>
<ref id="B33"><mixed-citation publication-type="thesis"><string-name><surname>Sigott</surname>, <given-names>G&#252;nther</given-names></string-name> (<year>2004</year>): <source>Towards identifying the C-Test construct</source>. Habilitationsschrift, <publisher-loc>Frankfurt am Main</publisher-loc>: <publisher-name>Lang</publisher-name>.</mixed-citation></ref>
<ref id="B34"><mixed-citation publication-type="book"><string-name><surname>Stemmer</surname>, <given-names>Brigitte</given-names></string-name> (<year>1991</year>): <source>What&#8217;s on a C-test taker&#8217;s mind: Mental processes in C-test taking</source>. <publisher-loc>Bochum</publisher-loc>: <publisher-name>Brockmeyer</publisher-name>.</mixed-citation></ref>
<ref id="B35"><mixed-citation publication-type="journal"><string-name><surname>Timukova</surname>, <given-names>Anna</given-names></string-name>; <string-name><surname>M&#246;ller</surname>, <given-names>Franziska</given-names></string-name> &amp; <string-name><surname>Drackert</surname>, <given-names>Anastasia</given-names></string-name> (im Druck): <article-title>Different, or simply more difficult? The role of reduced time in the construct of computerised C-Tests in English and German</article-title>. <source>Studies in Language Assessment</source>.</mixed-citation></ref>
<ref id="B36"><mixed-citation publication-type="book"><string-name><surname>Ullman</surname>, <given-names>Michael T</given-names></string-name>. (<year>2020</year>): <chapter-title>The Declarative/Procedural Model: A Neurobiologically-Motivated Theory of First and Second Language</chapter-title>. In: <string-name><surname>VanPatten</surname>, <given-names>Bill</given-names></string-name>; <string-name><surname>Keating</surname>, <given-names>Gregory D.</given-names></string-name> &amp; <string-name><surname>Wulff</surname>, <given-names>Stefanie</given-names></string-name> (Hrsg.): <source>Theories in Second Language Acquisition</source>. [3. Aufl.]. <publisher-loc>New York</publisher-loc>: <publisher-name>Routledge</publisher-name>, <fpage>128</fpage>&#8211;<lpage>161</lpage>.</mixed-citation></ref>
<ref id="B37"><mixed-citation publication-type="webpage"><collab>Wondershare</collab>. (n.d.): <source>DemoAir</source> [Computer software]. <publisher-name>Wondershare Technology Group Co., Ltd</publisher-name>. <uri>https://demoair.wondershare.com/</uri></mixed-citation></ref>
<ref id="B38"><mixed-citation publication-type="thesis"><string-name><surname>Wockenfu&#223;</surname>, <given-names>Verena</given-names></string-name> (<year>2008</year>): <source>Diagnostik von Sprache und Intelligenz bei Jugendlichen und jungen Erwachsenen: Eine empirische Untersuchung</source>. Dissertation, <publisher-name>Universit&#228;t Duisburg-Essen</publisher-name>.</mixed-citation></ref>
<ref id="B39"><mixed-citation publication-type="book"><string-name><surname>Zimmermann</surname>, <given-names>Kerstin</given-names></string-name> (<year>2019</year>): <source>Keine Zeit f&#252;r den C-Test? Eine empirische Untersuchung zum Einfluss einer Geschwindigkeitskomponente auf das Konstrukt des C-Tests</source>. <publisher-loc>Berlin</publisher-loc>: <publisher-name>Universit&#228;tsverlag der TU Berlin</publisher-name>. <pub-id pub-id-type="doi">10.14279/depositonce-8288</pub-id>.</mixed-citation></ref>
</ref-list>
<sec>
<title>Kurzbio</title>
<p><bold>Anna Timukova</bold> ist wissenschaftliche Mitarbeiterin am Sprachenzentrum der Ruhr-Universit&#228;t Bochum und verantwortet dort die Qualit&#228;tssicherung verschiedener Testverfahren &#8211; von Einstufungstests bis zu Kursabschlusspr&#252;fungen. Ihre Forschungsinteressen umfassen die Konstruktvalidierung und kognitive Validit&#228;t von Testverfahren, mit einem Schwerpunkt auf C-Tests. Dar&#252;ber hinaus befasst sie sich mit dem Testen bildungs- und akademischer Sprachkompetenzen, mit Ans&#228;tzen des <italic>Elicited-Imitation</italic>-Testens sowie mit der automatisierten Auswertung von Testaufgaben.</p>
<p><bold>Oleksandra Yazdanfar</bold> ist MA-Studentin der Sprachverarbeitung an der Ruhr-Universit&#228;t Bochum. Im Rahmen ihres Studiums untersuchte sie die Organisation des lexikalischen Wissens bei bilingualen Personen sowie den Zusammenhang zwischen dem <italic>Written Elicited Imitation Test</italic> und Ged&#228;chtnisprozessen. In ihrer Bachelorarbeit besch&#228;ftigte sie sich mit NLP-Ans&#228;tzen zur Klassifikation des Informationsstatus im Deutschen.</p>
<p><bold>Anastasia Drackert</bold> ist wissenschaftliche Direktorin bei der Gesellschaft f&#252;r Akademische Studienvorbereitung und Testentwicklung (g.a.s.t. e.V.) und verantwortet dort die Forschung sowie die Weiterentwicklung der Testverfahren und Lernangebote. Gleichzeitig ist sie Professorin f&#252;r Sprachtesten und Digitales Lernen an der Ruhr-Universit&#228;t Bochum. In zahlreichen empirischen Studien untersuchte sie unter anderem den Einsatz von KI beim Testen und Lernen von Fremdsprachen, die Leistungsbeurteilungskompetenz (<italic>Assessment Literacy</italic>) von Fremdsprachenlehrkr&#228;ften, den Einsatz von Selbstevaluation im Fremdsprachenunterricht sowie das Konstrukt des C-Tests.</p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2"><bold>Anschrift:</bold></styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">Anna Timukova</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">Sprachenzentrum der Ruhr-Universit&#228;t Bochum</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">Universit&#228;tsstra&#223;e 150</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">D-44801 Bochum</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2"><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="mailto:anna.timukova@rub.de">anna.timukova@rub.de</ext-link></styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">Oleksandra Yazdanfar</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">Ruhr-Universit&#228;t Bochum</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">Universit&#228;tsstra&#223;e 150</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">D-44801 Bochum</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2"><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="mailto:oleksandra.yazdanfar@rub.de">oleksandra.yazdanfar@rub.de</ext-link></styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">Anastasia Drackert</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">Gesellschaft f&#252;r Akademische Studienvorbereitung und Entwicklung (g.a.s.t.)</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">Universit&#228;tsstra&#223;e 134</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">D- 44799 Bochum</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2"><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="mailto:drackert@gast.de">drackert@gast.de</ext-link></styled-content></p>
</sec>
</back>
</article>