Leistungen von Funktionsverbgefügen im Text

Tekst
Loe katkendit
Märgi loetuks
Kuidas lugeda raamatut pärast ostmist
Šrift:Väiksem АаSuurem Aa

Aufgrund der statistischen Signifikanz der generierten Gefüge, ihrer Häufigkeit in DeReKo (2018-I) sowie ihrer alltagsweltlichen Relevanz entscheide ich mich für die Untersuchung von Leistungen von Funktionsverbgefügen im Textzusammenhang für die Funktionsverbgefüge Frage stellen, Antwort geben und Entscheidung treffen sowie für die polnischen Äquivalente zada(wa)ć pytanie, da(wa)ć odpowiedź und podjąć/podejmować decyzję.

In einem korpusbasierten Verfahren zur Generierung von weniger festen und lexikalisierten Funktionsverbgefügen mithilfe einer mit COSMAS II durchgeführten Kookkurrenzanalyse von dreizehn Funktionsverben wurden statistisch signifikante deutsche Funktionsverbgefüge ermittelt und polnischen Äquivalenten zugeordnet. Der Untersuchungsgegenstand der vorliegenden Arbeit konnte auf diese Weise eingegrenzt und aus einer Vielzahl möglicher Konstruktionen konnten deutsche und polnische Gefüge ausgewählt werden. Die ausgewählten Gefüge Frage stellen, Antwort geben und Entscheidung treffen bezeichnen alltagsweltliche mentale und/oder verbale Prozesse, die von verschiedenen (sprach-)wissenschaftlichen (Teil-)Disziplinen erforscht werden. Aufgrund ihrer semantischen und pragmatisch-interaktionalen Verbindung zueinander sind diese Gefüge für die Untersuchung von Funktionsverbgefügen im Textzusammenhang geeignet. Im nächsten Abschnitt wird für die vorliegende Studie eine geeignete Datengrundlage in Form von deutschen und polnischen Text-Korpora ausgewählt.

2.2. Wahl der Korpora

Den Untersuchungsstand der vorliegenden Arbeit bilden die Funktionsverbgefüge Frage stellen, Antwort geben und Entscheidung treffen sowie ihre polnischen Äquivalente zada(wa)ć pytanie, da(wa)ć odpowiedź und podjąć/podejmować decyzję. Für die Beantwortung der Forschungsfragen zu Funktionen von deutschen und polnischen Funktionsverbgefügen im Textzusammenhang soll im Folgenden eine geeignete und vergleichbare Datengrundlage in Form von deutschen und polnischen Korpora ausgewählt werden.

Die Frage nach den Funktionen von Funktionsverbgefügen im Text bezieht sich auf die Kritik am Gebrauch von Funktionsverbgefügen seit Wustmanns Stilkunde aus dem Jahre 1891, die gegenwärtig auf Schreibblogs, in universitären Richtlinien zum Verfassen wissenschaftlicher Arbeiten als auch in modernen Textanalysetools im WWW rezipiert wird (vgl. Wustmann 1891: 416ff.; Reiners 1943–2009; Mackowiak 2011: 72; Textwende: Schreibtipps1; TU Braunschweig: Gestaltungsrichtlinien2, Textanalysetool"3; s. Kap. 1.2.1). Funktionsverbgefüge werden dort als schlechter und unverständlicher Behördenstil abgetan (vgl. z.B. Reiners 2009: 72; Textwende: Schreibtipps4) und auch in der linguistischen Forschungsliteratur werden Funktionsverbgefüge, wie Frage stellen, mit einem öffentlichen und amtlichen Sprachduktus in Verbindung gebracht (vgl. grammis online 20195; Hoffmann 2017: 225; Heringer 2014: 115). Funktionsverbgefüge kommen zwar z.B. in Gesetzestexten (Seifert 2004, Crestani 2013, Storrer 2013), politischen (Panzer 1986), wissenschaftlichen (Richter 1988) und wirtschaftlichen Texten (Schaarschuh 1990, Marušić 2012) vor, sie werden aber auch in einer Vielzahl stilistisch unterschiedlicher Textsorten verwendet, wie z.B. in Zeitungstexten (Schmidt 1968, Popadić 1971), literarischer Prosa (Daniels 1963, Storrer 2013) und in der Online-Enzyklopädie Wikipedia (Storrer 2013), d.h. jede dieser Text(sort)en würde für die Untersuchung von Funktionsverbgefügen in Frage kommen, sofern vergleichbare deutsche und polnische Korpora existieren. In diesem Zusammenhang erscheint die Online-Enzyklopädie Wikipedia besonders interessant, denn als weltweit größte multilinguale Online-Wissensressource bildet die Wikipedia eine wesentliche Quelle der gegenwärtigen Informationsbeschaffung im Internet und ist in Form von mehrsprachigen Korpora verfügbar (vgl. Cölfen 2012: 512f.; Pscheida 2010: 336, Mederake 2016, van Dijk 2010: 86; Lih 2009; Tiedemann 2012; Wołk/ Marasek 2014, Margaretha/Lüngen 2014). Als Online-Enzyklopädie, bei der unter Voraussetzung einer Registrierung ein Jeder mitwirken kann, ist die Wikipedia ein kollaboratives und gemeinnütziges Schreibprojekt auf ehrenamtlicher Basis, bei dem der Textproduktionsprozess einer ständigen Aushandlung innerhalb der Wikipedia-Community unterliegt (Mederake 2016: 179). Die Wikipedia existiert in insgesamt 302 Sprachversionen (Wikipedia: Sprachen6). Die deutsche Version hat nach der englischen und schwedischen die meisten Artikel (Wikipedia: Statistik – Vergleich verschiedener Sprachversionen),7 d.h. es werden sehr große und frei verfügbare Datenmengen auch für die Wissenschaft bereitgestellt, sodass die Wikipedia in unterschiedlichen humanwissenschaftlichen Forschungsrichtungen untersucht wird (vgl. Pscheida 2010: 334), z.B. zum Kooperations- sowie Konfliktlösungsverhalten im Wikipedia-Sozio-System (Wilkinson/Hubermann 2007, Matei/Dobrescu 2006), zur Motivation und Partizipation der Verfasser und Verfasserinnen (Hassel 2007, Möllenkamp 2007), zur Qualität der Wikipedia-Artikel (Blumenstock 2008, Stvilia et al. 2005) sowie zur Wikipedia als Lern- und Lehrplattform für (auto)didaktische Zwecke (Jaschniok 2007, Büffel/Pfeil/Schmalz 2007, Wolf 2007; s.a. den Forschungsstand zur Wikipedia: Wikipedistik8). Für die Linguistik ist die Wikipedia aber nicht nur wegen der verfügbaren Datenmassen und verschiedenen Sprachversionen interessant, sondern auch als Textsorte Enzyklopädie-Artikel, die in einem Aushandlungsprozess der Verfasser und Verfasserinnen als kollaborative Schreibpraxis im Internet entsteht und dieser in der Versionengeschichte und in Diskussionsseiten zu einzelnen Artikeln nachverfolgt werden kann (vgl. Gredel/Mell 2018, Gredel 2018a, b, c). Wikipedianer*innen diskutieren beispielsweise über die Konzeption oder die Struktur von Wikipedia-Artikeln und passen die Inhalte gegebenenfalls an (vgl. Stvilia et al. 2005: 17; van Dijk 2010). Wikipedia-Daten, denen auch Angaben zu Benutzern und Benutzerinnen, wie z.B. der Status innerhalb der Community oder die Anzahl verfasster Artikel, entnommen werden können, eignen sich für diskurslinguistische Fragestellungen nach Macht- und Aushandlungsprozessen in komplexen Sozio-Systemen (vgl. Gredel/Mell 2018, Gredel 2018a, b, c). Zudem gehören Wikipedia-Texte durch ihre Lokalisierung im WWW zu Hypertexten, in denen verschiedene Phänomene internetbasierter Kommunikation, wie z.B. Verlinkungen und Emoticons, aber auch multimodale Elemente in Form von Sprach- und Videoaufnahmen zu finden sind (vgl. Storrer 2018a, b; Gredel/Herzberg/Storrer, 2018; Wikipedia: Artikel mit Video9). Beim Verfassen der Artikel befolgen die Wikipedianer und Wikipedianerinnen Konventionen, die in den Wikipedia-Guidelines zusammengefasst werden und neben Informationen zur Zitierweise oder Angaben zur angemessenen Länge von Artikeln auch Richtlinien zur Verständlichkeit beinhalten (Wikipedia: Wie schreibe ich gute Artikel10):

Ein guter Artikel in Wikipedia soll verständlich sein. Überprüfe neue Artikel oder Änderungen auf allgemeine Verständlichkeit, siehe Checkliste Verständlichkeit. Menschen ohne einschlägige fachliche Vorbildung sollen einen Artikel, zumindest aber die zusammenfassende Einleitung verstehen können. Zur Verständlichkeit erforderliche Erklärungen sollen direkt im Artikel gegeben werden. Verweise geben weiterführende und vertiefende Informationen zum Thema. Artikel, auf die verwiesen wird, sollten ebenfalls verständlich sein. (Wikipedia: Allgemeinverständlichkeit; Hervorhebung im Original11)

Die Richtlinien zur Allgemeinverständlichkeit in Wikipedia-Artikeln beziehen sich auf die Grundsätze des Hamburger Verständlichkeitskonzepts, das z.B. auf die Einfachheit im Ausdruck, die Gliederung des Textes sowie auf die Kürze und Prägnanz der Produktion eines verständlichen Textes setzt (Tausch/Langer/Schulz von Thun 2015; Wikipedia: Hamburger Verständlichkeitskonzept12). Die Qualität sowie die Verständlichkeit der Wikipedia-Artikel konnte nicht nur durch empirische Studien belegt werden (Kurzidim 2004, Wiegand 2007), sondern lässt sich auch mit Klickzahlen im Internet in Verbindung bringen: Neben anderen Online-Diensten wie Google, Facebook oder Amazon gehört die Wikipedia zu den meistaufgerufenen Seiten im WWW der Gegenwart und besetzt Platz 5 (vgl. Wikipedia: Liste der meistaufgerufenen Websites13) bzw. Platz 7 (Chip: Die meistgeklickten Webseiten der Welt14) der weltweiten Ranglisten. Würden Funktionsverbgefüge, wie von Stil- und Schreibratgebern behauptet wird (vgl. Mackowiak 2011: 72), Texte unverständlich machen, dann dürften die schwülstigen Umschreibungen (zitiert nach Daniels 1963: 9f.) nicht in Wikipedia-Artikeln vorkommen. Aus der Korpusstudie von Storrer (2013) geht jedoch hervor, dass die dort untersuchten Funktionsverbgefüge Abbitte leisten, Absage erteilen, Anwendung finden, Entscheidung treffen und Kritik üben im Wikipedia-Korpus sogar häufiger vorkommen als im Vergleichskorpus mit juristischen Texten (vgl. Storrer 2013: 197). Durch den Bezug zu linguistischen Verständlichkeitskonzepten und dem Vorkommen von Nomen-Verb-Verbindungen eignen sich Wikipedia-Artikel hervorragend als Datengrundlage für die Erforschung von Funktionsverbgefügen bezüglich ihrer Leistungen im Textzusammenhang.

Für die Vergleichssprachen der vorliegenden Untersuchung Deutsch und Polnisch15 sind zwei Arten von Korpora mit Wikipedia-Artikeln verfügbar, nämlich die Parallelkorpora der Korpus-Plattform OPUS (Tiedemann 201216; Wołk/Marasek 2014) mit Wikipedia-Artikel-Korpora in 20 Sprachen17 – darunter sind beispielsweise Arabisch, Russisch und Vietnamesisch sowie Englisch, Französisch, Deutsch und Polnisch – und die Vergleichskorpora des Leibniz-Instituts für Deutsche Sprache,18 die mit dem Deutschen in insgesamt neun Sprachversionen zur Verfügung stehen, und zwar in Englisch, Spanisch, Französisch, Italienisch, Norwegisch, Kroatisch, Ungarisch und Polnisch (Margaretha/Lüngen 201419).

 

Die Parallelkorpora der OPUS-Plattform basieren auf maschinellen Übersetzungen von Originaltexten in eine bzw. mehrere Zielsprachen (Wołk/ Marasek 2014) und eignen sich für Fragestellungen, die sich beispielsweise auf die Ausprägung einer sprachlichen Form bzw. Mehrworteinheit in verschiedenen Sprachsystemen befassen, z.B. wie die Konstruktion Frage stellen im Polnischen widergegeben wird und ob es unterschiedliche Übersetzungsvarianten gibt, was an den folgenden Beispielen aus Linguee demonstriert wird (Hervorhebung S.K.)20

1 Deutsch: Eine Frage stellt sich natürlich immer wieder, nämlich, ob die humanitäre Hilfe die Richtigen erreicht, und hier spielt Transparenz eine sehr wichtige Rolle.Polnisch: Oczywiście rodzi się jedno pytanie – pytanie zadawane od dawna – o to, czy pomoc humanitarna dociera do rzeczywistych odbiorców, przejrzystość odgrywa tu bardzo ważną rolę.

2 Deutsch: Wenn ihm eine Frage gestellt wird, sollte ein Präsident versuchen, sie irgendwie zu beantworten und eine mutige Entscheidung treffen: Er sollte sagen „Ich bin dafür” oder „Ich bin dagegen” und dies begründen.Polnisch: Gdy słyszy pytanie, powinien spróbować na nie odpowiedzieć i podjąć odważną decyzję: oświadczyć „Jestem za” lub „Jestem przeciw”, po czym wyjaśnić, dlaczego.

In keiner der polnischen Übersetzungen erscheint das Funktionsverbgefüge Frage stellen als Nomen-Verb-Verbindung: In (1) wird das Funktionsverbgefüge Frage stellen mit rodzić pytanie übersetzt, was wörtlich ‚eine Frage gebären‘ bedeutet (vgl. Pons online: rodzić21). In (2) wird Wenn ihm eine Frage gestellt wird mit Gdy słyszy pytanie wiedergegeben, was wörtlich ‚wenn er eine Frage hört‘ bedeutet, d.h. in Übersetzung (2) ist kein Funktionsverbgefüge vorhanden, sondern nur das Nomen Frage ‚pytanie‘. Das deutsche Funktionsverbgefüge Frage stellen kann also je nach kontextuellen Erfordernissen auch mit anderen sprachlichen Mitteln übersetzt werden (vgl. Kvam 2010: 55). In Übersetzungen kann es zudem zur Übertragung von Strukturen der Ausgangssprache auf die Zielsprache als Shining-through-Effekte kommen (Teich 2003: 61; Hansen 2006: 115), was sich auf Untersuchungsergebnisse auswirken kann. Die Wikipedia-Übersetzungsmaschine der OPUS-Plattform wird außerdem von den Entwicklern als weiter verbesserungsfähig im Vergleich mit menschlichen Übersetzungen eingestuft (Wołk/ Marasek 2014: 131), was auf zusätzliche Fehlerquellen schließen lässt. Da in der vorliegenden Arbeit deutsche und polnische Funktionsverbgefüge auf systematisierbare Funktionen im Textzusammenhang im jeweiligen sprachlichen Einzelsystem untersucht werden, wären mögliche Übersetzungsvarianten, Shining-through-Effekte sowie maschinelle Übersetzungsfehler Störfaktoren in der Untersuchung, sodass ich mich für die Zwecke der vorliegenden Arbeit für Vergleichskorpora entscheide.

Bei Vergleichskorpora handelt es sich um Sammlungen von Originaltexten in verschiedenen Sprachen zu „einem vergleichbaren Diskursbereich“ (Lemnitzer/ Zinsmeister 2015: 138), d.h. zu einem gemeinsamen Thema bzw. zu einer Textsorte, wie z.B. einem deutschen (Wikipedia: Krim22) und einem polnischen Original-Artikel zur Krim (Wikipedia: Krym23), die keine Übersetzungen voneinander sind und (vermutlich) von unterschiedlichen menschlichen – und ausdrücklich nicht maschinellen – Textproduzenten und -produzentinnen verfasst wurden.24 Da ich an natürlicher und von anderen Sprachen unabhängiger Sprachproduktion interessiert bin, fällt die Wahl für die Untersuchung von deutschen und polnischen Funktionsverbgefügen im Textzusammenhang auf die Wikipedia-Vergleichskorpora des Leibniz-Instituts für Deutsche Sprache, die in weitere Subkorpora,25 z.B. nach ihrem Entstehungsjahr unterteilt werden (COSMAS II: Wikipedia-Korpora26). Das deutsche Wikipedia-Artikelkorpus existiert zum Zeitpunkt der Datenerhebung (Mai bis November 2018) in den Versionen der Entstehungsjahre 2013, 2015 und 2017. Das polnische Subkorpus ist zum Erhebungszeitpunkt jedoch nur in den Versionen aus den Jahren 2013 und 2015 verfügbar, sodass für die zeitliche Konsistenz der Datengrundlage die Wikipedia-Subkorpora aus dem Jahr 2015 für beide Sprachen ausgewählt wurden (vgl. Kupietz et al. 2018). Das deutsche Wikipedia-Artikel-Korpus (WPD15) setzt sich aus 1 802 682 Texten und 824 692 227 Textwörtern zusammen, das polnische Korpus (WPP15) enthält 1 105 401 Texte und 282 995 410 Textwörter. Das polnische Wikipedia-Korpus ist demzufolge deutlich kleiner als das deutsche, was in Bezug auf die quantitativen und qualitativen Ergebnisse der Ergebnisse zu berücksichtigen ist.

Als Datengrundlage für die Untersuchung der Funktionsverbgefüge Frage stellen, Antwort geben und Entscheidung treffen sowie der polnischen Äquivalente wurden die Wikipedia-Artikel-Korpora des IDS aus dem Entstehungsjahr 2015 ausgewählt. Wikipedia-Artikel eignen sich für die vorliegende Untersuchung von Funktionsverbgefügen im Textzusammenhang, weil die Artikel auf linguistischen Konzepten zur Verständlichkeit von Texten basieren. Im nächsten Abschnitt gehe ich auf die weitere Vorgehensweise bei der Datenerhebung sowie die Analysemethoden der vorliegenden Arbeit ein.

2.3. Datenerhebung und Vorgehensweise

Die Funktionsverbgefüge Frage stellen, Antwort geben und Entscheidung treffen sowie ihre polnischen Äquivalente zada(wa)ć pytanie, da(wa)ć odpowiedź und podjąć/podejmować decyzję werden in der vorliegenden Arbeit auf ihre Leistungen im Textzusammenhang untersucht. Für die Untersuchung dieser Konstruktionen wurden als Datengrundlage die deutschen und polnischen Wikipedia-Artikel-Korpora (WPD15, WPP15) des Leibniz-Instituts für Deutsche Sprache ausgewählt, aus denen ein geeigneter Datensatz sowie -menge extrahiert wurde. Im Folgenden wird die Vorgehensweise bei der Erhebung sowie der Analyse der Daten vorgestellt.

Für die Untersuchung von textuellen Leistungen von Funktionsverbgefügen wurde der korpusbasierte, quantitativ-qualitative Ansatz nach Lemnitzer/Zinsmeister (2015) herangezogen. Die Daten werden diesem Ansatz nach quantifiziert, aber in weiteren Schritten auch qualitativ und im Sinne des Kontextualismus analysiert (Wittgenstein 1967, Firth 1968). Der Kontextualismus untersucht sprachliche Einheiten auf ihre Funktionen im Kontext (Lemnitzer/ Zinsmeister 2015: 30)1 und versteht sich als Gebrauchsorientierte Theorie der Bedeutung, denn „Die Bedeutung eines Wortes ist sein Gebrauch in der Sprache“ (Wittgenstein 1967: 43) oder „You shall know a word by the company it keeps.“ (Firth 1968b: 179). Mit diesem Ansatz werden Mehrworteinheiten, wie und er (‚Kollokationen‘ nach Lemnitzer/Zinsmeister 2015: 32; Hervorhebung S.K.) und Antrag stellen (‚Kolligationen‘ nach Lemnitzer/Zinsmeister 2015: 32, ‚Funktionsverbgefüge‘ nach Kamber 2008: 22), im „rohen“ und nicht vorannotierten bzw. getaggten Korpus auf ihren Gebrauch im Kontext analysiert und gehören nach Lemnitzer/Zinsmeister (2015) zum Hauptuntersuchungsschwerpunkt des Kontextualismus (Lemnitzer/ Zinsmeister 2015: 32ff.; Bsp. aus Lemnitzer/ Zinsmeister 2015: 32; Hervorhebung S.K.). Für die Untersuchung von Funktionsverbgefügen auf ihre Funktionen im Textzusammenhang, d.h. als „Paare sprachlicher Einheiten […], deren Zusammenhang durch die Bezeichnung ihrer syntaktischen Kategorie und der Beziehungen zwischen diesen Kategorien weiter qualifiziert ist“ (Lemnitzer/ Zinsmeister 2015: 32) erscheint der korpusbasierte quantitativ-qualitative Ansatz nach Lemnitzer/Zinsmeister (2015) als geeignet. Zwei Einschränkungen werden in Bezug auf diese Untersuchungsmethode vorgenommen: Erstens wird nicht die gesamte Anzahl an absoluten Treffern im Korpus untersucht, sondern lediglich eine im quantitativen Sinn geeignete Auswahl an Treffern als Zufallsstichprobe. Und zweitens analysiere ich die Daten nicht ausschließlich induktiv, sondern leite auf der Basis der Forschungsliteratur zu Funktionsverbgefügen ein Annotationsschema in Form eines Kategoriensets ab (s. Kap. 3), das anschließend induktiv erweitert wird, d.h. es werden deduktive mit induktiven Analysemethoden kombiniert (vgl. Meindl 2011: 27f.).

Die Erhebung der Daten für die vorliegende Untersuchung beläuft sich auf einen Zeitraum von Mai bis November 2018 und basiert auf wichtigen Vorüberlegungen und -tests, durch die Suchanfragen in COSMAS II schrittweise weiter angepasst wurden. Bei den ausgewählten Funktionsverbgefügen handelt es sich um einen bestimmten Typ von Mehrworteinheiten, die aus einem Funktionsverb – stellen, geben, treffen – und einem Funktionsnomen – Frage, Antwort, Entscheidung (vgl. Kamber 2008; Heine 2006: 49, Hermann 2019) – bestehen und sich durch einen geringen Grad an Festigkeit und Lexikalisierung auszeichnen (vgl. Helbig/Buscha 2011: 87), d.h. die Komponenten der Gefüge können verschiedene Flexionsformen bilden, erweitert werden und an verschiedenen Positionen im Satz vorkommen, was bei der Erhebung der Daten berücksichtigt werden muss, vgl. die folgenden Beispiele:


Deutsch Polnisch
(1)Sie stellt diese/wichtige(n) Fragen. (2)Ona zadaje te/ważne pytania.
(3)Sie stellte ihm eine Frage. (4)Zadaje mu pytanie.
(5)Eine Frage hat sie gestellt. (6)Pytanie zadała (ona).
(7)Sie hat eine Frage gestellt. (8)Zadała pytanie.

Die Beispiele zeigen, dass die deutschen und polnischen Funktionsnomen Frage und pytanie beispielsweise im Singular (3, 4) oder Plural (1, 2) gebildet werden können, am Satzanfang (5, 6) oder am -ende (7, 8) stehen können sowie durch verschiedene Erweiterungen voneinander getrennt (1, 2) oder zusammen stehen können (7, 8) (vgl. Daniels 1963: 230; Popadić 1971: 56; Żmigrodzki 2000: 119ff./178; Popadić 1971: 25; Hinderdael 985: 159/218f.; Seifert 2004: 192; Heine 2006: 162ff.). Hinsichtlich der Abfolge und der Flexionsformen der Funktionsverbgefüge wurden aufgrund dieser syntaktischen Variabilität der Komponenten (vgl. Schmidt 1968: 56; Helbig/Buscha 2011: 88ff.) keine Einschränkungen bei der Datenerhebung vorgenommen. Weil die Funktionsnomen und -verben auch in wörtlicher Bedeutung, d.h. auch außerhalb der Wortverbindung vorkommen können (Helbig/Buscha 2011: 87), wie z.B. in Sie trafen sich vor dem Bahnhof. Dort verkündeten sie ihre Entscheidung, beschränkt sich die Suchanfrage in COSMAS II auf die Satzgrenze (Suchbefehl: /s0), die nach der in der Korpuslinguistik üblichen Definition durch einen Punkt markiert ist (vgl. Perkuhn/Keibel/Kupietz 2012: 26). Es wurden also alle möglichen Flexionsformen (Suchbefehl: &) und Positionen der Funktionsnomen und -verben bei der Erhebung der Daten mithilfe von COSMAS II aus den Wikipedia-Artikel-Korpora (2015) berücksichtigt. Weil die vorliegende Arbeit auf Funktionen von Funktionsverbgefügen im Textzusammenhang im Sinne des Kontextualismus (Lemnitzer/Zinsmeister 2015: 37) zielt, wird der Trefferkontext bei der Datenerhebung vom Treffer ausgehend um 10 Sätze links und 10 Sätze rechts erweitert (vgl. Perkuhn/Keibel/Kupietz 2012: 111). Die Suchanfrage

&[Funktionsnomen] /s0 &[Funktionsverb]

wird auf die Gefüge Antwort geben und Entscheidung treffen angewendet. Weil zu Frage stellen das formal ähnliche Funktionsverbgefüge in Frage stellen im Sinne von ‚an etw./jmd. zweifeln‘ (vgl. DWDS: Frage)2 existiert, das sich von Frage stellen durch einen höheren Grad an Festigkeit und Lexikalisierung unterscheidet (vgl. Kamber 2008: 136), musste die Suchanfrage bei Frage stellen weiter angepasst werden. Zudem existiert zu Frage stellen die reflexive Variante sich eine Frage stellen, vgl. die folgenden Beispiele aus Linguee (Hervorhebung S.K.)3

 

1 sich eine Frage stellen:

Dann würde sich die Frage nach der Verhältnismässigkeit stellen.

Diese Frage stellt sich dem Rechtsstaat immer dann, […].

Für sie stellt sich natürlich eine Frage sehr einschneidend: […].

Es stellt sich jedoch schon die Frage, ob […].

1 etw. in Frage stellen:

[…] würden die politischen Institutionen in Frage gestellt, […].

Die Existenz der Regionalstelle ist langfristig in Frage gestellt, […].

[…] den Mut aufgebracht, sich selbst in Frage zu stellen.

[…] liebgewordene Traditionen in Frage zu stellen, […].

Die Beispiele (9) und (10) zeigen, dass sich die reflexive Konstruktion im Grad der Festigkeit von der präpositionalen unterscheidet. Das Nomen kann in der Reflexivkonstruktion um verschiedene sprachliche Einheiten erweitert werden (9). Die präpositionale Konstruktion ist dagegen fest, Attribute des Funktionsnomens konnten nicht identifiziert werden und die Komponenten der Konstruktion stehen in Kontaktstellung.4 Da die Funktionsverbgefüge sich eine Frage stellen sowie in Frage stellen nicht zum Untersuchungsgegenstand der vorliegenden Arbeit gehören, sollen möglichst beide Konstruktionstypen vor der Datenerhebung maschinell aussortiert werden. Der höhere Festigkeitsgrad von in Frage stellen erweist sich dabei als hilfreich, denn durch die Anpassung der Suchanfrage mit dem Suchbefehl, keine Konstruktionen mit der Präposition in vor Frage aufzuspüren, führt zu einem höheren Maß an Präzision und Recall (vgl. Perkuhn/Keibel/Kupietz 2012: 40) in Bezug auf die Frage-stellen-Konstruktion, vgl. die folgende Suchanfrage:

#LINKS((&Frage %-w1 in) /+s0 &stellen) ODER #RECHTS((&Frage %-w1 in) /-s0 &stellen)

Da das Reflexivpronomen in der Reflexivkonstruktion sich eine Frage stellen nicht immer mit dem Funktionsnomen Frage in Kontaktstellung steht (10) und durch den Ausschluss des Reflexivpronomens unter Umständen andere (Verb-)Formen verloren gehen würden, habe ich die sich-eine-Frage-stellen-Konstruktion nicht automatisch von COSMAS II aussortieren lassen, sondern die reflexiven Formen von Frage stellen händisch aussortiert.

Für die Suchanfragen im polnischen Wikipedia-Artikel-Korpus (2015) werden zwar dieselben Maßstäbe angesetzt wie für die Erhebung der deutschen Daten, d.h. Funktionsnomen und -verb sollen in allen Flexionsformen und an verschiedenen Positionen im Satz vorkommen können, die Suchanfragen für die polnischen Gefüge zada(wa)ć pytanie, da(wa)ć odpowiedź und podjąć/podejmować decyzję unterscheiden sich aber von den deutschen Anfragen, weil die fremdsprachigen Wikipedia-Korpora des IDS nicht lemmatisiert sind. Für die Erhebung der polnischen Daten mussten bei der Suchanfrage deswegen reguläre Ausdrücke verwendet werden (Perkuhn/Keibel/Kupietz 2012: 34), d.h. jede Flexionsform der beiden Komponenten wurde einzeln eingegeben und geklammert, vgl. die folgende Suchanfrage:5

Suchanfrage zu zadać pytanie ‚Frage stellen‘

(zadać ODER zadam ODER zadałem ODER zadałam ODER zadasz ODER zadałeś ODER zadałaś ODER zada ODER zadał ODER zadała ODER zadało ODER zadamy ODER zadaliśmy ODER zadałyśmy ODER zadacie ODER zadaliście ODER zadałyście ODER zadają ODER zadali ODER zadały ODER zadał ODER zadała ODER zadałbym ODER zadałabym ODER zadałbyś ODER zadałabyś ODER zadało ODER zadałby ODER zadałaby ODER zadałoby ODER zadalibyśmy ODER zadałybyśmy ODER zadalibyście ODER zadałybyście ODER zadaliby ODER zadałyby ODER zadaj ODER zadajmy ODER zadajcie ODER zadadzą ODER zadane ODER zadawszy)/s0 (pytanie ODER pytania ODER pytań ODER pytaniu ODER pytaniom ODER pytaniem ODER pytaniami ODER pytaniu ODER pytaniach)

Zu beachten ist in Bezug auf die Gefüge im Polnischen, dass die Konstruktionen jeweils in einer perfektiven, z.B. zadać pytanie, und einer imperfektiven Form, z.B. zadawać pytanie vorkommen (Engel et al. 1999: 551ff.), d.h. für die Erhebung der Daten zu den polnischen Gefügen wurden insgesamt sechs Suchanfragen gestellt und sechs Datensätze aus dem Wikipedia-Artikel-Korpus (WPP15) exportiert.

Für die Untersuchung von polnischen und deutschen Funktionsverbgefügen im Textzusammenhang, sollte eine im quantitativen Sinne geeignete Stichprobe von mindestens 1000 Treffern pro Sprache (Bortz/Döring 2006: 397) exportiert werden. Deswegen habe ich pro Funktionsverbgefüge eine Stichprobengröße von mindestens 300 zufälligen Treffern angesetzt. Eine Ausnahme bilden dabei die Funktionsverbgefüge Frage stellen und die polnische Entsprechung zada(wa)ć pytanie, für die aufgrund eines noch unbekannten Umfangs reflexiver Formen zum Zeitpunkt der Datenerhebung eine umfangreichere Stichprobe von 500 bzw. 604 Treffern gezogen wurde, um die Anzahl an Falsch-Positiven – „fälschlicherweise gefundenen Treffer[n]“ (Perkuhn/Keibel/Kupietz 2012: 39) – einzugrenzen, vgl. die folgende Zusammenfassung der Datenerhebung aus dem deutschen und polnischen Wikipedia-Artikel-Korpus (2015) in der folgenden Tabelle:


Sprache Funktionsverbgefüge Abs. Treffer rel. Häufigk. pMW Zufallsstichprobe
Deutsch Frage stellen 6.256 7.586 500
Antwort geben 1.522 1.846 300
Entscheidung treffen 4.348 5.272 300
Polnisch zadać pytanie 304 1.0740 304
zadawać pytanie 549 1.9400 300
dać odpowiedź 195 0.6891 195
dawać odpowiedź 138 0.4876 138
podjąć decyzję 7.640 27.0000 150
podejmować decyzję 1.321 4.6680 150
Summe 2337

Tabelle 5:

Datenerhebung: Trefferzahlen absolut – relativ – Stichprobengröße (WPD15 & WPP15)

Tabelle 5 zeigt für die ausgewählten Funktionsverbgefüge die absoluten Trefferzahlen, die exportierte Stichprobengröße sowie die relativen Frequenzen in pro Million Wortformen (pMW) in den Wikipedia-Artikel-Korpora (WPD15, WPP15). Auffällig ist unter den polnischen Treffern, dass das Funktionsverbgefüge podjąć decyzję mit einer Häufigkeit von 27 pMW nicht nur deutlich häufiger vorkommt als die polnischen Gefüge podejmować decyzję ‚Entscheidung treffen‘, da(wa)ć odpowiedź ‚Antwort geben‘ und zada(wa)ć pytanie ‚Frage stellen‘, sondern auch insgesamt mit 7,640 Treffern häufiger ist als die deutschen Gefüge mit Frage stellen als häufigstes Gefüge mit 7.586 pMW und 6.256 absoluten Treffern. Überraschend ist dieses Ergebnis, weil das polnische Wikipedia-Korpus deutlich kleiner ist als das deutsche – das polnische Korpus (WPP15) besteht aus 1 105 401 Texten und 282 995 410 Textwörtern und das deutsche (WPD15) aus 1 802 682 Texten und 824 692 227 Textwörtern, d.h. in Relation zur Korpusgröße ist die perfektive Variante des polnischen Funktionsverbgefüges podjąć decyzję ‚Entscheidung treffen‘ eine saliente Form. Die Summe der exportierten Treffer setzt sich aus 1100 exportierten deutschen und aus 1237 polnischen Treffern zusammen und ergibt einen Datensatz von 2337 Treffer(kon)texten (10 Sätze links und rechts vom Treffer), in denen die Funktionsverbgefüge Frage stellen, Antwort geben und Entscheidung treffen sowie ihre polnischen Äquivalente zada(wa)ć pytanie, da(wa)ć odpowiedź und podjąć/podejmować decyzję auf ihre Leistungen im Textzusammenhang analysiert werden können. Die exportierten Zufallsstichproben wurden anschließend in Microsoft Excel manuell bereinigt. Zu den bereinigten Falsch-Positiven bzw. Nicht-Treffern gehören beispielsweise die folgenden Treffer mit Funktionsverben in der Vollverbbedeutung (11), reflexive Funktionsverbgefüge (12) oder trennbare Partikelverben (13) (Hervorhebung S.K.):