Inhaltszusammenfassung:
In mehreren Studien wurde festgestellt, dass die Häufigkeit der Wörter in der Sprache mit phonetisch verstärkten Realisierungen verbunden sind. Beispielsweise haben häufige Wörter eine längere Dauer und eine peripherere Zungenpositionen (Cohen, 2014; Kuperman et al., 2007; Tomaschek, Tucker, et al., 2018; Tomaschek et al., 2021). Dies steht scheinbar im Widerspruch zu der vorherrschenden Ansicht, dass häufige Wörter phonetisch reduziert sind, das heißt, eine zentralisiertere Zungenpositionen besitzen und eine kürzere Dauer haben (Aylett & Turk, 2004, 2006; A. Bell et al., 2002; Dinkin, 2008; Gahl, 2008; Jurafsky et al., 2001; Lin et al., 2011; Pluymaekers et al., 2005b).
In dieser Doktorarbeit wurde zuerst der Verstärkungseffekt mittels Ultraschall reproduziert, der auch von einer der vorherigen Studie mit Elektromagnetische Artikulographie gefunden wurde (Tomaschek, Tucker, et al., 2018). In Übereinstimmung mit der Studie von Tomaschek, Tucker, et al. (2018) wurde in der ersten Studie dieser Doktroarbeit klarere Artikulationen für sehr häufige Wörter im Vergleich mit mittel häufigen Wörtern beobachtet. Die Effekte von der Worthäufigkeit waren sichtbarer für die Zungenspitze als für den Zungenkörper. In der aktuellen Studie, genauso wie in der Studie von Tomaschek, Tucker, et al. (2018), folgten dem [a:] Vokal Alveolarsuffixe, was erklärt, warum die Koartikulation an der Zungenspitze am stärksten ausgeprägt war. Der Zungenkörper führte nur nach der relativ aktiveren Bewegung der Zungenspitze relativ passive Bewegungen aus.
Außerdem waren Effekte der Worthäufigkeit in der aktuellen Studie viel sichtbarer für die Suffixbedingung [t] im Vergleich zu [n]. Dieser Unterschid wurde höchstwahrscheinlich durch mögliche Unterschiede in den Silbenstrukturen verursacht. Die Suffixbedingung [n] enthielt [@n] und [n]. Ersteres kann ein Silbennasal und letzteres kann eine getrennte Silbe mit einem Schwa sein. In beiden Fällen sollten koartikulatorische Effekte vom Suffix auf den Stammvokal kleiner. Zusammengenommen verdeutlicht diese Studie, dass die Art und Weise, wie die Erfahrung, gemessen an der Worthäufigkeit, Artikulationen verstärkt. Allerdings kann die erwartete Koartikulation abhängig vom morphologischen Kontext erheblich unterschiedlich ausfallen.
Im Gegensatz kontrollierte die zweite Studie in dieser Doktorarbeit wortausschließende Silbenstrukturen, indem sich auf Suffixbedingung [t] konzentriert wurde. Darüber hinaus wurde in dieser Studie das nicht-morphämische wordausschließende [t] eingeschlossen, um die Wechselwirkung von Worthäufigkeit und morphologischem Status zu beobachten. Eine Wechselwirkung von Worthäufigkeit und morphologischem Status (flektiert vs. nicht flektiert) hat sich tatsächlich aus dieser Studie ergegeben, in der die Aufnahmen von Elektromagnetische Artikulographie von spontanem Konversationsdeutch benutzt wurden. Für nicht-flektierte Wörter sagte die höhere Frequenz stärkere phonetische Reduzierungen von dem Stammvokal (immer [a:]) vorher. Wenn das wortausschließende Segment ([t]) dagegen ein Flektionsexponent war, wurde der phonetische Reduzierungseffekt abgeschwächt und sogar etwas verstärkt.
Diese Beobachtungen unterstützen die Möglichkeit, dass das Vorhandensein/Fehlen von einer morphologischen Grenze Effekte von Worthäufigkeit moduliert. Tatsächlich stimmen diese Beobachtungen damit überein, dass in der Literatur die Wörter, die den Reduktionseffekt für höhere Frequenzen zeigten, tendenziell morphologisch einfach sind, während der phonetische Verstärkungseffekt nur für morphologisch komplexe Wörter gefunden wurde.
Aber warum verursachen unterschiedliche morphologische Strukturen solche unterschiedlichen Effekte in Abhängigkeit der Worthäufigkeit? Weder die Erklärung, die auf morphologischem Parsing (Syntaxanalyse) mit Druck von Paradigmenmitgliedern basiert, die Paradigm-Uniformity Hypothese, noch die Erklärung, die auf syntagmatischer Vorhersagbarkeit basiert (Aylett & Turk, 2004; Jurafsky et al., 2001), liefern ausreichende Erkärungen für die beobachte Wechelwirkung von Worthäufigkeit und morphologischem Status. Zur besseren Erklärung haben wir den Begriff der morphologischen Grenze übergedacht. Dafür haben wir die morphologische Grenze nicht als gegeben angenommen, sondern sind davon ausgegangen, dass die morphologische Grenze durch eine semantische Ebene markiert wird.
Um zu überprüfen, ob die morphologische Grenze durch einen semantischen Einfluss vermittelt sein kann, untersuchte die dritte Studie in dieser Doktorarbeit mithilfe des DLM-Modells die Beziehung zwischen dem Flexionsstatus und der Höhe der semantischen Unterstützung, die das Suffix durch die Bedeutung des Worts erhält. Im Vergleich mit nicht-flektierten Wörtern erhielten flektierte Wörter deutlich mehr semantische Unterstützung für das wortausschließende Trigramm, das dem Flektionsexponent überspannte. Das Flektionsstatus war mit der höheren semantischen Unterstützung verbunden. Dieses Ergebnis ist umso bemerkenswerter, wenn man denkt, dass Einbettungen nicht von fastText, die in Wortformen 'hineinschauen' können, sondern von word2vec eingerichtet wurden, um Bedeutungen von Wörtern darzustellen. Offensichtlich variieren empirische Worteinbettungen von flektieren Wörtern, die mit [t] enden, systematisch mit dem Vorhandensein von diesem Flektionsexponent in Wortformen, was es dem DLM-Modell ermöglicht, welches Einbettungen auf Trigramme abbildet, besonders starke Unterstützungen für Trigramme bereitzustellen, die Flektionsexponenten abdecken.
Zusätzlich ergab die dritte Studie dieser Doktorarbeit, dass höhere semantische Unterstützung für das Suffixtrigramm phonetisch stärkere Realisierungen von dem Stammvokal [a:] vorhersagte. Wichtig ist, dass das Regressionsmodell mit semantischer Unterstützung als Prädiktor eine bessere Anpassung an die Daten lieferte, als das Regressionsmodell mit einem Faktor, der das Vorhandensein und Fehle von einer Flektionswortgrenze angibt. Diese Ergebnisse deuten darauf hin, dass tatsächlich Semantik der entscheidende Faktor ist und nicht eine rein formbasierte 'unsichtbare' Grenze zwischen Stamm und Exponent.
Darüber hinaus wurde die Wechselwirkung der semantischen Unterstützung und Worthäufigkeit beobachtet, was darauf hindeutet, dass der Stammvokal mehr reduziert war, wenn die semantische Unterstützung für das wortausschließende Trigramm niedrig war (typisch für nicht-flektierte Wörter), während der Stammvokal artikulatorisch verstärkt wurde, wenn die semantische Unterstützung für das wortausschließende Trigramm hoch war (typisch für flektierte Wörter). Mit anderen Worten lieferte das Maß von der semantischen Unterstützung die Erklärung für die nach dem Flektionsstatus unterschiedlichen Grade der phonetischen Reduktionseffekte der Worthäufigkeit, die in der zweiten Studie in dieser Doktorarbeit beobachtet wurden, ohne dass theoretische Begriffe wie Stämme, Exponenten, und morphologische Grenzen erforderlich sind. Solche Begriffe sind für Analysen auf hoher kognitiver Verarbeitungsebene nützlich. Aber um feine Details von Artikulationen zu verstehen, sind Verteilungseigenschaften von Wortformen, ihre Bedeutungen, und das Zusammenhang zwischen diesen entscheidend.
Diese neuen Erkenntnisse lassen sich nicht einfach durch klassische Sprachprozessmodelle erklären, die von der auf Modulen wie Syntax, Morphologie, Phonologie, usw. basierten seriellen Verarbeitungssytem ausgehen (Fromkin, 1971; Garrett, 1984, 1988; Levelt et al., 1999; Levelt & Wheeldon, 1994). In diesen Modellen stehen morphologische Informationen, geschweige denn semantische Informationen, nicht zur Verfügung, um feine phonetische Details zu bestimmen. Für einige Modelle, beispielsweise das Level Modell, ist es ein Designmerkmal, dass die phonetische Realisierung vollständig von Semantik und Syntax abgeschirmt ist. Andere Modelle, beispielsweise das Modell von Oppenheim et al., 2010, können möglicherweise die vorliegenden Ergebnisse berücksichtigen. Aber um das mit ausreichender Präzision zu erreichen würde es nötig sein, von handgefertigen Merkmalsdarstellungen für Wortbedeutungen zu Worteinbettungen von Verteilungssemantik überzugehen.
Mit dieser Doktorarbeit habe ich gezeigt, dass eine detaillierte quantitative Bewertung von der Art und Weise, wie Verteilungssemantik sublexikalische Merkmale von Formen auf niedriger Ebene unterstützt, unser Verständnis darüber verbessern kann, wie man Wörter artikuliert, ohne Hierarchien von Einheiten zwischen Bedeutung und Form postulieren zu müssen. Phonetiker sagen — vereinfacht ausgedrückt — Form von Form vorher. Semantiker sagen — vereinfacht ausgedrückt — Bedeutung von Bedeutung vorher. Aber die Sprache ist ein Kommunikationssystem, das die Lücke zwischen Form und Bedeutung, sowie zwischen Bedeutung und Form, überbrückt. Die aktuelle Verteilungssemantik in Kombination mit den einfachen aber äußerst effektiven Algorithmen des DLM Modells ermöglicht es, besser zu verstehen, wie die Sprache diese Lücke überbrückt. Mithilfe aktueller Methoden aus Statistik und Machine-Learning ist die Überbrückung von dieser Lücke einfacher, als viele Modelle vermuten lassen, die bisher als Blaupausen der menschlichen Sprachproduktion vorgeschlagen wurden
Abstract:
Frequency and frequency-based measures such as probability are widely accepted to have extensive effects on speech production. On the one hand, high frequency units (e.g., words) have been found to be articulated with shorter duration and centralized tongue positions, indicating phonetic reduction. On the other hand, high frequency, and therefore more predictable, units have been found to be articulated with longer duration and clearer articulations, indicating phonetic enhancement.
This dissertation provides a possible account for these seemingly-contradictory effects of frequency from the perspective of semantics. To this end, I first replicated one previous study, using ultrasound, which reported phonetic enhancement effects of frequency based on tongue position data recorded by electromagnetic articulography (EMA). In addition, I developed a new methodology of analyzing ultrasound images, in which not only tongue surface positions but the whole ultrasound images can be included for analysis. Using a different recording technique and a different analysis technique, effects of phonetic enhancement of word frequency were replicated.
Subsequently, I collected a set of words that shared the same rime structure, namely the stem vowel [a(:)], at most one intervening segment, and the word-final plosive [t], from a spontaneous speech corpus. Critically, these words differed in their morphological status, having either one or no morphological boundary between the stem vowel and the word-final [t], namely inflected and non-inflected words with the same rime structure. For these words, an increase in frequency was observed to be associated with higher tongue positions (indicating phonetically reduced realizations) of the stem vowel, while phonetic reduction was extensively attenuated for inflected words. These results suggest that seemingly-contradictory effects of frequency may in fact be due to different morphological statuses of the items being investigated.
Finally, a possible source of this "morphological" modulation of the frequency effect was investigated from the perspective of semantics. The amount of semantic support for the word-final triphone (i.e., SemSupSuffix), which contains the suffix in the middle, was calculated from the Discriminative Lexicon Model (DLM), which was trained to discriminate all the German words available in the CELEX database. SemSupSuffix was found to be associated most clearly with the word's inflectional status in such a way that higher SemSupSuffix was more likely for inflected words. Furthermore, SemSupSuffix showed a better performance in predicting tongue positions during the stem vowel in a statistical model, compared to inflectional status as a dichotomous factor variable. Moreover, the model with SemSupSuffix predicted that high frequency was associated with phonetic reduction when SemSupSuffix was low, which corresponded to non-inflected words, and that it was associated with phonetic enhancement when SemSupSuffix was high, which corresponded to inflected words. These results clarify that the observed interaction of frequency by morphological status can be explained without resorting to morphological concepts such as morphemes, because the DLM, from which SemSupSuffix was derived, does not make use of such high-level constructs, but uses lower-level sublexical form features instead.
In summary, this dissertation provides an explanation for why effects of frequency are different for inflected and non-inflected words, without requiring the theoretical constructs of morpheme or exponent. This explanation builds on the strong support that a low-level sublexical unit (the triphone straddling the suffix /t/) receives from a words' semantics. Instead of calling upon a putative morpheme boundary that would be part of a words' form representation, this explanation points to the importance of the different semantics that are realized in the word and the differential support that the critical triphone receives from the semantics.