Digital unterstützte Spontansprachanalyse – DigiSpon 1

Kategorie Projekt

Ausgangslage und Ziele

Es geht im Projekt DigiSpon um die Entwicklung und Evaluation einer Software für semi-automatische Spracherkennung und Analyse von Kindersprache. Mittels Spontanspracherhebungen sollen in einem ersten Schritt umfangreiche Sprachdaten von Kindern mit und ohne Sprachauffälligkeiten auf Hoch- und Schweizerdeutsch im Alter von 4–6 Jahren erhoben und zum Zweck des maschinellen Lernens genutzt werden.

Ein Prototyp der Software wird in der logopädischen Praxis evaluiert und für weitere Datenerhebungen eingesetzt. In einer explorativen Datenanalyse werden erste Hinweise zu Indikatoren für Sprachentwicklungsstörungen gesucht. Die Software wird in Kooperation mit dem Institut für Computerlinguistik der Universität Zürich entwickelt.

Projektleitung

Susanne Kempe Preti Titel Prof.

Funktion

Professorin für Interventionen bei Sprach- und Sprechstörungen

Fakten

  • Dauer
    05.2023
    06.2025
  • Projektnummer
    4_56

Projektteam

  • Sonja Schäli
  • Sarah Ebling
  • Julia Winkes
  • Pascale Schaller

Ausgangslage

Die Analyse der Spontansprache ist, neben der Verwendung etablierter psychometrischer Tests, eine bewährte Vorgehensweise in der Diagnostik von Sprachentwicklungsstörungen bei Kindern.

Spontansprachanalysen können, anders als Testverfahren, problemlos wiederholt und beliebig oft durchgeführt werden. Damit erweisen sie sich als ideales Instrument für wiederkehrende Erhebungen kindlicher Sprachleistungen. Die Erhebung und Transkription solcher Proben, so wie ihre Kriterien basierte Auswertung sind mit hohem Zeitaufwand verbunden. Aus diesem Grund wird deren Potential in der Praxis nur ansatzweise genutzt.

In der Diagnostik können digitale Techniken helfen, eine datengestützte und effiziente Befunderhebung zu gewährleisten. Digitale Diagnostikinstrumente reduzieren den Aufwand der Auswertung und ermöglichen durch wiederholte Anwendung Verlaufskontrollen und dadurch eine Evidenzsicherung der Therapie (vgl. Hönig & Nöth 2017; Senn Baumgartner 2022).

Eine computerbasierte Sprachanalyse verspricht eine höhere Zuverlässigkeit bei der kriterienorientierten Beurteilung der Spontansprache und verringert den Transkriptions- und Auswertungsaufwand wesentlich. Auf diese Weise werden in Bereichen der Diagnostik, in welchen normierte Verfahren nur begrenzt aussagekräftig sind, wie z.B. bei Mehrsprachigkeit, bei älteren Kindern und Jugendlichen oder bei Menschen mit kognitiven Beeinträchtigungen Einschätzungen von Fachpersonen gestützt.

Der isolierte Einsatz normierter Tests führt beispielsweise bei Kindern mit nicht deutscher Erstsprache oftmals zu keiner validen Diagnostik, da ihre Normen sich auf einsprachige Kinder beziehen (vgl. Scharff Rethfeldt 2020; Grimm & Schulz 2013). Die diagnostische Schwierigkeit liegt in der Abgrenzung sprachlicher Interferenzen oder Lernersprachen vom Erscheinungsbild einer Sprachentwicklungsstörung.

Aus diesem Grund wird versucht, eine Sprachentwicklungsproblematik am Nachweis von Leitsymptomen, sogenannten psycholinguistischen oder klinischen Markern, festzumachen. Damit sind sprachliche Auffälligkeiten gemeint, die bei den weitaus meisten Kindern mit Sprachentwicklungsstörungen in der Spontansprache beobachtbar sind. Die Suche nach solchen Markern hat zum Ziel, diagnostisch zuverlässige sprachliche Indikatoren für die Erkennung von Sprachentwicklungsstörungen bei Kindern mit Deutsch als Zweitsprache zu finden (vgl. Rothweiler, Chilla & Clahsen 2012; Ruberg et al. 2019).

Neuere Ansätze der automatisierten Sprachverarbeitung sind zunehmend in der Lage, ausgehend von sprachlichen Datensätzen digitale Lösungen für Spracherkennung und Textanalyse auch im Bereich der Sprachdiagnostik anzubieten. (vgl. Solorio 2013; Beltrami et al. 2018; de la Fuente Garcia et al.2020; Prud'hommeaux et al. 2014; Rigas et al. 2020).

Bisher gibt es allerdings nur wenige Studien im deutschen Sprachraum, die sich mit der computerunterstützten Erfassung und Analyse von kindlicher Sprache im Allgemeinen und bei Sprachentwicklungsstörungen im Besonderen befassen. Ein Grund dafür ist, dass sich die automatisierte Transkription je nach Ausgangssprache schwierig gestaltet. Dies ist beispielsweise bei kindlicher Sprache, Dialekt oder fehlerhafter Sprache der Fall. (vgl. Senn Baumgartner 2022).

Hier setzt DigiSpon an und verfolgt in einem ersten Projekt zwei Ziele:

  1. Die Entwicklung und Erprobung des Prototyps einer Pipeline zur semi-automatisierten Transkription und Analyse kindlicher Spontansprache in Hoch- und Schweizerdeutsch für die Praxis
  2. Eine explorative Analyse vorliegender Spontansprachdaten mit Hilfe der Pipeline

Als längerfristiges Ziel soll mit Hilfe des maschinellen Lernens auf der Basis umfangreicher, mit der entwickelten Software erhobenen Spontansprachdaten die empirische Grundlage zum Wissen über Sprachentwicklung und Sprachentwicklungsstörungen bei Kindern in der deutschen Schweiz erweitert und für die Praxis nutzbar gemacht werden.

Vorgehen

Entwicklung und Training der Software

Für die Erarbeitung der Software wird eine fundierte theoretische Basis gelegt.

In einer systematischen Literaturrecherche werden entscheidende sprachliche Parameter, welche relevant sind für die Erfassung des Sprachentwicklungsstandes bei ein– und mehrsprachigen Kindern herausgearbeitet.

Mit der Entwicklung einer Pipeline zur digital unterstützen Spontansprachanalyse geht die Erhebung und Zusammenstellung eines Korpus sprachlicher Daten einher. Diese dienen als Grundlage für das Training von Algorithmen mit dem Ziel der präziseren Erfassung und Transkription von Spontansprache im Kontext von Dialekt und fehlerhafter kindlicher Sprache.

Zielgruppe: Es werden Spontansprachdaten von Kindern mit und ohne Sprachauffälligkeiten im Altern von 4-6 Jahren erhoben. Die Durchführung der ca. 60 Spontanspracherhebungen erfolgt durch fachlich versierte Personen anhand eines eigens entwickelten Leitfadens. Die Transkription erfolgt zu Beginn noch ohne digitale Unterstützung und die Daten werden kontinuierlich in die bestehende Software eingespeist, um diese zu trainieren.

Erprobung und Evaluation

In Zusammenarbeit mit einer kleinen Gruppe logopädischer Fachpersonen wird die Software in ihrer Anwendung in der Praxis erprobt und evaluiert. Die Evaluation erfolgt mit einem qualitativen Ansatz: mit einem leitfadengestützten Interview werden die teilnehmenden Logopäd:innen zu ihren Erfahrungen mit der Software befragt.

Die Pipeline selbst wird hinsichtlich der Güte der automatisierten Analyse geprüft und mit unabhängigen Auswertungen von Studierenden hinsichtlich Inter-Annotator-Agreement (IAA) verglichen werden.

Auswertung der Daten mittels explorativer Analyse

Eine explorative Analyse der vorhandenen Spontansprachdaten mit Hilfe der Pipeline soll Informationen über Anzahl und Art sprachlicher Variationen der kindlichen Spontansprache liefern und Hinweise darauf geben, ob und wie sich Indikatoren von Sprachentwicklungsstörungen in der automatisierten Analyse abzeichnen.

Erwartete Ergebnisse

Am Ende des Projektes soll ein in der logopädischen Praxis anwendbarer Prototyp der Software zur semi-automatisierten Transkription und Analyse kindlicher Spontansprache vorliegen.

Dieser soll im Rahmen einer weiterführenden Studie für die Erhebung und Analyse umfangreicherer Sprachdaten dienen und in der Lage sein, beschriebene sprachliche Indikatoren abzubilden.

Fazit für die Praxis

Die automatisierte Sprachverarbeitung kann mit diesem Projekt Eingang ins logopädische Arbeitsfeld finden und Arbeitsweisen verändern. Eine digital unterstützte Sprachanalyse verspricht eine höhere Objektivität bei der kriterienorientierten Beurteilung und verringert den Transkriptions- und Auswertungsaufwand wesentlich. Es entsteht ein greifbarer Nutzen für das Praxisfeld.

Die entwickelte Software dient für künftige Datenerhebungen in der Praxis und kann damit die empirischen Grundlagen zum Wissen über Sprachentwicklung und Sprachentwicklungsstörungen bei Kindern in der deutschen Schweiz erweitern.

Literatur

  • Beltrami, D., Gagliardi, G., Rossini Favretti, R., Ghidoni, E., Tamburini, F., and Calzà, L. (2018). Speech Analysis by Natural Language Processing Techniques: A Possible Tool for Very Early Detection of Cognitive Decline? Frontiers in Aging Neuroscience, 10, 369.
  • de la Fuente Garcia, S., Ritchie, C., and Luza, S. (2020). Artificial intelligence, speech, and language processing approaches to monitoring Alzheimer’s disease: A systematic review. Journal of Alzheimer’s disease, 78 (4),1547–1574.
  • Grimm, A., & Schulz, P. (2013). Specific Lan¬guage Impairment and Early Second Lan¬guage Acquisition: The Risk of Over- and Un¬derdiagnosis. Child Indicators Research, 6, 821-841.
  • Hönig, F.; Nöth, E. (2017). Automatische Sprachverarbeitung in der Sprachtherapie. Bilda, K.; Mühlhaus, J.; Ritterfeld, U. (Hrsg.) Neue Technologien in der Sprachtherapie. Stuttgart, New York: Georg Thieme Verlag.
  • Rigas, E., Papoutsoglou, M., Tsakpounidou, K., Serdari, A., Mouza, E., and Proios, H. (2020). Analysis of Spontaneous Speech Using Natural Language Processing Techniques to Identify Stroke Symptoms. Encephalos, 57, 1–12.
  • Rothweiler, M., Chilla, S., & Clahsen, H. (2012). Subject verb agreement in Specific Language Impairment. Bilingualism. Language and Co¬gnition, 15, 39-57.
  • Ruberg, T.; Rothweiler, M.; Vérissimo, J.& Clahsen, H. (2019). Childhood bilingualism and Specific Language Impairment : A study of the CP-Domain in German SLI. Bilingualism: Language and Cognition, 1-13. https://www.cambridge.org/core (02.02.2021).
  • Scharff Rethfeldt, W. (2020). Logopädische Versorgung von mehrsprachigen Kindern mit Migrationshintergrund: Förderung oder Therapie? Logopädieschweiz, 3, 4-15.
  • Senn Baumgartner, C. (2022). Möglichkeiten und Grenzen der Computerlinguistik in der Logopädie. Bachelorarbeit der Interkantonalen Hochschule für Heilpädagogik Zürich.
  • Solorio, T. (2013). Survey on Emerging Research on the Use of Natural Language Processing in Clinical Language Assessment of Children. Language and Linguistics Compass, 12 (7), 633-646.