43.71.+m Speech perception
Refine
Has Fulltext
- yes (5)
Is part of the Bibliography
- yes (5)
Document Type
- Doctoral Thesis (5)
Language
- German (5)
Keywords
- Freiburger Sprachverständnistest (3)
- Sprachverstehen (3)
- ADST (2)
- Einsilbersprachverständnistest (2)
- Einsilbiges Wort (2)
- Sprachtest (2)
- Sprachverständnistest (2)
- Störgeräusch (2)
- monosyllabic words (2)
- monosyllabic words recognition test (2)
- speech recognition (2)
- speech recognition test (2)
- CCITT noise (1)
- CCITT-Störgeräusch (1)
- Cocktailparty-Effekt (1)
- D2 test (1)
- D2-Test (1)
- Freiburg monosyllabic words test (1)
- Kochleaimplantat (1)
- Kunstkopf (1)
- Lokalisation (1)
- MSS <Sprachtest> (1)
- OLSA (1)
- Oldenburger Satztest (1)
- Presbyakusis (1)
- Prosodie (1)
- Prosodieverständistest (1)
- SSV <Sprachtest> (1)
- Satzkategorientest (1)
- Schallquellenlokalisation (1)
- Sprachverstehen im Störschall (1)
- Sprechertest (1)
- auricle (1)
- cochlear implant (1)
- head and torso simulator (1)
- monaural spectral cues (1)
- monaural speech perception (1)
- monaurales Sprachverstehen (1)
- presbycusis (1)
- prosodic test (1)
- prosody perception (1)
- sentence function test (1)
- sound source localization (1)
- speaker recognition test (1)
- speech reception in noise (1)
- äußeres Ohr (1)
Eine der zentralen Aufgaben des menschlichen auditiven Systems besteht darin, aus einer Vielzahl von Umgebungsgeräuschen Ort und Informationsgehalt einer Schallquelle herauszufiltern. Diese Fähigkeit ist von entscheidender Bedeutung für die Kommunikation in geräuschvoller Umgebung. Einschränkungen des Hörvermögens führen in unterschiedlichem Ausmaß zu einer Beeinträchtigung dieser Hörleistung. Im klinischen Alltag berichten jedoch auch ältere Menschen ohne offensichtliche Hörstörung über Schwierigkeiten, Sprache in Gegenwart von mehreren Sprechern oder Nebengeräuschen zu verstehen. Die vorliegende Arbeit untersucht altersabhängige Veränderungen von Sprachverständnis und Lokalisationsfähigkeit an normalhörenden Erwachsenen. Zur Bestimmung der Sprachverständnisschwelle wurde der Oldenburger Satztest (OLSA) in Ruhe und in Gegenwart je eines energetischen (CCITT-Rauschen) sowie eines informationellen Maskers (Sprachgemisch aus zwei männlichen Störsprechern) verwendet. Dabei wurde die Sprache jeweils von vorn angeboten, während der Einfallswinkel der Störschallquelle in vier Schritten zwischen 0° und 90° variiert wurde. Die Lokalisationsfähigkeit in der vorderen Horizontalebene (-90° bis +90° ) wurde für drei verschiedene Signale (CCITT-Rauschen, Sprache und Clicktrain) untersucht, wobei der Pegel zwischen 55 dB und 65 dB zufallsvariiert wurde. Der D2-Konzentrationsleistungstest wurde zur Erfassung möglicher Ermüdungseffekte vor und nach dem Sprachverständnistest eingesetzt. Zur Untersuchung von Alterseffekten wurden je vier männliche und weibliche Probanden in sechs Dekaden (3. bis 8.) mit altersentsprechender Normalhörigkeit eingeschlossen. Zusätzlich wurde der zulässige Hochtonhörverlust begrenzt, um reine Alterseffekte von einer Presbyakusis trennen zu können. In der statistischen Auswertung des Sprachverständnisses in Ruhe hatten die beiden Einflussfaktoren Probandenalter und Hörschwelle den größten Einfluss und erklärten zusammen 84% der Gesamtvarianz. Bei der winkelabhängigen Untersuchung der beiden Maskertypen Störsprache (informationell) und CCITTRauschen (energetisch) zeigte sich, dass für alle Altersgruppen die Sprachverständnisschwelle für nicht räumlich getrennte Schallquellen am höchsten war. In dieser Kondition war der informationelle Maskierungseffekt ausgeprägter als der energetische. Die räumliche Trennung von Nutz- und Störsignal führte für beide Maskertypen zu einer Verbesserung der Sprachverständnisschwelle, wobei hier der energetische Maskierungseffekt überwog. Der größte Gewinn trat schon beim kleinsten Trennungswinkel (22,5° ) auf. Während die Absolutlage der Sprachverständnisschwelle altersabhängig signifikant variierte, profitierten alle Probanden in gleichem Maße von der räumlichen Trennung. Im Lokalisationsexperiment war der mittlere absolute Fehler unabhängig vom Stimulustyp relativ gering. Relevanter Einflussfaktor war nur die Lautsprecherposition, mit einer Varianzaufklärung von 12 %. Für alle Altersgruppen waren Stimuli aus den äußeren beiden Lautsprechern am schwierigsten zu lokalisieren. Während Probanden bis 59 Jahre Stimuli aus den zentralen Lautsprechern nahezu perfekt zuordnen konnten, stieg die Fehlerhäufigkeit in den beiden ältesten Probandengruppen an. Es konnte nur eine zwar signifikante, aber praktisch nicht bedeutsame (r < 0,5) Korrelation zwischen Lokalisationsfähigkeit von Sprache und Sprachverständnis in Gegenwart von Störsprache festgestellt werden. Für das Störsignal CCITT-Rauschen war die Korrelation noch geringer. Die exakte räumliche Wahrnehmung einer Schallquelle spielt demnach für das Sprachverständnis im Störgeräusch eine Rolle, kann die von älteren Patienten beschriebenen Defizite jedoch nicht vollständig erklären.
Der im klinischen Alltag gebräuchlichste Sprachverständnistest ist der von Hahlbrock 1953 entwickelte Freiburger Sprachtest. Dieser Sprachtest steht allerdings wegen einer Vielzahl bestehender Mängel in der Kritik. Um einen neuen Sprachtest zur Verfügung stellen zu können, der diesen Kritikpunkten standhält, hatte Mahfoud (2009) einen Großteil der in Deutschland gebräuchlichen Einsilber mit modernen digitalen Geräten mit Hilfe eines semiprofessionellen Sprechers (Dipl.-Ing. S. Brill) aufgenommen. In dieser Arbeit wurden die 378 Wörter, die die Schnittmenge der beiden Aufnahmen des Freiburger Einsilberverständnistests von 1968 und 1976 bilden, in den drei Aufsprachevarianten an vier Probanden evaluiert. Dabei hatten sich Sprachverständlichkeitsschwellen (SRTs) von -3,75 dB (1968), -5,8 dB (1976) und -8,54 dB (M-2007) ergeben. Es hatte sich also gezeigt, dass das neu aufgenommene Sprachmaterial wesentlich besser verstanden wird als die Aufnahmen von 1968 und 1976. Mahfoud hatte die Grundlagen für einen neuen Sprachtests geschaffen. Diese wurden ausgebaut, indem die Aufnahmen der ausgewählten Wörter vervollständigt, die Qualität des gesamten Materials überprüft und gegebenenfalls verbessert wurde. Ziel der vorliegenden Arbeit war die Erzeugung eines Einsilber-Sprachtests mit ausgeglichener durchschnittlicher Verständlichkeit der Wortlisten. Die Evaluierung erfolgte mit einer homogenen Gruppe 20 normalhörender, junger Erwachsener. Um in einen empfindlichen Messbereich zu gelangen, wurden die WAV-Dateien nach Lautheitsabgleich aller Sprachsignale anhand des Maximums des SPL-Zeitverlaufs, mit einem CCITT-Rauschen von -8 dB belegt. Jeder der Probanden hörte alle 1554 Wörter in jeweils unterschiedlicher Reihenfolge ab und gab später Auskunft, ob er die Wörter und ihre Bedeutung kannte. Die Ergebnisse wurden mit Hilfe eines Programms, das in der Statistik- Programmiersprache "R" erstellt wurde, ausgewertet. So konnte nicht nur der Schwierigkeitsgrad aller 1554 Einsilber ermittelt werden, sondern auch der Bekanntheitsgrad jedes einzelnen Wortes. Ebenso konnten die Wortstrukturen, die Hauptvokale und deren Länge, die Anzahl der Lehnwörter und die Information, ob die betreffenden Wörter auch in den jeweiligen Aufnahmen des Freiburger Sprachverständnistests enthalten gewesen waren, mit einbezogen werden. Diese Worteigenschaften wurden für die Zuordnung der Wörter in Listen verwendet. Das wichtigste Kriterium war dabei der Schwierigkeitsgrad der Wörter. So konnte automatisiert eine zufällige initiale Verteilung der Wörter auf möglichst viele Listen und eine anschließende Harmonisierung der Listen in Bezug auf deren Schwierigkeitsgrad vorgenommen werden. Es wurden vier verschiedene Methoden der Zuordnung implementiert, die sich als unterschiedlich leistungsfähig erwiesen. Das bezüglich der Homogenität der Listen beste Resultat bestand aus 57 Listen mit einem MAD-Wert der Schwierigkeitsgrade von 0,00371 und einem Median der Verständlichkeit von 48,50 %. Das bezüglich der Anzahl günstigste Resultat bestand aus 61 Listen mit einem MAD-Wert von 0,01853 und einem Median von 47,25 %. Das Geschlecht der Probanden hatte keine Auswirkungen auf das Sprachverständnis, ebenso konnte keine Abhängigkeit von der Vokallänge und von der Zeitposition im Testverlauf nachgewiesen werden. Die Eigenschaften Wortstruktur, Zentralvokal, Sprachherkunft und Bekanntheitsgrad erwiesen sich jedoch als statistisch signifikante Einflussfaktoren. Damit ist die Grundlage eines neuen Sprachtests entstanden, der für Forschungszwecke mit Normalhörenden geeignet ist. Für die Verwendung mit hörgeschädigten Probanden ist jedoch eine weitere Evaluierung wünschenswert.
Einseitig ertaubte Menschen tun sich mit dem Sprachverständnsis im Störgeräusch allgemein sehr viel schwerer als binaural hörende Menschen. Zur Verbesserung der Situation dieser Menschen ist es daher notwendig, zu erforschen, wie diesem Handicap beizukommen ist. Dazu will diese Arbeit beitragen. In der Dissertation wurde der Einfluß des Einfallswinkels eines Störgeräusches auf das Sprachverständnis monaural hörender Probanden getestet. Dazu wurden 15 normalhörende Testpersonen im Alter zwischen 20 und 30 Jahren einem modifiziertem Sprachverständlichkeitstest (Freiburger Einsilber-Test in der Fassung von 1968) im Störgeräusch unterzogen. Im Rahmen der Vorversuche wurden mittels eines Head and Torso Simulators (HATS), welcher mit der individuell gefertigten rechten Außenohrmuschel eines jeden Probanden bestückt wurde, die 395 Testwörter aufgezeichnet. Diese einsilbigen Testwörter, welche aus einem frontal zum HATS ausgerichteten Lautsprecher kamen, wurden von einem CCITT-Rauschen überlagert, das aus 5 verschiedenen Winkeln ( 0°, 45°, 90°, 135° und 180° gemessen zum Frontlautsprecher) abgegeben wurde. Die aufgezeichneten Signale wurden dem jeweiligen Probanden in ebenfalls monauraler Hörkondition auf dem zu testenden rechten Ohr angeboten. Die Aufgabe der Testperson bestand darin, das verstandene Testwort laut wiederzugeben. Dieses wurde im Falle der Richtigkeit auf einer speziell für diesen Probanden gefertigten Liste abgehakt. In der statistischen Auswertung konnte die 180° -Winkelposition als die Testsituation mit dem besten Sprachverständnis festgehalten werden. Als ungünstigste Testkondition stellte sich der 45° -Störgeräuscheinfallswinkel heraus. Jedoch besteht eine gewisse Varianz bei den Testpersonen in den Hörkonditionen 45° und 90°. Diese Varianz ist wohl auf die anatomische Individualität des einzelnen Probanden zurückzuführen. Der Faktor Zeit, also die Dauer des Testdurchlaufs, spielte keine nennenswerte Rolle. Andererseits ließ sich eine durchaus signifikante Schwankung im Sprachverständis zwischen den einzelnen Testpersonen feststellen.
Die Wahrnehmung prosodischer Merkmale geht über die reine Semantik des Sprachverstehens hinaus und beeinflusst maßgeblich die Lebensqualität von Personen mit Hörstörungen oder Hörhilfen, die in der Prosodieperzeption eingeschränkt sind. Zur Untersuchung der Wahrnehmung prosodischer Aspekte liegt derzeit im deutschsprachigen Raum kein adäquates Testinstrumentarium vor. Aufbauend auf der Vorgängerarbeit von Bauer (2005) wurde der bereits bestehende Prosodietest weiterentwickelt und an einer größeren Anzahl Normalhörender, die bei späteren Tests mit Hörhilfeträgern als Vergleichsgruppe fungieren sollen, auf sein Eignungspotential untersucht. Der Prosodietest besteht aus zwei unterschiedlichen Testarten (Sprecher- und Kategorientest), die verschiedene prosodische Merkmale abdecken. Beim Sprechertest sollen die drei Sprecher Mann, Frau und Kind erkannt werden, deren Unterscheidbarkeit auf den entsprechenden Tonhöhen (Grundfrequenzen) beruht. Der Kategorientest zielt auf die Erkennung von Grundfrequenzverläufen sowie Akzenten ab, die typischerweise bei den dargebotenen Kategorien Aussage, Frage und Ausruf unterschiedlich ausgeprägt sind. Das Testmaterial wurde in Form von fünf Listen pro Testart mit jeweils 36 Sätzen präsentiert, wobei die Sätze für die jeweiligen Kategorien sowie Sprecher syntaktisch und grammatisch identisch sind. Auf diese Weise wird ausschließlich das Prosodieverständnis abgefragt. Es wurden 30 junge Erwachsene im Alter zwischen 20 und 30 Jahren ausgewählt und deren Normalhörigkeit mittels eines Tonaudiogramms festgestellt. Durch Überlagerung der Testsätze mit einem Störgeräusch in verschiedenen Lautstärken wurden unterschiedliche Schwierigkeitsstufen geschaffen. Zur Anwendung kam ein CCITT-Rauschen, das nach Vorversuchen zur Einschätzung der Prosodieperzeption Normalhörender, in den sechs Hörkonditionen 0 dB SNR, -6 dB SNR, -12 dB SNR, -18 dB SNR und -24 dB SNR verwendet wurde. Als leichter Übungsdurchlauf wurde zusätzlich die Hörkondition +6 dB SNR dargeboten. Um möglichst gleiche Bedingungen für alle Versuchsteilnehmer zu schaffen und unerwünschte Einflussfaktoren so gering wie möglich zu halten, wurde bei der Konzeption des Tests das Verfahren der permutierten Blockrandomisierung angewendet. Des weiteren erhielten alle Probanden die gleiche schriftliche Instruktion. Erwartungsgemäß lagen die Ergebnisse der Probanden im Bereich zwischen der 33,3 %-Marke des reinen Ratens und der 100 %-Grenze der maximalen Leistung. Die Ergebnisse zeigten bei der Darstellung der Gesamtdaten relativ geringe Streuungen der logistischen Regressionen der einzelnen Probanden sowie deutliche Wendepunkte. Dies spricht für eine hohe Sensitivität des Tests. Der Wendepunkt lag beim Sprechertest bei -14,72 dB SNR, beim Kategorientest bei -11,65 dB SNR, wodurch dieser Test als schwieriger einzustufen ist. Die Anzahl der Verwechslungen von Urteilen stieg vom leichten bis in den schwierigen Hörbereich kontinuierlich an, wobei eine wachsende Ungleichmäßigkeit in der Verteilung der Urteile auffiel. Bei totalem Raten der Versuchsteilnehmer existierte bei den Sprechern für den Mann eine Ratewahrscheinlichkeit von 50,3 %, für die Frau von 31,9 % und für das Kind von nur 17,8 %. Im Kategorientest wurden für die Aussage 45,7 %, für die Frage 23,1% und für den Ausruf 31,2% ermittelt. Bei der satzweisen Auswertung des Tests fielen insbesondere beim Kategorientest einige „Satzausreißer“ auf, die geringgradige Abweichungen vom Gesamtdatensatz darstellten und als Interpretationsfehler angesehen werden müssen. Beim Kategorientest stellten vor allem die Sätze Nr. 3, Nr. 21, Nr. 22 und Nr. 25 Negativausreißer sowie Nr. 15 einen extrem gut erkannten Satz dar, während beim Sprechertest die Sätze Nr. 5, Nr. 14 und Nr. 30 etwas weniger gute Erkennungsraten aufwiesen. Durch die Evaluation des Prosodietests mit normalhörenden Probanden hat sich gezeigt, dass dieser Test das Potential besitzt, brauchbare und umfassende Informationen über die Erfassbarkeit der Prosodie zu erzielen. Um den in dieser Arbeit weiterentwickelten und evaluierten Test in einen Test für die klinische Praxis zu überführen, sind nur noch wenige Arbeitsschritte nötig. Es müssten lediglich die weiter oben genannten „Satzausreißer“ unter Beachtung der in Kapitel 5 aufgeführten Gesichtspunkte entfernt oder durch neue Sätze ersetzt werden (s. Anhang D), bevor der Test zum Einsatz gebracht werden kann.
Der Freiburger Einsilbersprachverständnistest weist einige Mängel auf, die seit vielen Jahren bekannt und in der Literatur beschrieben sind. Im Rahmen dieser Dissertation wurde eine Basis geschaffen, um diese Mängel zu beheben. Zunächst wurden möglichst viele Einsilber der deutschen Sprache zusammengetragen und durch eine Vorauswahl auf 1526 reduziert. Zur Verbesserung der Aufnahmequalität im Vergleich zu derjenigen von 1968 und 1976 kamen professionelle digitale Aufnahmegeräte zum Einsatz, deren Aufstellung in Vorversuchen systematisch optimiert wurde. Die Sprachaufnahmen wurden von einem Sprecher (Dipl.-Ing. Stefan Brill) und einer Sprecherin (Maria Mahfoud, Verfasserin dieser Dissertation) ausgeführt. Bei der Evaluierung der neuen Aufsprachen beschränkten wir uns auf die Schnittmenge der Freiburger Aufsprachen von 1968 und 1976. Der Aufsprachenvergleich dieser 378 Einsilber in den vier verschiedenen Fassungen 1968, 1976, 2007 mit männlicher Stimme und 2007 mit weiblicher Stimme erbrachte Aussagen über die Qualität der neuen in Bezug auf die alten Aufnahmen. Dies geschah im Rahmen einer Untersuchung an normalhörenden Probanden. Normalhörende verstehen Sprache ohne Störgeräusch in der Regel problemlos, sodass mit nahezu perfektem Wortverständnis gerechnet werden muss. Der Vergleich der Aufsprachen wäre so nicht möglich. Daher wurde das Wortverständnis erschwert, indem die Aufsprachen mit einem unterschiedlich starken Störgeräusch in Form eines CCITT-Rauschens überlagert wurden. Die Variation des Rauschpegels erlaubte es außerdem, die Verstehbarkeitseinbuße der Aufsprachen in Abhängigkeit vom Störgeräusch zu erfassen und zu vergleichen. Der Bereich der Variation wurde mithilfe einer vorgeschalteten Pilotstudie auf 0 dB bis -16 dB (SNR) festgelegt. Dadurch wurde ein Verständlichkeitsbereich von 5,5 % im schwersten bis 94,4 % im leichtesten Fall abgedeckt. Das Auftreteten von Randeffekten konnte somit vermieden werden. Die Sprachstimuli wurden den Probanden in einem genau auf die Fragestellung abgestimmten Reihenfolge- und Zuordnungsschema vorgespielt. Dabei wurde darauf geachtet, dass jeder Proband die gleiche Anzahl an Einsilbern aus den vier verschiedenen Aufsprachen hörte. Die Sprachverständlichkeitsschwellen ("speech reception threshold", SRT) betrugen -3,75 dB (1968), -5,80 dB (1976), -8,54 dB (2007M) und -7,59 dB (2007W). Im paarweisen Vergleich mit dem McNemar-Test erwiesen sich alle Aufsprachen mit Ausnahme des Paares 2007M - 2007W als statistisch signifikant unterschiedlich. Die Ergebnisse zeigen, dass die Verständlichkeit der Neuaufsprachen besser ist als diejenige der Aufsprachen von 1968 und 1976. Dies wurde besonders im Kontrast zu der Aufsprache von 1968 deutlich. Die Aufsprachen der 1526 Einsilber und die Evaluierung der ersten 378 Einsilber an Normalhörenden sind Grundsteine für die Erörterung sinnvoller Veränderungen am Einsilbersprachverständnistest. Solche Veränderungen könnten in der Bildung neuer Listen bestehen, innerhalb derer u. a. auf Phonemverteilungen, die Art und Weise der Zusammenstellung der Wörter und einen neuen Ablauf des Prüfungssystems geachtet werden sollte. Außerdem ermöglichen die Erkenntnisse dieser Dissertation eine Verbesserung des Vorgehens im Rahmen weiterführender Untersuchungen. Das Ziel ist ein Test, der den neuen technischen Möglichkeiten entspricht und bisherigen Kritikpunkten standhält.