Refine
Has Fulltext
- yes (2) (remove)
Is part of the Bibliography
- yes (2)
Year of publication
- 2014 (2) (remove)
Document Type
- Master Thesis (2) (remove)
Language
- German (2)
Keywords
- Frakturschrift (1)
- Grammatik (1)
- Interferenzen (1)
- Kinder im Vorschulbereich (1)
- Klassifikation (1)
- OCR (1)
- Optische Zeichenerkennung (1)
- Präpositionen (1)
- Russian-German (1)
- Russisch-Deutsch (1)
Institute
Zahlreiche Digitalisierungsprojekte machen das Wissen vergangener Jahrhunderte jederzeit verfügbar. Das volle Potenzial der Digitalisierung von Dokumenten entfaltet sich jedoch erst, wenn diese als durchsuchbare Volltexte verfügbar gemacht werden. Mithilfe von OCR-Software kann die Erfassung weitestgehend automatisiert werden. Fraktur war ab dem 16. Jahrhundert bis zur Mitte des 20. Jahrhunderts die verbreitete Schrift des deutschen Sprachraums. Durch einige Besonderheiten von Fraktur bleiben die Erkennungsraten bei Frakturtexten aber meist deutlich hinter den Erkennungsergebnissen bei Antiquatexten zurück.
Diese Arbeit konzentriert sich auf die Verbesserung der Erkennungsergebnisse der OCR-Software Tesseract bei Frakturtexten. Dazu wurden die Software und bestehende Sprachpakete gesondert auf die Eigenschaften von Fraktur hin analysiert. Durch spezielles Training und Anpassungen an der Software wurde anschließend versucht, die Ergebnisse zu verbessern und Erkenntnisse über die Effektivität verschiedener Ansätze zu gewinnen.
Die Zeichenfehlerraten konnten durch verschiedene Experimente von zuvor 2,5 Prozent auf 1,85 Prozent gesenkt werden. Außerdem werden Werkzeuge vorgestellt, die das Training neuer Schriftarten für Tesseract erleichtern und eine Evaluation der erzielten Verbesserungen ermöglichen.
Die sprachlichen Fähigkeiten der Kinder im Vorschulbereich sind eine wichtige Voraussetzung für den späteren Erfolg in der Schule. Während die Sprachfähigkeiten der monolingualen Kinder bis zum Einschulungsalter in der Regel altersgemäß entwickelt sind, können sich bei bilingual aufwachsenden Kindern Probleme unterschiedlicher Ausprägung abzeichnen. Im Rahmen einer empirischen Studie werden die Sprachfähigkeiten von jeweils 8 monolingual deutsch und bilingual russisch-deutsch aufwachsenden Kindern im Alter von 4 bis 6 Jahren untersucht. Die Arbeit befasst sich mit der Frage nach dem Sprachentwicklungsstand der bilingualen gegenüber dem der monolingualen Kinder und mit der Frage nach dem gegenseitigen Verhältnis der beiden Sprachen der bilingualen Kinder. Im Vordergrund stehen dabei die Sprachkompetenzen der Kinder im morphosyntaktischen Bereich und im Bereich der statischen Lokalisierung. Die Analyse der anhand von Elizitierungsmethoden erhobenen Sprachdaten hinsichtlich der Wortstellung, der Formen und Stellung des Verbs, der Subjekt-Verb-Kongruenz, der Verbindung von Sätzen und der irregulären Verben zeigt, dass sich die mono- und bilingualen Kinder auf einem vergleichbaren Niveau befinden. Dieses Ergebnis bestätigt die zusätzlich durchgeführte Wortschatzanalyse. In Bezug auf die Lokalisierung zeigen sich sowohl Gemeinsamkeiten als auch Unterschiede. Hervorzuheben ist, dass die Relation AN den bilingualen Kindern erhebliche Probleme bereitete. Insgesamt liegt die Substitutionsrate der Präpositionen bei ihnen wesentlich höher als bei den monolingualen Kindern. Der Vergleich der Sprachentwicklung im Russisch und im Deutsch der bilingualen Kinder hat deutliche Differenzen in der Beherrschung der beiden Sprachen ergeben. Sie reichen von relativ ausgewogener Zweisprachigkeit über leichte bis starke Dominanz des Deutschen bis zu nahezu passiver Beherrschung der Muttersprache. Dabei zeigte sich, dass eine klare Trennung der Sprachen die bilinguale Sprachentwicklung positiv beeinflusst. Fehlt eine solche klare Trennung, kommt es zu Defiziten in der Erstsprachentwicklung, die sich zudem in Sprachmischungen und Transferelementen aus der Zweitsprache in die Erstsprache manifestieren.