• Treffer 6 von 7
Zurück zur Trefferliste

Studien zur Aufbereitung und Auswertung von Korpustexten

Studies on processing and analysing of corpus texts

Zitieren Sie bitte immer diese URN: urn:nbn:de:bvb:20-opus-56971
  • Die vorliegende Arbeit beschäftigt sich mit dem Sprachkorpus aus zwei Blickwinkeln. Im technischen Teil handelt es sich um die Aufbereitung der Texte für das deutsch-tschechische Korpus DeuCze. Es wird hier der Vorgang von der Digitalisierung der Bücher bis zum Erstellen der wohlgeformten und validen XML-Dateien beschrieben. Diese Dateien sind bis zur Satzebene segmentiert und ermöglichen auf diese Weise die parallele Anzeige der Texte der beiden verglichenen Sprachen nach einzelnen Segmenten. Im analytischen Teil wird die Aufmerksamkeit derDie vorliegende Arbeit beschäftigt sich mit dem Sprachkorpus aus zwei Blickwinkeln. Im technischen Teil handelt es sich um die Aufbereitung der Texte für das deutsch-tschechische Korpus DeuCze. Es wird hier der Vorgang von der Digitalisierung der Bücher bis zum Erstellen der wohlgeformten und validen XML-Dateien beschrieben. Diese Dateien sind bis zur Satzebene segmentiert und ermöglichen auf diese Weise die parallele Anzeige der Texte der beiden verglichenen Sprachen nach einzelnen Segmenten. Im analytischen Teil wird die Aufmerksamkeit der sprachlichen Analyse des Phänomens der Themaentwicklung innerhalb eines ausgewählten Textes gewidmet. Das Ziel sind also sowohl die aufbereiteten Dateien für das genannte Korpus als auch die Analyse der Teilthemaentwicklung.zeige mehrzeige weniger
  • This dissertation examines a linguistic corpus from two points of view. The technical part deals with the processing of the texts for the German-Czech DeuCze corpus, and describes the way to process the texts from digitalisation to well-formed and valid XML files. The files are segmented onto the sentence level, due to which it is possible to display the corpus text of the two languages segment-by-segment. In the analytical part the attention is focused on the linguistic analysis of the phenomenon of the part-theme development inside theThis dissertation examines a linguistic corpus from two points of view. The technical part deals with the processing of the texts for the German-Czech DeuCze corpus, and describes the way to process the texts from digitalisation to well-formed and valid XML files. The files are segmented onto the sentence level, due to which it is possible to display the corpus text of the two languages segment-by-segment. In the analytical part the attention is focused on the linguistic analysis of the phenomenon of the part-theme development inside the selected text. The outcome of the dissertation are the processed files of the above mentioned corpus as well as the analysis of the part-theme development in the text.zeige mehrzeige weniger

Volltext Dateien herunterladen

Metadaten exportieren

Weitere Dienste

Teilen auf Twitter Suche bei Google Scholar Statistik - Anzahl der Zugriffe auf das Dokument
Metadaten
Autor(en): Josef Molnár
URN:urn:nbn:de:bvb:20-opus-56971
Dokumentart:Dissertation
Titelverleihende Fakultät:Universität Würzburg, Philosophische Fakultät (Histor., philolog., Kultur- und geograph. Wissensch.)
Institute der Universität:Philosophische Fakultät (Histor., philolog., Kultur- und geograph. Wissensch.) / Institut für deutsche Philologie
Datum der Abschlussprüfung:20.09.2010
Sprache der Veröffentlichung:Deutsch
Erscheinungsjahr:2010
Schriftenreihe (Bandnummer):DeuCze. Korpuslinguistik Deutsch-Tschechisch kontrastiv (2)
ISBN:978-3-923959-76-1
DOI:https://doi.org/10.25972/OPUS-4852
Allgemeine fachliche Zuordnung (DDC-Klassifikation):4 Sprache / 43 Deutsch, germanische Sprachen allgemein / 430 Germanische Sprachen; Deutsch
Normierte Schlagworte (GND):Deutsch; Tschechisch; Korpus <Linguistik>; Kontrastive Linguistik
Freie Schlagwort(e):Analyse; DeuCze-Korpus; Korpustext; Parallelkorpus; Sprachkorpus; Teilthemaentwicklung; Text; Textaufbereitung; Thema
DeuCze corpus; analysis; corpus text; parallel corpus; processing of corpus texts; progression of part-theme; text; text theme
Datum der Freischaltung:15.06.2011
Betreuer:Prof. Dr.) Lenka ( Vaňková, Prof. Dr. Wolf Peter Klein
Lizenz (Deutsch):License LogoCC BY-NC-ND: Creative-Commons-Lizenz: Namensnennung, Nicht kommerziell, Keine Bearbeitung