@phdthesis{Molnar2010, author = {Moln{\´a}r, Josef}, title = {Studien zur Aufbereitung und Auswertung von Korpustexten}, isbn = {978-3-923959-76-1}, doi = {10.25972/OPUS-4852}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-56971}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2010}, abstract = {Die vorliegende Arbeit besch{\"a}ftigt sich mit dem Sprachkorpus aus zwei Blickwinkeln. Im technischen Teil handelt es sich um die Aufbereitung der Texte f{\"u}r das deutsch-tschechische Korpus DeuCze. Es wird hier der Vorgang von der Digitalisierung der B{\"u}cher bis zum Erstellen der wohlgeformten und validen XML-Dateien beschrieben. Diese Dateien sind bis zur Satzebene segmentiert und erm{\"o}glichen auf diese Weise die parallele Anzeige der Texte der beiden verglichenen Sprachen nach einzelnen Segmenten. Im analytischen Teil wird die Aufmerksamkeit der sprachlichen Analyse des Ph{\"a}nomens der Themaentwicklung innerhalb eines ausgew{\"a}hlten Textes gewidmet. Das Ziel sind also sowohl die aufbereiteten Dateien f{\"u}r das genannte Korpus als auch die Analyse der Teilthemaentwicklung.}, subject = {Deutsch}, language = {de} }