@phdthesis{Molnar2010,
  author    = {Moln{\´a}r, Josef},
  title     = {Studien zur Aufbereitung und Auswertung von Korpustexten},
  isbn      = {978-3-923959-76-1},
  doi       = {10.25972/OPUS-4852},
  url       = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-56971},
  school      = {Universit{\"a}t W{\"u}rzburg},
  year      = {2010},
  abstract  = {Die vorliegende Arbeit besch{\"a}ftigt sich mit dem Sprachkorpus aus zwei Blickwinkeln. Im technischen Teil handelt es sich um die Aufbereitung der Texte f{\"u}r das deutsch-tschechische Korpus DeuCze. Es wird hier der Vorgang von der Digitalisierung der B{\"u}cher bis zum Erstellen der wohlgeformten und validen XML-Dateien beschrieben. Diese Dateien sind bis zur Satzebene segmentiert und erm{\"o}glichen auf diese Weise die parallele Anzeige der Texte der beiden verglichenen Sprachen nach einzelnen Segmenten. Im analytischen Teil wird die Aufmerksamkeit der sprachlichen Analyse des Ph{\"a}nomens der Themaentwicklung innerhalb eines ausgew{\"a}hlten Textes gewidmet. Das Ziel sind also sowohl die aufbereiteten Dateien f{\"u}r das genannte Korpus als auch die Analyse der Teilthemaentwicklung.},
  subject      = {Deutsch},
  language  = {de}
}