@misc{Reger2016, type = {Master Thesis}, author = {Reger, Isabella}, title = {Figurennetzwerke als {\"A}hnlichkeitsmaß}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-149106}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2016}, abstract = {Die vorliegende Arbeit l{\"a}sst sich dem Bereich der quantitativen Literaturanalyse zuordnen und verfolgt das Ziel, mittels computergest{\"u}tzter Verfahren zu untersuchen, inwieweit sich Romane hinsichtlich ihrer Figurenkonstellation {\"a}hneln. Dazu wird die Figurenkonstellation, als wichtiges strukturgebendes Ordnungsprinzip eines Romans, als soziales Netzwerk der Figuren operationalisiert. Solche Netzwerke k{\"o}nnen unter Anwendung von Verfahren des Natural Language Processing automatisch aus dem Text erstellt werden. Als Datengrundlage dient ein Korpus von deutschsprachigen Romanen aus dem 19. Jahrhundert, das mit automatischen Verfahren zur Figurenerkennung und Koreferenzaufl{\"o}sung prozessiert und manuell nachkorrigiert wurde, um eine m{\"o}glichst saubere Datenbasis zu schaffen. Ausgehend von der intensiven vergleichenden Betrachtung der Figurenkonstellationen von Fontanes "Effi Briest" und Flauberts "Madame Bovary" wurde in einer manuell erstellten Distanzmatrix die menschliche Intuition solcher {\"A}hnlichkeit zwischen allen Romanen des Korpus festgehalten, basierend auf der Lekt{\"u}re von Zusammenfassungen der Romane. Diese Daten werden als Evaluationsgrundlage genutzt. Mit Hilfe von Methoden der sozialen Netzwerkanalyse k{\"o}nnen strukturelle Eigenschaften dieser Netzwerke als Features erhoben werden. Diese wurden anschließend zur Berechnung der Kosinusdistanz zwischen den Romanen verwendet. Obwohl die automatisch erstellten Netzwerke die Figurenkonstellationen der Romane im Allgemeinen gut widerspiegeln und die Netzwerkfeatures sinnvoll interpretierbar sind, war die Korrelation mit der Evaluationsgrundlage niedrig. Dies legt die Vermutung nahe, dass neben der Struktur der Figurenkonstellation auch wiederkehrende Themen und Motive die Erstellung der Evaluationsgrundlage unterbewusst beeinflusst haben. Daher wurde Topic Modeling angewendet, um wichtige zwischenmenschliche Motive zu modellieren, die f{\"u}r die Figurenkonstellation von Bedeutung sein k{\"o}nnen. Die Netzwerkfeatures und die Topic-Verteilung wurden in Kombination zur Distanzberechnung herangezogen. Außerdem wurde versucht, jeder Kante des Figurennetzwerks ein Topic zuzuordnen, das diese Kante inhaltlich beschreibt. Hier zeigte sich, dass einerseits Topics, die sehr spezifisch f{\"u}r bestimmte Texte sind, und andererseits Topics, die {\"u}ber alle Texte hinweg stark vertreten sind, das Ergebnis bestimmen, sodass wiederum keine, bzw. nur eine sehr schwache Korrelation mit der Evaluationsgrundlage gefunden werden konnte. Der Umstand, dass keine Verbindung zwischen den berechneten Distanzen und der Evaluationsgrundlage gefunden werden konnte, obwohl die einzelnen Features sinnvoll interpretierbar sind, l{\"a}sst Zweifel an der Evaluationsmatrix aufkommen. Diese scheint st{\"a}rker als zu Beginn angenommen unterbewusst von thematischen und motivischen {\"A}hnlichkeiten zwischen den Romanen beeinflusst zu sein. Auch die Qualit{\"a}t der jeweiligen Zusammenfassung hat hier einen nicht unwesentlichen Einfluss. Daher w{\"a}re eine weniger subjektiv gepr{\"a}gte M{\"o}glichkeit der Auswertung von N{\"o}ten, beispielsweise durch die parallele Einsch{\"a}tzung mehrerer Annotatoren. Auch die weitere Verbesserung von NLP-Verfahren f{\"u}r literarische Texte in deutscher Sprache ist ein Desideratum f{\"u}r ankn{\"u}pfende Forschungsans{\"a}tze.}, subject = {Digital Humanities}, language = {de} } @article{Schmidt2016, author = {Schmidt, Hans-G{\"u}nter}, title = {Kallimachos: Digital Humanities als Auftrag der Universit{\"a}tsbibliothek W{\"u}rzburg}, series = {ABI Technik}, volume = {36}, journal = {ABI Technik}, number = {3}, issn = {2191-4664}, doi = {10.1515/abitech-2016-0035}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-194011}, pages = {170-177}, year = {2016}, abstract = {KALLIMACHOS baut an der Universit{\"a}tsbibliothek W{\"u}rzburg ein Digital-Humanitites-Zentrum mit den Arbeitsschwerpunkten OCR, digitale Edition, Textmining und quantitative Analyse auf. Das Zentrum bietet eine technische und soziale Infrastruktur, die Geisteswissenschaftler bei der Beantwortung von Forschungsfragen unterst{\"u}tzt und innovative Werkzeuge, Methoden, prototypische Arbeitsabl{\"a}ufe und Dienste entwickelt. In sechs Beispielprojekten aus Papyrologie, Geschichte, Philologie, Philosophie und P{\"a}dagogik werden die Neuentwicklungen erprobt, die Fruchtbarkeit der neuen Verfahren vermittelt und Bausteine f{\"u}r ein k{\"u}nftiges Forschungsdatenmanagement geschaffen. Das BMBF unterst{\"u}tzt den Aufbau des Zentrums bis Ende 2017 im Rahmen der F{\"o}rderlinie „eHumanities".}, language = {de} } @article{Schoech2016, author = {Sch{\"o}ch, Christof}, title = {Ein digitales Textformat f{\"u}r die Literaturwissenschaften. Die Richtlinien der Text Encoding Initiative und ihr Nutzen f{\"u}r Textedition und Textanalyse}, series = {Romanische Studien}, volume = {4}, journal = {Romanische Studien}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-171351}, pages = {325-364}, year = {2016}, abstract = {Die stetig voranschreitende Digitalisierung literarischer Texte verschiedenster Sprachen, Epochen und Gattungen stellt die Literaturwissenschaften immer wieder vor die Frage, wie sie diese Entwicklung mitgestalten und zu ihrem Vorteil nutzen k{\"o}nnen. Dabei ist digital nicht gleich digital, sondern es existiert eine Vielzahl sehr unterschiedlicher, digitaler Repr{\"a}sentationsformen von Text. Nur wenige dieser Repr{\"a}sentationsformen werden literaturwissenschaftlichen Anforderungen tats{\"a}chlich gerecht, darunter diejenige, die den Richtlinien der Text Encoding Initiative folgt. Der vorliegende Beitrag vergleicht zun{\"a}chst einige derzeit g{\"a}ngige digitale Repr{\"a}sentationsformen von Text. F{\"u}r literaturwissenschaftliche Forschung besonders geeignet erweist sich hierbei eine Repr{\"a}sentationsform, die den Richtlinien der Text Encoding Initiative folgt. Daher informiert der Beitrag anschließend {\"u}ber deren Nutzen f{\"u}r die literaturwissenschaftliche Arbeit, sowohl im Bereich der wissenschaftlichen Textedition als auch im Bereich der Analyse und Interpretation von Texten. Nur wenn die Literaturwissenschaften in ihrer Breite den Nutzen von offenen, expressiven, flexiblen und standardisierten, langfristig nutzbaren Formaten f{\"u}r die Forschung erkennen, k{\"o}nnen sie sich mit dem erforderlichen Nachdruck f{\"u}r deren Verbreitung einsetzen und durch die zunehmende Verf{\"u}gbarkeit von Texten in solchen Formaten f{\"u}r die eigene Forschung und Lehre davon profitieren.}, language = {de} }