Filtern
Volltext vorhanden
- ja (2)
Gehört zur Bibliographie
- ja (2)
Erscheinungsjahr
- 2015 (2)
Dokumenttyp
- Konferenzveröffentlichung (2) (entfernen)
Schlagworte
- Digital Humanities (2) (entfernen)
Institut
Sonstige beteiligte Institutionen
Eine wichtige Grundlage für die quantitative Analyse von Erzähltexten, etwa eine Netzwerkanalyse der Figurenkonstellation, ist die automatische Erkennung von Referenzen auf Figuren in Erzähltexten, ein Sonderfall des generischen NLP-Problems der Named Entity Recognition. Bestehende, auf Zeitungstexten trainierte Modelle sind für literarische Texte nur eingeschränkt brauchbar, da die Einbeziehung von Appellativen in die Named Entity-Definition und deren häufige Verwendung in Romantexten zu einem schlechten Ergebnis führt. Dieses Paper stellt eine anhand eines manuell annotierten Korpus auf deutschsprachige Romane des 19. Jahrhunderts angepasste NER-Komponente vor.
Based on the results of a 3-day workshop at the Brown University (2012) this white paper tries to sum up important topics and problems which came up in the presentations and discussions and to outline some general aspects of data modeling in digital humanities. Starting with an attempt to define data modeling it introduces distinctions like curation-driven vs. research-driven for a more general description of data modeling. The second part discusses specific problems and challenges of data modeling in the Humanities, while the third part outlines practical aspects, like the creation of data models or their evaluation.