TY - THES A1 - Henny-Krahmer, Ulrike T1 - Genre Analysis and Corpus Design: Nineteenth Century Spanish-American Novels (1830–1910) T1 - Gattungsanalyse und Korpusaufbau: Hispanoamerikanische Romane im 19. Jahrhundert (1830–1910) T1 - Análisis de género y diseño de corpus: Novelas hispanoamericanas del siglo XIX (1830–1910) N2 - This work in the field of digital literary stylistics and computational literary studies is concerned with theoretical concerns of literary genre, with the design of a corpus of nineteenth-century Spanish-American novels, and with its empirical analysis in terms of subgenres of the novel. The digital text corpus consists of 256 Argentine, Cuban, and Mexican novels from the period between 1830 and 1910. It has been created with the goal to analyze thematic subgenres and literary currents that were represented in numerous novels in the nineteenth century by means of computational text categorization methods. The texts have been gathered from different sources, encoded in the standard of the Text Encoding Initiative (TEI), and enriched with detailed bibliographic and subgenre-related metadata, as well as with structural information. To categorize the texts, statistical classification and a family resemblance analysis relying on network analysis are used with the aim to examine how the subgenres, which are understood as communicative, conventional phenomena, can be captured on the stylistic, textual level of the novels that participate in them. The result is that both thematic subgenres and literary currents are textually coherent to degrees of 70–90 %, depending on the individual subgenre constellation, meaning that the communicatively established subgenre classifications can be accurately captured to this extent in terms of textually defined classes. Besides the empirical focus, the dissertation also aims to relate literary theoretical genre concepts to the ones used in digital genre stylistics and computational literary studies as subfields of digital humanities. It is argued that literary text types, conventional literary genres, and textual literary genres should be distinguished on a theoretical level to improve the conceptualization of genre for digital text analysis. N2 - Diese Arbeit ist in den Forschungsfeldern der digitalen literaturwissenschaftlichen Stilistik und der Computational Literary Studies angesiedelt und setzt sich mit theoretischen Gattungsproblemen, mit der Erstellung eines Korpus von hispanoamerikanischen Romanen des 19. Jahrhunderts und mit ihrer empirischen Analyse nach Untergattungen auseinander. Das digitale Textkorpus umfasst 256 argentinische, kubanische und mexikanische Romane aus der Zeit von 1830 bis 1910 und ist mit dem Ziel erstellt worden, thematische Untergattungen und literarische Strömungen, die im 19. Jahrhundert durch zahlreiche Romane repräsentiert waren, mit Hilfe computergestützter Methoden der Textkategorisierung zu analysieren. Um die Texte zu kategorisieren werden Verfahren der statistischen Klassifikation und eine Familienähnlichkeitsanalyse verwendet, die auf einer Netzwerkanalyse basiert. Das Ziel der Analysen ist es zu untersuchen inwieweit die Untergattungen, die primär als Phänomene der Kommunikation und Konvention verstanden werden, auf der stilistischen, textlichen Ebene der Romane, die an ihnen teilhaben, erfasst werden können. Das Ergebnis ist, dass sowohl die thematischen Untergattungen als auch die literarischen Strömungen zu 70–90 % textlich kohärent sind, in Abhängigkeit der gewählten Untergattungskonstellation, womit gemeint ist, dass die kommunikativ etablierten Untergattungsklassifikationen in diesem Maß an Genauigkeit auch als textlich definierte Klassen erfasst werden können. Über die empirische Ausrichtung hinaus ist ein weiteres Ziel, literaturtheoretische Gattungskonzepte zu denjenigen in Beziehung zu setzen, die in der digitalen Gattungsstilistik als einer Teildisziplin der Digital Humanities verwendet werden. Es wird argumentiert, dass literarische Texttypen, konventionelle literarische Gattungen und textliche literarische Gattungen auf einer theoretischen Ebene unterschieden werden sollten, um die Konzeption von Gattung für die digitale Textanalyse zu verbessern. N2 - Este trabajo en el campo de la estilística literaria digital y los estudios literarios computacionales se ocupa de las preocupaciones teóricas del género literario, del diseño de un corpus de novelas hispanoamericanas del siglo XIX y de su análisis empírico en términos de subgéneros de la novela. El corpus de textos digitales consta de 256 novelas argentinas, cubanas y mexicanas del período comprendido entre 1830 y 1910. Ha sido creado con el objetivo de analizar los subgéneros temáticos y las corrientes literarias que estaban representadas en numerosas novelas del siglo XIX mediante métodos de categorización computacional de textos. Para la categorización de los textos se utiliza una clasificación estadística y un análisis de semejanza familiar basado en el análisis de redes, con el fin de examinar cómo los subgéneros, entendidos como fenómenos comunicativos y convencionales, pueden ser captados en el plano estilístico y textual de las novelas que participan en ellos. El resultado es que tanto los subgéneros temáticos como las corrientes literarias son textualmente coherentes en grados del 70–90 %, dependiendo de la constelación individual de subgéneros, lo que significa que las clasificaciones de subgéneros establecidas comunicativamente pueden ser capturadas con precisición hasta este punto en términos de clases textualmente definidas. Además del enfoque empírico, la disertación también pretende relacionar los conceptos teóricos de género literario con los utilizados en la estilística de género digital y los estudios literarios computacionales como subcampos de las humanidades digitales. Se argumenta que los tipos de texto literario, los géneros literarios convencionales y los géneros literarios textuales deberían distinguirse a nivel teórico para mejorar la conceptualización del género para el análisis de textos digitales. KW - Gattungstheorie KW - Roman KW - Hispanoamerikanisch KW - Digital Humanities KW - 19. Jahrhundert KW - Nineteenth Century KW - Text analysis KW - Textanalyse Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-319992 ER - TY - THES A1 - Weimer, Lukas Matthias T1 - Indirekte Figurencharakterisierung durch Formen der Redewiedergabe in realistischem Erzählen T1 - Indirect Characterization through Forms of Speech Representation in Realistic Narration N2 - Indirekte Charakterisierung trägt zu einem großen Teil zur Gesamtcharakteristik von Figuren bei, ist bisher aber dennoch vergleichsweise wenig erforscht. Diese Arbeit nähert sich dem Phänomen der indirekten Figurencharakterisierung durch eine eigene Explikation theoretisch an, nennt verschiedene Repräsentationsformen von indirekter Charakterisierung und führt die Theorie dann in Bezug auf Redewiedergabe anhand zahlreicher Beispiele aus. Der Untersuchung wird ein Korpus realistischer Erzähltexte zugrunde gelegt und darin manuell Formen der Redewiedergabe annotiert, um in einem späteren Schritt computergestützt einige Experimente mit den Annotationen durchzuführen. In ihrem Aufbau entspricht diese Arbeit dadurch einem Mixed-Methods-Design von qualitativer und quantitativer Literaturwissenschaft. N2 - Indirect characterization contributes to a large extent to the overall characterization of characters, but has nevertheless been studied comparatively little so far. This thesis addresses the phenomenon of indirect characterization theoretically through an own explication, names different forms of representation of indirect characterization, and then elaborates the theory in regard to speech representation on the basis of numerous examples. The study is based on a corpus of realistic narrative texts, in which forms of speech representation are manually annotated, in order to run some computational experiments with the annotations in a later step. In its design, this work thus follows a mixed-methods design of qualitative and quantitative literary studies. KW - Literaturwissenschaft KW - Literaturtheorie KW - Charakterisierung KW - Figur KW - Realismus KW - indirekte Figurencharakterisierung KW - Korpusstudie KW - Digital Humanities KW - Mixed-Methods KW - Redewiedergabe Y1 - 2022 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-292938 ER - TY - JOUR A1 - Schmidt, Hans-Günter T1 - Kallimachos: Digital Humanities als Auftrag der Universitätsbibliothek Würzburg T1 - Kallimachos: Digital humanities as a university library’s task in Würzburg JF - ABI Technik N2 - KALLIMACHOS baut an der Universitätsbibliothek Würzburg ein Digital-Humanitites-Zentrum mit den Arbeitsschwerpunkten OCR, digitale Edition, Textmining und quantitative Analyse auf. Das Zentrum bietet eine technische und soziale Infrastruktur, die Geisteswissenschaftler bei der Beantwortung von Forschungsfragen unterstützt und innovative Werkzeuge, Methoden, prototypische Arbeitsabläufe und Dienste entwickelt. In sechs Beispielprojekten aus Papyrologie, Geschichte, Philologie, Philosophie und Pädagogik werden die Neuentwicklungen erprobt, die Fruchtbarkeit der neuen Verfahren vermittelt und Bausteine für ein künftiges Forschungsdatenmanagement geschaffen. Das BMBF unterstützt den Aufbau des Zentrums bis Ende 2017 im Rahmen der Förderlinie „eHumanities“. N2 - Kallimachos is to set up the Würzburg Center for Digital Humanities. The new center with its special focus on OCR, digital edition, natural language processing, and text analytics will provide a technical and social infrastructure to support research in the humanities by offering a wide portfolio of digital services and by developing innovative tools, workflows, and digital methodologies for the entire process chain of text-oriented research. Six model projects from disciplines as diverse as papyrology, history, German, English, French, Latin and Ancient Greek philology, philosophy, and education illustrate the capability and usefulness of the project’s assets. Kallimachos is recipient of a grant from Germany’s Federal Ministry of Education and Research (line of funding “eHumanities”, 2014–2017). KW - Digitalisierung KW - Forschungsinfrastruktur KW - Digital Humanities KW - Digitization KW - Research Infrastructure KW - Digital Humanities Y1 - 2016 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-194011 SN - 2191-4664 SN - 0720-6763 N1 - Dieser Beitrag ist mit Zustimmung des Rechteinhabers aufgrund einer (DFG-geförderten) Allianz- bzw. Nationallizenz frei zugänglich. VL - 36 IS - 3 ER - TY - THES A1 - Krug, Markus T1 - Techniques for the Automatic Extraction of Character Networks in German Historic Novels T1 - Techniken zur automatischen Extraktion von Figurennetzwerken aus deutschen Romanen N2 - Recent advances in Natural Language Preprocessing (NLP) allow for a fully automatic extraction of character networks for an incoming text. These networks serve as a compact and easy to grasp representation of literary fiction. They offer an aggregated view of the text, which can be used during distant reading approaches for the analysis of literary hypotheses. In their core, the networks consist of nodes, which represent literary characters, and edges, which represent relations between characters. For an automatic extraction of such a network, the first step is the detection of the references of all fictional entities that are of importance for a text. References to the fictional entities appear in the form of names, noun phrases and pronouns and prior to this work, no components capable of automatic detection of character references were available. Existing tools are only capable of detecting proper nouns, a subset of all character references. When evaluated on the task of detecting proper nouns in the domain of literary fiction, they still underperform at an F1-score of just about 50%. This thesis uses techniques from the field of semi-supervised learning, such as Distant supervision and Generalized Expectations, and improves the results of an existing tool to about 82%, when evaluated on all three categories in literary fiction, but without the need for annotated data in the target domain. However, since this quality is still not sufficient, the decision to annotate DROC, a corpus comprising 90 fragments of German novels was made. This resulted in a new general purpose annotation environment titled as ATHEN, as well as annotated data that spans about 500.000 tokens in total. Using this data, the combination of supervised algorithms and a tailored rule based algorithm, which in combination are able to exploit both - local consistencies as well as global consistencies - yield an algorithm with an F1-score of about 93%. This component is referred to as the Kallimachos tagger. A character network can not directly display references however, instead they need to be clustered so that all references that belong to a real world or fictional entity are grouped together. This process widely known as coreference resolution is a hard problem in the focus of research for more than half a century. This work experimented with adaptations of classical feature based machine learning, with a dedicated rule based algorithm and with modern techniques of Deep Learning, but no approach can surpass 55% B-Cubed F1, when evaluated on DROC. Due to this barrier, many researchers do not use a fully-fledged coreference resolution when they extract character networks, but only focus on a more forgiving subset- the names. For novels such as Alice's Adventures in Wonderland by Lewis Caroll, this would however only result in a network in which many important characters are missing. In order to integrate important characters into the network that are not named by the author, this work makes use of automatic detection of speaker and addressees for direct speech utterances (all entities involved in a dialog are considered to be of importance). This problem is by itself not an easy task, however the most successful system analysed in this thesis is able to correctly determine the speaker to about 85% of the utterances as well as about 65% of the addressees. This speaker information can not only help to identify the most dominant characters, but also serves as a way to model the relations between entities. During the span of this work, components have been developed to model relations between characters using speaker attribution, using co-occurrences as well as by the usage of true interactions, for which yet again a dataset was annotated using ATHEN. Furthermore, since relations between characters are usually typed, a component for the extraction of a typed relation was developed. Similar to the experiments for the character reference detection, a combination of a rule based and a Maximum Entropy classifier yielded the best overall results, with the extraction of family relations showing a score of about 80% and the quality of love relations with a score of about 50%. For family relations, a kernel for a Support Vector Machine was developed that even exceeded the scores of the combined approach but is behind on the other labels. In addition, this work presents new ways to evaluate automatically extracted networks without the need of domain experts, instead it relies on the usage of expert summaries. It also refrains from the uses of social network analysis for the evaluation, but instead presents ranked evaluations using Precision@k and the Spearman Rank correlation coefficient for the evaluation of the nodes and edges of the network. An analysis using these metrics showed, that the central characters of a novel are contained with high probability but the quality drops rather fast if more than five entities are analyzed. The quality of the edges is mainly dominated by the quality of the coreference resolution and the correlation coefficient between gold edges and system edges therefore varies between 30 and 60%. All developed components are aggregated alongside a large set of other preprocessing modules in the Kallimachos pipeline and can be reused without any restrictions. N2 - Techniken zur automatischen Extraktion von Figurennetzwerken aus deutschen Romanen KW - Textanalyse KW - Character Networks KW - Coreference KW - Character Reference Detection KW - Relation Detection KW - Quotation Attribution KW - Netzwerkanalyse KW - Digital Humanities KW - Netzwerk Y1 - 2020 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-209186 ER - TY - JOUR A1 - Schöch, Christof T1 - Ein digitales Textformat für die Literaturwissenschaften. Die Richtlinien der Text Encoding Initiative und ihr Nutzen für Textedition und Textanalyse JF - Romanische Studien N2 - Die stetig voranschreitende Digitalisierung literarischer Texte verschiedenster Sprachen, Epochen und Gattungen stellt die Literaturwissenschaften immer wieder vor die Frage, wie sie diese Entwicklung mitgestalten und zu ihrem Vorteil nutzen können. Dabei ist digital nicht gleich digital, sondern es existiert eine Vielzahl sehr unterschiedlicher, digitaler Repräsentationsformen von Text. Nur wenige dieser Repräsentationsformen werden literaturwissenschaftlichen Anforderungen tatsächlich gerecht, darunter diejenige, die den Richtlinien der Text Encoding Initiative folgt. Der vorliegende Beitrag vergleicht zunächst einige derzeit gängige digitale Repräsentationsformen von Text. Für literaturwissenschaftliche Forschung besonders geeignet erweist sich hierbei eine Repräsentationsform, die den Richtlinien der Text Encoding Initiative folgt. Daher informiert der Beitrag anschließend über deren Nutzen für die literaturwissenschaftliche Arbeit, sowohl im Bereich der wissenschaftlichen Textedition als auch im Bereich der Analyse und Interpretation von Texten. Nur wenn die Literaturwissenschaften in ihrer Breite den Nutzen von offenen, expressiven, flexiblen und standardisierten, langfristig nutzbaren Formaten für die Forschung erkennen, können sie sich mit dem erforderlichen Nachdruck für deren Verbreitung einsetzen und durch die zunehmende Verfügbarkeit von Texten in solchen Formaten für die eigene Forschung und Lehre davon profitieren. KW - Digital Humanities KW - Text Encoding Initiative KW - Textedition KW - Textanalyse Y1 - 2016 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-171351 VL - 4 ER - TY - THES A1 - Reger, Isabella T1 - Figurennetzwerke als Ähnlichkeitsmaß T1 - Character networks as a measure of similarity N2 - Die vorliegende Arbeit lässt sich dem Bereich der quantitativen Literaturanalyse zuordnen und verfolgt das Ziel, mittels computergestützter Verfahren zu untersuchen, inwieweit sich Romane hinsichtlich ihrer Figurenkonstellation ähneln. Dazu wird die Figurenkonstellation, als wichtiges strukturgebendes Ordnungsprinzip eines Romans, als soziales Netzwerk der Figuren operationalisiert. Solche Netzwerke können unter Anwendung von Verfahren des Natural Language Processing automatisch aus dem Text erstellt werden. Als Datengrundlage dient ein Korpus von deutschsprachigen Romanen aus dem 19. Jahrhundert, das mit automatischen Verfahren zur Figurenerkennung und Koreferenzauflösung prozessiert und manuell nachkorrigiert wurde, um eine möglichst saubere Datenbasis zu schaffen. Ausgehend von der intensiven vergleichenden Betrachtung der Figurenkonstellationen von Fontanes "Effi Briest" und Flauberts "Madame Bovary" wurde in einer manuell erstellten Distanzmatrix die menschliche Intuition solcher Ähnlichkeit zwischen allen Romanen des Korpus festgehalten, basierend auf der Lektüre von Zusammenfassungen der Romane. Diese Daten werden als Evaluationsgrundlage genutzt. Mit Hilfe von Methoden der sozialen Netzwerkanalyse können strukturelle Eigenschaften dieser Netzwerke als Features erhoben werden. Diese wurden anschließend zur Berechnung der Kosinusdistanz zwischen den Romanen verwendet. Obwohl die automatisch erstellten Netzwerke die Figurenkonstellationen der Romane im Allgemeinen gut widerspiegeln und die Netzwerkfeatures sinnvoll interpretierbar sind, war die Korrelation mit der Evaluationsgrundlage niedrig. Dies legt die Vermutung nahe, dass neben der Struktur der Figurenkonstellation auch wiederkehrende Themen und Motive die Erstellung der Evaluationsgrundlage unterbewusst beeinflusst haben. Daher wurde Topic Modeling angewendet, um wichtige zwischenmenschliche Motive zu modellieren, die für die Figurenkonstellation von Bedeutung sein können. Die Netzwerkfeatures und die Topic-Verteilung wurden in Kombination zur Distanzberechnung herangezogen. Außerdem wurde versucht, jeder Kante des Figurennetzwerks ein Topic zuzuordnen, das diese Kante inhaltlich beschreibt. Hier zeigte sich, dass einerseits Topics, die sehr spezifisch für bestimmte Texte sind, und andererseits Topics, die über alle Texte hinweg stark vertreten sind, das Ergebnis bestimmen, sodass wiederum keine, bzw. nur eine sehr schwache Korrelation mit der Evaluationsgrundlage gefunden werden konnte. Der Umstand, dass keine Verbindung zwischen den berechneten Distanzen und der Evaluationsgrundlage gefunden werden konnte, obwohl die einzelnen Features sinnvoll interpretierbar sind, lässt Zweifel an der Evaluationsmatrix aufkommen. Diese scheint stärker als zu Beginn angenommen unterbewusst von thematischen und motivischen Ähnlichkeiten zwischen den Romanen beeinflusst zu sein. Auch die Qualität der jeweiligen Zusammenfassung hat hier einen nicht unwesentlichen Einfluss. Daher wäre eine weniger subjektiv geprägte Möglichkeit der Auswertung von Nöten, beispielsweise durch die parallele Einschätzung mehrerer Annotatoren. Auch die weitere Verbesserung von NLP-Verfahren für literarische Texte in deutscher Sprache ist ein Desideratum für anknüpfende Forschungsansätze. N2 - This thesis is a work in the field of Digital Literary Studies with the goal of computationally analyzing the similarity of novels with regard to their character constellation. The character constellation, as an important structural arrangement in a novel, is operationalized as a social network of these characters. Such networks can be generated automatically from a literary text using Natural Language Processing techniques. The work is based on a corpus of German novels of the 19th century that have been preprocessed using automatic methods of character identification and coreference resolution. The results have been manually corrected in order to ensure the best possible data quality. Starting from an intensive comparative contemplation of the character constellations in “Effi Briest” by Theodor Fontane and “Madame Bovary” by Gustave Flaubert, a distance matrix capturing the human intuition of similarity between character constellations of different novels was devised manually, based on summaries of the respective novels. This distance matrix serves as a means of evaluation. Using methods of social network analysis, structural properties of character networks can be modeled as features and used to compute cosine distances between the novels. The automatically generated networks are generally an adequate representation of the character constellations of the novels and the network features are meaningfully interpretable. Nevertheless, the correlation with the evaluation matrix was low. This raises the assumption that, apart from the structure of the character constellation, other properties such as recurring themes or motives may have subconsciously influenced the manual creation of the evaluation matrix. Therefore, topic modeling was used to represent important interpersonal motives that might be of importance for the character constellation. The network features and the topic distribution were used in combination for the computation of distances. Moreover, each edge in a character network was associated with a topic, trying to describe the kind of the relation. It could be observed that the result is heavily influenced on the one hand by topics that are very specific for a single text and on the other hand by topics featured strongly in all texts, so that, again, no or only a very weak correlation with the evaluation matrix could be found. The fact that there was no obvious relation between the computed distances and the manual distance matrix, even though the individual features are meaningfully interpretable, raises doubts about the evaluation matrix. It seems to be more strongly influenced by subconscious thematic and motivic similarities between the novels than assumed. The quality and extent of the respective summaries used in the creation of the manual matrix also have a substantial influence. Hence, a less subjective way of evaluation is needed, for example by parallel estimation of the distances by several annotators. Further improvement of the quality of NLP methods for literary texts in German is also a desideratum for following research. KW - Digital Humanities KW - Netzwerkanalyse KW - Literaturwissenschaft KW - Figurennetzwerke KW - Topic Modeling KW - Figurenkonstellation KW - Digitale Textanalyse Y1 - 2016 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-149106 ER - TY - CHAP A1 - Jannidis, Fotis A1 - Reger, Isabella A1 - Weimer, Lukas A1 - Krug, Markus A1 - Puppe, Frank T1 - Automatische Erkennung von Figuren in deutschsprachigen Romanen N2 - Eine wichtige Grundlage für die quantitative Analyse von Erzähltexten, etwa eine Netzwerkanalyse der Figurenkonstellation, ist die automatische Erkennung von Referenzen auf Figuren in Erzähltexten, ein Sonderfall des generischen NLP-Problems der Named Entity Recognition. Bestehende, auf Zeitungstexten trainierte Modelle sind für literarische Texte nur eingeschränkt brauchbar, da die Einbeziehung von Appellativen in die Named Entity-Definition und deren häufige Verwendung in Romantexten zu einem schlechten Ergebnis führt. Dieses Paper stellt eine anhand eines manuell annotierten Korpus auf deutschsprachige Romane des 19. Jahrhunderts angepasste NER-Komponente vor. KW - Digital Humanities KW - Figurenerkennung KW - Named-Entity-Recognition KW - Domänenadaption KW - Literatur Y1 - 2015 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-143332 UR - https://dhd2015.uni-graz.at/ ER - TY - CHAP A1 - Flanders, Julia A1 - Jannidis, Fotis T1 - Knowledge Organization and Data Modeling in the Humanities N2 - Based on the results of a 3-day workshop at the Brown University (2012) this white paper tries to sum up important topics and problems which came up in the presentations and discussions and to outline some general aspects of data modeling in digital humanities. Starting with an attempt to define data modeling it introduces distinctions like curation-driven vs. research-driven for a more general description of data modeling. The second part discusses specific problems and challenges of data modeling in the Humanities, while the third part outlines practical aspects, like the creation of data models or their evaluation. KW - Digital Humanities KW - Datenmodell KW - Digital Humanities KW - Data Modeling Y1 - 2015 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-111270 UR - http://www.wwp.northeastern.edu/outreach/conference/kodm2012/index.html ER - TY - INPR A1 - Volkmann, Armin A1 - Bock, Sina A1 - Seibt, Daniela A1 - Kümmet, Sonja A1 - Weiß, Michael A1 - Dietz, Elisabeth A1 - Huss, Patrick A1 - Heer, Anna A1 - El Hassan, Naitelqadi T1 - Geisteswissenschaft und Geografische Informationssysteme (GIS): Erstellung von Kartierungen mit kommerzieller und Open Source Software im Vergleich T1 - Digital Humanities and Geographic Information Systems (GIS): Making maps with commercial and open source software N2 - Der Einsatz von Geographischen Informationssystemen (GIS) bietet auch für die Geisteswissenschaften zahlreiche Ansätze zur Generierung von neuem Wissen. Die GIS-Software ist jedoch unterschiedlich geeignet für geisteswissenschaftliche Fragestellungen. Getestet wurden daher zwei kommerzielle und vier Open Source GIS-Programme: MapInfo, ArcGIS, Quantum GIS, gvSIG, DIVA-GIS und SAGA. MapInfo zeichnet sich besonders für GIS-Anfänger durch seine große Benutzerfreundlichkeit aus. Jedoch sind die Anschaffungskosten recht hoch. ArcGIS weist den größten Nutzungsumfang auf, wobei jedoch keine oder kaum eine „intuitive“ Nutzung möglich ist. Zudem sind die laufenden Kosten durch aufwändige Abo-Lizenzverträge besonders hoch. Quantum GIS ist eine freie Software, die benutzerfreundlich ist und auch Anfängern einen leichten Einstieg ermöglicht. Hunderte Erweiterungen machen Quantum GIS sehr leistungsstark und universal einsetzbar. gvSIG ist nicht ganz leicht zu bedienen, da zudem die Dokumentation nur fragmentarisch vorliegt. Der große Funktionsumfang macht es jedoch zu einem vollwertigen GIS, wenn auch manch ergänzende Funktion fehlt. DIVA-GIS ermöglicht einen schnellen Einstieg durch seine gute Dokumentation. Man gelangt jedoch recht bald an die Grenzen des Nutzungsumfangs durch die eingeschränkte Funktionalität. SAGA hingegen erfüllte alle hier gestellten Anforderungen, sodass es, trotz der geringeren Anzahl von Erweiterungen, zusammen mit Quantum GIS als Open Source eine echte Alternative zu kommerziellen GIS-Programmen darstellt. N2 - The use of Geographic Information Systems (GIS) is also in the Humanities an interesting method to analyze questions of space and time. For creating new results, we need to search reputed GIS software for our regular use. Within this article we tested two commercial and four open source GIS programs: MapInfo, ArcGIS, Quantum GIS, gvSIG, DIVA-GIS and SAGA. ArcGIS has the greatest functionality. But it is very expensive and not easy to use. MapInfo is particularly distinguished for GIS-beginners due to its large usability. However, the cost is quite high. Quantum GIS is a free software that is user friendly, and even for beginners easy to get started. gvSIG is not very easy to use and some ancillary functions are missing. DIVA-GIS provides a quick start by its good documentation. But the functionality is limited pretty soon. Many functions make SAGA to a full-fledged GIS, despite the lower number of enhancements. Hundreds extensions make Quantum GIS very powerful and versatile. Altogether for the Humanities the open source Quantum GIS represents a viable alternative to expensive commercial GIS software. KW - Geoinformationssystem KW - Literaturwissenschaft KW - Open Source KW - Digital Humanities KW - Geographisches Informationssystem KW - GIS KW - Digital Humanities KW - Geographic Information Systems KW - GIS KW - Literary Studies KW - Open Source Software Y1 - 2012 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-74470 ER -