@phdthesis{Hecht2001, author = {Hecht, Heiko}, title = {Einf{\"u}hrung und kontinuierliche Adaption von betriebswirtschaftlichen Data-Warehouse-Bibliotheken}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-4262}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2001}, abstract = {Zielsetzung und Thesenbildung Zielsetzung der Arbeit ist es, ein ganzheitliches, werkzeuggest{\"u}tztes Verfahren f{\"u}r die Einf{\"u}hrung eines Data Warehouse (DW) zu konzipieren. Es wird dabei auf vorhandene Vorgehensmodelle zur{\"u}ckgegriffen, so dass nicht s{\"a}mtliche Bestandteile vollst{\"a}ndig neu zu entwickeln sind. Der Fokus der vorliegenden wissenschaftlichen Arbeit liegt auf den nachfolgend erl{\"a}uterten Schwerpunkten. Innovative Data-Warehouse-L{\"o}sungen Entgegen der in der Literatur verbreiteten Meinung, dass es sich bei einer DW-L{\"o}sung um keine Standardanwendungssoftware handelt und diese nicht „von der Stange zu kaufen" ist, wird im Folgenden gerade das Ph{\"a}nomen von Standardsoftware im DW-Bereich untersucht. Der Verfasser besch{\"a}ftigt sich mit der Frage, inwieweit sich der Trend der 90er Jahre, Individual- durch Standardsoftware abzul{\"o}sen, auch im DW-Bereich fortsetzen kann. Neben der Darstellung der bisherigen DW-Konzepte wird untersucht, ob ein neuer Typus DW den Wandel von einer Individual- hin zu einer Standardsoftware bewirken kann. Die wesentlichen Kriterien zur Kennzeichnung des neuen Konzepts werden herausgearbeitet und die am Markt bestehenden Produkte {\"u}berpr{\"u}ft, inwieweit sie die aufgestellten Anforderungen erf{\"u}llen. Vorgehensmodell Die Vorgehensweise bei der Einf{\"u}hrung eines DW wird anschließend problematisiert. Die methodische und technische Unterst{\"u}tzung in diesem Bereich, die bislang ebenfalls vernachl{\"a}ssigt werden, bilden einen weiteren Hauptbestandteil der Arbeit. Dabei werden ad{\"a}quate Vorgehensweisen und -methoden aufgezeigt und bewertet. Die Ergebnisse hieraus und aus der Bewertung der bisherigen DW-Konzepte bilden die Grundlage f{\"u}r eine neue Vorgehensweise. Damit ist die Basis f{\"u}r das DELOS-Verfahren (Data-Warehouse-Einf{\"u}hrung und Lokalisierung des Informationsbedarfs anhand operativer betriebswirtschaftlicher Softwarebibliotheken) geschaffen. Zus{\"a}tzlich zu den bislang aufgestellten Anforderungen wird {\"u}berpr{\"u}ft, inwieweit sich der Continuous-System-Engineering-Ansatz (CSE-Ansatz) auf den Bereich der Datenlagerh{\"a}user {\"u}bertragen l{\"a}sst und diese im Zeitablauf kontinuierlich verbessert werden k{\"o}nnen. Informationsbedarfsanalyse Der Fokus wird auf den in der Literatur bislang vernachl{\"a}ssigten Schritt der IBA und ihrer informationstechnologischen Unterst{\"u}tzung gelegt. Die in der Literatur und Praxis bislang bekannten Methoden und Werkzeuge werden nach einer Vorauswahl auf ihre Anwendbarkeit im DW-Umfeld {\"u}berpr{\"u}ft. Der Aufbau eines umfassenden Metadaten-Modells ist und kann nicht Ziel dieser Arbeit sein. Aufbau der Arbeit In der vorliegenden Arbeit wird der neue Typ der „betriebswirtschaftlichen Data-Warehouse-Bibliothek (DWB)" definiert. Dazu werden die am Markt zu findenden Produktgruppen im DW-Umfeld herausgearbeitet und deren wesentliche Eigenschaften erl{\"a}utert. Im Anschluss wird anhand der betrachteten DW-L{\"o}sungen gepr{\"u}ft, inwieweit diese den Anforderungen an eine betriebswirtschaftliche DWB gerecht werden. Nachdem der Begriff der DWB begr{\"u}ndet und charakterisiert wurde, m{\"u}ssen die Anforderungen an die Adaption eines DW aufgezeigt werden. Die besonderen Eigenschaften der DWB bilden die Grundlage f{\"u}r den weiteren Verlauf der Arbeit. Im Mittelpunkt der weiteren Analyse steht die Frage nach einer m{\"o}glichst geeigneten Einf{\"u}hrungsunterst{\"u}tzungsmethodik. Die Vorgehensmodelle zur Einf{\"u}hrung betriebswirtschaftlicher Standardsoftware AcceleratedSAP (ASAP) und Chestra werden erl{\"a}utert und bewertet. Daran schließt sich eine kritische W{\"u}rdigung ausgew{\"a}hlter IBA-Methoden an. Die Ergebnisse werden anschließend zur Konzeption und Umsetzung des DELOS-Verfahrens verwendet. Mit DELOS werden die Schwachpunkte der Vorgehensmodelle aus den vorangegangenen Kapiteln beseitigt. Dies bedeutet, dass z. B. die verwendbaren Bestandteile von ASAP und Chestra nicht neu konzipiert und entwickelt werden, sondern Wege aufgezeigt werden, wie diese im Sinne einer effektiven Einf{\"u}hrungsmethodik erg{\"a}nzt werden k{\"o}nnen. Danach wird die Umsetzung und der Einsatz des DELOS-Verfahrens im DW-Projekt geschildert. Es werden verschiedene Projektverl{\"a}ufe und die konkrete Anwendung der einzelnen Methoden aufgezeigt. Die bisherigen Erfahrungen beim Einsatz des Instrumentariums fließen in die Argumentation ein und die Besonderheiten bei der Anwendung werden herausgearbeitet. Mit der Evaluierung der angestellten {\"U}berlegungen schließt die Arbeit. Die Projekttauglichkeit wird getestet und das DELOS-Verfahren kritisch bewertet. Abschließend werden die Implikationen des konzipierten Verfahrens auf zuk{\"u}nftige Projekte und Anwendungsgebiete diskutiert und weitere Einsatzm{\"o}glichkeiten aufgezeigt.}, subject = {Data-Warehouse-Konzept}, language = {de} } @phdthesis{Dietrich2019, author = {Dietrich, Georg}, title = {Ad Hoc Information Extraction in a Clinical Data Warehouse with Case Studies for Data Exploration and Consistency Checks}, doi = {10.25972/OPUS-18464}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-184642}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2019}, abstract = {The importance of Clinical Data Warehouses (CDW) has increased significantly in recent years as they support or enable many applications such as clinical trials, data mining, and decision making. CDWs integrate Electronic Health Records which still contain a large amount of text data, such as discharge letters or reports on diagnostic findings in addition to structured and coded data like ICD-codes of diagnoses. Existing CDWs hardly support features to gain information covered in texts. Information extraction methods offer a solution for this problem but they have a high and long development effort, which can only be carried out by computer scientists. Moreover, such systems only exist for a few medical domains. This paper presents a method empowering clinicians to extract information from texts on their own. Medical concepts can be extracted ad hoc from e.g. discharge letters, thus physicians can work promptly and autonomously. The proposed system achieves these improvements by efficient data storage, preprocessing, and with powerful query features. Negations in texts are recognized and automatically excluded, as well as the context of information is determined and undesired facts are filtered, such as historical events or references to other persons (family history). Context-sensitive queries ensure the semantic integrity of the concepts to be extracted. A new feature not available in other CDWs is to query numerical concepts in texts and even filter them (e.g. BMI > 25). The retrieved values can be extracted and exported for further analysis. This technique is implemented within the efficient architecture of the PaDaWaN CDW and evaluated with comprehensive and complex tests. The results outperform similar approaches reported in the literature. Ad hoc IE determines the results in a few (milli-) seconds and a user friendly GUI enables interactive working, allowing flexible adaptation of the extraction. In addition, the applicability of this system is demonstrated in three real-world applications at the W{\"u}rzburg University Hospital (UKW). Several drug trend studies are replicated: Findings of five studies on high blood pressure, atrial fibrillation and chronic renal failure can be partially or completely confirmed in the UKW. Another case study evaluates the prevalence of heart failure in inpatient hospitals using an algorithm that extracts information with ad hoc IE from discharge letters and echocardiogram report (e.g. LVEF < 45 ) and other sources of the hospital information system. This study reveals that the use of ICD codes leads to a significant underestimation (31\%) of the true prevalence of heart failure. The third case study evaluates the consistency of diagnoses by comparing structured ICD-10-coded diagnoses with the diagnoses described in the diagnostic section of the discharge letter. These diagnoses are extracted from texts with ad hoc IE, using synonyms generated with a novel method. The developed approach can extract diagnoses from the discharge letter with a high accuracy and furthermore it can prove the degree of consistency between the coded and reported diagnoses.}, subject = {Information Extraction}, language = {en} }