@phdthesis{Malsch2021, author = {Malsch, Carolin}, title = {Charakterisierung von Punkt- und Intervallsch{\"a}tzern des gemittelt sequenziellen Populations-assoziierten Risikoanteils in der Epidemiologie kardiovaskul{\"a}rer Erkrankungen}, doi = {10.25972/OPUS-23816}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-238161}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2021}, abstract = {Zielsetzung Die Entwicklung von Pr{\"a}ventionsstrategien zur Senkung der Morbidit{\"a}t und Mortalit{\"a}t aufgrund von kardiovaskul{\"a}ren Erkrankungen (KVE) in der Bev{\"o}lkerung stellt eine Hauptaufgabe der Epidemiologie und Public Health Forschung dar. In den vergangenen 20 Jahren r{\"u}ckte die Hochrisikopr{\"a}vention im Zuge der Weiterentwicklung der Scoringsysteme f{\"u}r das KVE Hochrisiko-Screening in den Fokus der Leitlinien zur KVE Pr{\"a}vention. Jedoch sind die gr{\"o}ßten Erfolge aus einer komplement{\"a}ren Strategie aus Hochrisiko- und Populationspr{\"a}vention mit Priorit{\"a}t auf der Reduktion der Exposition von Risikofaktoren f{\"u}r KVE in der gesamten Population zu erwarten. Die Grundvoraussetzung f{\"u}r die Entwicklung effizienter, populationsweiter Pr{\"a}ventionsprogramme ist das Verst{\"a}ndnis einerseits der Rolle von Risikofaktoren bei der Krankheitsentstehung und andererseits der Bedeutung der Risikofaktoren auf Populationsebene. Der Populations-assoziierte Risikoanteil (PAF) ist das bevorzugte statistische Maß zur Quantifizierung des Effekts von Risikofaktoren auf Populationsebene, da er neben der Effektst{\"a}rke eines Risikofaktors auch dessen Pr{\"a}valenz ber{\"u}cksichtigt. In der Praxis erfolgt die Berechnung des PAF in multifaktoriellen Situationen mithilfe von Adjustierungsans{\"a}tzen oder Partialisierungsans{\"a}tzen. Partialisierungsans{\"a}tze, zu denen auch der gemittelt sequenzielle PAF (gsPAF) geh{\"o}rt, erf{\"u}llen die Additivit{\"a}tseigenschaft. Insbesondere der gsPAF kommt daher in der praktischen Anwendung zunehmend h{\"a}ufiger zum Einsatz. Das Ziel der vorliegenden Arbeit ist die Charakterisierung des gsPAF am Beispiel der Epidemiologie von KVE. Methoden In Projekt 1 erfolgt die theoretische Abgrenzung des gsPAF von anderen Adjustierungs- und Partialisierungsverfahren in Bezug auf Intention, Definition, Modellvoraussetzungen und -annahmen und Interpretation. Diese verschiedenen Konzepte werden in einer einheitlichen mathematischen Symbolik dargestellt, um das Verst{\"a}ndnis zu erleichtern und Abweichungen in den Definitionen hervorzuheben. Anschließend wird in Projekt 2 der praktische Vergleich von modellbasierten Punktsch{\"a}tzern vorgenommen. Im Rahmen der Sekund{\"a}ranalyse der ProsCIS-Studie {\"u}ber den Populationseinfluss von Risikofaktoren auf schlechtes Outcome nach Schlaganfall werden dem gsPAF ein additiver und ein multiplikativer Adjustierungsansatz gegen{\"u}bergestellt und die Sch{\"a}tzergebnisse hinsichtlich {\"U}bereinstimmung der Gr{\"o}ßenordnung und Rangfolgen analysiert. In Projekt 3 werden im Rahmen einer Simulationsstudie nach dem proof-of-concept-Prinzip die asymptotischen Eigenschaften existierender modellfreier und modellbasierter Sch{\"a}tzer des gsPAF in Verbindung mit resamplingbasierten Konfidenzsch{\"a}tzern in einer Situation mit einem bin{\"a}ren Outcome und drei bin{\"a}ren Risikofaktoren unter insgesamt 296 Modellsituationen charakterisiert. Dabei wird die Abh{\"a}ngigkeit von der Stichprobengr{\"o}ße, der Pr{\"a}valenz des Outcomes, der Pr{\"a}valenz und Effektst{\"a}rke der Risikofaktoren, der stochastischen Abh{\"a}ngigkeit der Risikofaktoren und ihrer Effekte auf das Outcome, der Vollst{\"a}ndigkeit des statistischen Modells sowie des Outcome-Mechanismus untersucht. Abschließend erfolgt in Projekt 4 die Demonstration der gsPAF-Sch{\"a}tzung exemplarisch im Rahmen der Sekund{\"a}ranalyse des deutschen Arms der EUROASPIRE IV-Studie. Hier wird der Einfluss von Baselinefaktoren auf das Auftreten rekurrenter kardiovaskul{\"a}rer Ereignisse nach erstmaliger Hospitalisierung auf Populationsebene modelliert. Die Ergebnisse werden anschließend einer umfassenden Methodenkritik unterzogen. Dazu wird die Modellanpassung der Regressionsmodelle {\"u}berpr{\"u}ft, die Performanz der gsPAF-Sch{\"a}tzung mit Hilfe der zuvor entwickelten Simulationsstudie evaluiert, eine exemplarische Stichprobenumfangsplanung durchgef{\"u}hrt sowie die Angemessenheit der Modellannahmen des gsPAF diskutiert. Ergebnisse \%Die M{\"o}glichkeiten der statistischen Modellierung von PAF sind nahezu unbegrenzt. Projekt 1: Adjustierungs- und Partialisierungsmethoden beantworten verschiedene Fragestellungen. Dies resultiert aus dem unterschiedlichen Umgang beider Methoden mit Subgruppen, die bez{\"u}glich mehrerer Risikofaktoren gleichzeitig exponiert sind, und f{\"u}hrt infolgedessen auch zu unterschiedlichen Interpretationen. Der PAF beschreibt den Anteil an der Ereigniswahrscheinlichkeit, der mit dem Vorliegen eines Risikofaktors assoziiert ist. F{\"u}r den gsPAF muss zus{\"a}tzlich betont werden, dass der Effekt in Subgruppen mit mehreren Risikofaktoren auf additive Weise zerlegt und der Anteil des Zusammenwirkens der beteiligten Risikofaktoren (Surplus) zu gleichen Anteilen den Risikofaktoren zugewiesen wird. Dahinter steckt die Annahme, dass dieser Teil nur durch das Zusammenwirken {\"u}berhaupt entstehen konnte, wof{\"u}r beide Risikofaktoren gleichermaßen verantwortlich gemacht werden. Im Gegensatz zu Adjustierungsmethoden erf{\"u}llen Partialisierungsmethoden zwar die Additivit{\"a}tseigenschaft, gehen jedoch gleichzeitig mit spezifischen Modellannahmen einher, die Kenntnisse {\"u}ber die kausalen Verl{\"a}ufe der Risikofaktoren voraussetzen. Im Falle des gsPAF ist dies die Annahme, dass unter den betrachteten Risikofaktoren keine hierarchischen Abh{\"a}ngigkeiten herrschen. Die theoretische Basis des gsPAF ist derzeit nur f{\"u}r dichotome Outcomes umfangreich erarbeitet und deckt hier alle Anspr{\"u}che f{\"u}r den Praxiseinsatz ab: Modellfreie und modellbasierte Punktsch{\"a}tzer, zugeh{\"o}rige Varianzsch{\"a}tzer mit und ohne Ber{\"u}cksichtigung von St{\"o}rgr{\"o}ßen und Konfidenzsch{\"a}tzer stehen zur Verf{\"u}gung. Mathematische Eigenschaften wie Symmetrie, Dummyeigenschaft, Additivit{\"a}t und (internen) marginalen Rationalit{\"a}t des gsPAF und anderer Partialisierungsans{\"a}tze wurden er{\"o}rtert. Die verf{\"u}gbare Software stellt derzeit nur Ausschnitte des Methodenspektrums zur Sch{\"a}tzung des gsPAF bereit und ist deshalb f{\"u}r den Einsatz in der empirischen Forschung zu KVE nur begrenzt n{\"u}tzlich. Eine erfolgreiche und effiziente Recherche zum gsPAF wird durch die uneinheitliche Verwendung der Fachtermini ''partieller'' und ''gemittelt sequenzieller'' PAF erschwert. Projekt 2: Der Vergleich von Ergebnissen aus einem Adjustierungsansatz mit Ergebnissen aus einem Partialisierungsansatz ist {\"u}ber den kombinierten PAF m{\"o}glich, da der unterschiedliche Umgang mit Subgruppen, die bez{\"u}glich mehrerer Risikofaktoren gleichzeitig exponiert sind, nicht zum Tragen kommt, solange nur der kombinierte Risikofaktor im statistischen Modell ber{\"u}cksichtigt wird. Anhand des Datenbeispiels der ProsCIS-Studie wurde f{\"u}r diesen Parameter keine Abweichung der Ergebnisse des multiplikativen Ansatzes (Faktor 1,0) und nur eine geringe Abweichung des additiven Ansatzes (Faktor 1,1) vom gsPAF beobachtet. Die Gr{\"o}ßenordnungen der Sch{\"a}tzwerte einzelner Risikofaktoren sowie deren Summe sind zwischen Adjustierungs- und Partialisierungsmethoden nicht vergleichbar. Die Ergebnisse aus dem multiplikativen Regressionsmodell weichen bis zu einem Faktor von 1,3 von den Sch{\"a}tzwerten des gsPAF ab. Die Abweichungen aus dem additiven Regressionsmodell gehen deutlich dar{\"u}ber hinaus. Der gsPAF liefert nahezu additive Sch{\"a}tzergebnisse, w{\"a}hrend die Summe der risikofaktorspezifischen Sch{\"a}tzwerte aus den beiden Adjustierungsmethoden den kombinierten PAF {\"u}bersteigt. Im Gegensatz zu vorangegangenen Studien wird die Rangfolge der Risikofaktoren im Datenbeispiel nicht wesentlich von der Sch{\"a}tzmethode beeinflusst. Projekt 3: Die Simulationsstudie charakterisiert die modellfreien und modellbasierten Punktsch{\"a}tzer des gsPAF und belegt deren Konsistenz und (asymptotische) Erwartungstreue, sofern das statistische Modell korrekt spezifiziert ist. Es zeigt sich, dass in kleinen Stichproben oder bei kleinen Ereigniswahrscheinlichkeiten der modellbasierte Sch{\"a}tzer erwartungstreu und damit dem modellfreien Sch{\"a}tzer {\"u}berlegen ist. Die Berechnungszeit des modellbasierten Sch{\"a}tzers steigt jedoch superlinear mit steigender Stichprobengr{\"o}ße und mit steigender Anzahl von Variablen im Regressionsmodell an. Resamplingbasierte Methoden wie Bootstrap Normal, Perzentil und Jackknife eignen sich f{\"u}r die Sch{\"a}tzung von Konfidenzintervallen des gsPAF. Auch hier ist ein superlinearer Anstieg der Berechnungszeit insbesondere in Verbindung mit dem modellbasierten Sch{\"a}tzer mit steigender Stichprobengr{\"o}ße und mit steigender Anzahl der Risikofaktoren im statistischen Modell zu beobachten. Biologische Interaktionen von Risikofaktoren im Outcome-Mechanismus ver{\"a}ndern die Wahrscheinlichkeit f{\"u}r Ereignisse in Subgruppen mit mehreren Risikofaktoren weg von einem stochastisch unabh{\"a}ngigen und hin zu einem stochastisch abh{\"a}ngigen Szenario. Diese Ereigniswahrscheinlichkeiten werden durch die Anpassung der Parameter im bin{\"a}r-logistischen Regressionsmodell angen{\"a}hert. Modelle ohne Interaktionsterme repr{\"a}sentieren aus statistischer Sicht immer einen Outcome-Mechanismus mit stochastischer Abh{\"a}ngigkeit. Interaktionsterme sind nur dann als biologische Interaktionen zu interpretieren, wenn der biologische Outcome-Mechanismus korrekt durch die logistische Regressionsfunktion beschrieben wird. Anderenfalls dienen die Interaktionsterme nur der Modellanpassung und spiegeln nicht die An- oder Abwesenheit biologischer Interaktionen wider. Die Vernachl{\"a}ssigung von relevanten Interaktionstermen f{\"u}hrt zu ernstzunehmenden Verzerrungen der Modellparameter und infolgedessen zu stark verzerrten gsPAF-Sch{\"a}tzungen. Dies ist jedoch durch eine gewissenhafte {\"U}berpr{\"u}fung der Modellanpassung w{\"a}hrend der Auswertung vermeidbar. Grunds{\"a}tzlich liefert die modellbasierte Sch{\"a}tzung des gsPAF mit allen Interaktionstermen immer unverzerrte Ergebnisse. Die ben{\"o}tigte Stichprobengr{\"o}ße f{\"u}r eine aussagekr{\"a}ftige Sch{\"a}tzung des gsPAF {\"u}bersteigt die f{\"u}r relative Maße und steigt mit der Anzahl zu betrachtender Variablen im Modell und mit sinkender Pr{\"a}valenz des Outcomes an. W{\"a}hrend f{\"u}r den PAF steigende Effektgr{\"o}ßen der Risikofaktoren die ben{\"o}tigte Stichprobengr{\"o}ße verkleinern, wurde in der Simulationsstudie ein umgekehrter Zusammenhang f{\"u}r den gsPAF beobachtet. Projekt 4: Die in den Projekten 1 und 3 gewonnenen Erkenntnisse wurden im Rahmen der Datenanalyse der EUROASPIRE IV-Studie am Praxisbeispiel untersucht und diskutiert. Das Regressionsmodell ohne Interaktionsterme lieferte verzerrte gsPAF-Sch{\"a}tzungen, was durch die Ber{\"u}cksichtigung von Interaktionstermen korrigiert werden konnte. Die resamplingbasierten Konfidenzintervalle {\"u}berdeckten große Teile des Wertebereiches des gsPAF und liefern somit keine n{\"u}tzlichen Informationen f{\"u}r die epidemiologische Interpretation der Studienergebnisse. Die Validierung der gsPAF-Sch{\"a}tzungen mit Hilfe der Simulationsstudie machte auf die mangelnde Performanz der Punkt- und Konfidenzintervalle aufgrund der verh{\"a}ltnism{\"a}ßig kleinen Stichprobengr{\"o}ße f{\"u}r die betrachtete Anzahl der Risikofaktoren aufmerksam. Die ben{\"o}tigte Stichprobengr{\"o}ße f{\"u}r eine performante Sch{\"a}tzung des gsPAF in einer Datensituation wie in der EUROASPIRE IV-Studie beobachtet wurde mit Hilfe der Simulationsstudie ermittelt. Dabei wurde deutlich, dass etwa das Zehnfache der vorliegenden Stichprobengr{\"o}ße ben{\"o}tigt w{\"u}rde, um den modellfreien Sch{\"a}tzer des gsPAF zusammen mit resamplingbasierten Konfidenzintervallen mit einer ausreichenden Performanz sch{\"a}tzen zu k{\"o}nnen. Da unter den in EUROASPIRE IV betrachteten Risikofaktoren hierarchische Abh{\"a}ngigkeiten vorliegen k{\"o}nnten, sind die Voraussetzungen f{\"u}r die Sch{\"a}tzung des gsPAF nicht erf{\"u}llt. Anstelle des gsPAF k{\"o}nnte im vorliegenden Beispiel ein adjustierter Sch{\"a}tzer zum Einsatz kommen, oder, sofern gen{\"u}gend Informationen {\"u}ber die kausalen Zusammenh{\"a}nge unter den Risikofaktoren vorliegen, auch sequenzielle oder proportionale Partialisierungsans{\"a}tze. Die durchgef{\"u}hrte Methodenkritik in Projekt 4 erm{\"o}glicht es, weitere Schritte zur Steigerung der Aussagekraft der Studienergebnisse zu unternehmen, beispielsweise durch die Wahl geeigneter statistischer Methoden und die Erh{\"o}hung des Stichprobenumfangs. Schlussfolgerungen Die Grundvoraussetzungen f{\"u}r die Gewinnung qualitativ hochwertiger Daten sind bekanntermaßen die Wahl eines der Forschungsfrage angemessenen Studiendesigns sowie die sorgf{\"a}ltige Studienplanung. Aufgrund der hohen Anzahl der Risikofaktoren und St{\"o}rgr{\"o}ßen f{\"u}r kardiovaskul{\"a}re Erkrankungen sowie der Komplexit{\"a}t ihrer kausalen Verl{\"a}ufe erfordern Beobachtungsstudien zu KVE große Stichproben, um eine unverzerrte und valide Sch{\"a}tzung der Effekte von Risikofaktoren zu erm{\"o}glichen. Doch die gewonnenen Erkenntnisse eignen sich nur dann f{\"u}r Schlussfolgerungen im epidemiologischen und Public Health Kontext dann, wenn auch die statistische Analyse der Studiendaten mit einer ebenso hohen Qualit{\"a}t erfolgt. Eine qualitativ hochwertige Datenanalyse zeichnet sich aus durch (1) die Auswahl der statistischen Methoden passend zur Forschungsfrage, (2) die Ber{\"u}cksichtigung aktueller methodischer Forschungsergebnisse, (3) die sorgf{\"a}ltige {\"U}berpr{\"u}fung der Modellannahmen und Modellanpassung, (4) die Sicherstellung und {\"U}berpr{\"u}fung einer guten Performanz der Punkt- und Konfidenzsch{\"a}tzer und (5) die realistische Interpretation der Ergebnisse unter Ber{\"u}cksichtigung der Modellvoraussetzungen und -annahmen. Ein gewissenhafter Umgang mit den statistischen Methoden ist erforderlich, um belastbare Schlussfolgerungen aus Beobachtungsstudien ziehen zu k{\"o}nnen. Dies gilt insbesondere im Kontext von Sekund{\"a}rdatenanalysen, die einen betr{\"a}chtlichen Anteil der Publikationen darstellen. Simulationsstudien sind ein schlagkr{\"a}ftiges Werkzeug f{\"u}r die Validierung der verwendeten statistischen Methoden und erm{\"o}glichen die Einsch{\"a}tzung des Informationsgehaltes von Analyseergebnissen. Sie sind ausgesprochen flexibel und lassen sich an beliebige Datensituationen anpassen. Das macht sie zu einem unverzichtbaren Qualit{\"a}tskriterium f{\"u}r die Publikation empirischer Studien. Jeder Validierungsschritt tr{\"a}gt wesentlich zu einer verbesserten Qualit{\"a}t der Publikationen bei. Damit entsteht eine solide Basis, um die kausalen Verl{\"a}ufe der Risikofaktoren aufzudecken und die Entwicklung von Pr{\"a}ventionsprogrammen zur Verbesserung des Gesundheitsstatus in der Population durch Reduktion der Morbidit{\"a}t und Mortalit{\"a}t von KVE voranzubringen.}, language = {de} } @article{YurdadoganMalschKotsevaetal.2021, author = {Yurdadogan, Tino and Malsch, Carolin and Kotseva, Kornelia and Wood, David and Leyh, Rainer and Ertl, Georg and Karmann, Wolfgang and M{\"u}ller-Scholden, Lara and Morbach, Caroline and Breuning, Margret and Wagner, Martin and Gelbrich, G{\"o}tz and Bots, Michiel L. and Heuschmann, Peter U. and St{\"o}rk, Stefan}, title = {Functional versus morphological assessment of vascular age in patients with coronary heart disease}, series = {Scientific Reports}, volume = {11}, journal = {Scientific Reports}, number = {1}, doi = {10.1038/s41598-021-96998-x}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-265810}, year = {2021}, abstract = {Communicating cardiovascular risk based on individual vascular age (VA) is a well acknowledged concept in patient education and disease prevention. VA may be derived functionally, e.g. by measurement of pulse wave velocity (PWV), or morphologically, e.g. by assessment of carotid intima-media thickness (cIMT). The purpose of this study was to investigate whether both approaches produce similar results. Within the context of the German subset of the EUROASPIRE IV survey, 501 patients with coronary heart disease underwent (a) oscillometric PWV measurement at the aortic, carotid-femoral and brachial-ankle site (PWVao, PWVcf, PWVba) and derivation of the aortic augmentation index (AIao); (b) bilateral cIMT assessment by high-resolution ultrasound at three sites (common, bulb, internal). Respective VA was calculated using published equations. According to VA derived from PWV, most patients exhibited values below chronological age indicating a counterintuitive healthier-than-anticipated vascular status: for VA(PWVao) in 68\% of patients; for VA\(_{AIao}\) in 52\% of patients. By contrast, VA derived from cIMT delivered opposite results: e.g. according to VA\(_{total-cIMT}\) accelerated vascular aging in 75\% of patients. To strengthen the concept of VA, further efforts are needed to better standardise the current approaches to estimate VA and, thereby, to improve comparability and clinical utility.}, language = {en} }