Medizinische Studien haben in der Regel das Ziel, den Einfluss eines oder mehrerer Faktoren auf das Studienergebnis zu untersuchen. Es soll beispielsweise analysiert werden, ob eine neue Therapie (Einflussfaktor) zu weniger Rezidiven (Ergebnis, Outcome) führt als eine etablierte Therapie. Es kann aber auch sein, dass man nur ganz allgemein wissen möchte, welchen Einfluss etwa das Rauchen auf das Darmkrebsrisiko hat.
Die erste Fragestellung gehört zum klassischen Aufgabengebiet klinischer Studien der Phase III; sie führt im Erfolgsfall zur Zulassung einer Therapie bzw. eines Wirkstoffs. Man spricht hier auch von Interventions- oder Zulassungsstudien und fügt das Adjektiv kontrolliert hinzu, um zu signalisieren, dass diese Studien ein sorgfältig ausgewogenes Design benötigen, um am Ende statistisch valide Aussagen treffen zu können.
Die zweite – allgemeinere – Fragestellung ist die Domäne von Beobachtungsstudien, bei denen man eine Gruppe von Personen zu einem bestimmten Zeitpunkt betrachtet oder über einen längeren Zeitraum verfolgt, ohne die Bedingungen zu kontrollieren oder zu steuern. Man beobachtet lediglich "nicht-interventionell", wie sich z. B. Risikofaktoren oder laufende Behandlungen auswirken.
Damit kommen wir zur Definition der hier besprochenen "Real-World-Studien". Sie schließen sich als wertvolle Ergänzung kontrollierter klinischer Studien an die Phase III an. Dank der breiten Verfügbarkeit medizinischer Daten aus öffentlichen und institutionellen Krebsregistern, Abrechnungsdaten von Krankenversicherungen, elektronischen Patientenakten (ePA) und vielen weiteren Quellen erlangen sie aktuell große Aufmerksamkeit.
Es ist keineswegs trivial, diesen Datenschatz verzerrungsfrei zu analysieren, da er definitionsgemäß unter unkontrollierten Bedingungen erhoben wurde. Wenn beispielsweise mehr Männer als Frauen rauchen und Männer ein höheres Darmkrebsrisiko als Frauen haben, so könnte ein erhöhtes Risiko bei rauchenden Personen eventuell vor allem auf das Geschlecht zurückzuführen sein und nicht auf das Rauchen. Faktoren wie Geschlecht oder Alter, die eventuell mit dem zu untersuchenden Einflussfaktor korrelieren, bezeichnet man als Kovariablen (engl. covariates).
Ein- und Ausschlusskriterien
Zulassungsstudien können dagegen die Realität des klinischen Alltags nicht 1 : 1 widerspiegeln, denn sie müssen durch sorgfältige Wahl der Ein- und Ausschlusskriterien systematische Fehler bei der statistischen Auswertung minimieren. Diese Kriterien werden notwendigerweise eng gefasst: In der Regel sind die Patient:innen jung, weisen einen guten Allgemeinzustand auf und haben keine Komorbiditäten. Schließlich sind Zulassungsstudien ja darauf ausgelegt, die Wirksamkeit und Sicherheit eines Medikaments in zwei vergleichbaren Patientengruppen zu überprüfen, wobei es möglichst keine Störgrößen wie etwa die Einnahme anderer Medikamente aufgrund von Komorbiditäten geben darf.
Gruppenbildung
Bei diesen kontrollierten Studien werden die Teilnehmenden so auf die Gruppen – in der Regel eine Kontroll- und eine Studiengruppe – aufgeteilt, dass die Werte der Kovariablen möglichst ähnlich verteilt sind. Dies geschieht entweder durch Randomisierung, also nach dem Zufallsprinzip, oder aber man versucht z. B. für die Kovariable Geschlecht systematisch etwa gleiche Anteile von Frauen und Männer auf die einzelnen Gruppen zu verteilen. Dieses zweite Verfahren nennt man Stratifizierung.
Bei der Randomisierung können sich naturgemäß zufällig abweichende Verteilungen von Gruppe zu Gruppe ergeben. Durch Stratifizierung lässt sich dagegen zumindest für Kovariablen mit nur wenigen Ausprägungen nahezu perfekte Gleichheit der Verteilungen erreichen. Bei numerischen Variablen wie dem Alter ist das Verteilungsproblem nicht so einfach zu lösen. Man bildet dann häufig etwa gleich große Altersgruppen, was aber eine genügend hohe Teilnehmerzahl voraussetzt.
Betrachtet man in kontrollierten Studien mehrere Kovariablen gleichzeitig, so erhöht sich die Wahrscheinlichkeit für zufällige Abweichungen in den einzelnen Gruppen; eine simultane Stratifizierung führt dann schnell zur kombinatorischen Explosion, die nur durch unrealistisch große Stichproben beherrschbar wäre.
Herausforderungen
Bei Real-World-Studien besteht die eben beschriebene Problematik in der Regel nicht, da man ohnehin wenig bis überhaupt keinen Einfluss auf die Verteilungen der Kovariablen in den einzelnen Gruppen hat. Das gilt vor allem für retrospektive Studien, die auf bereits in der Vergangenheit gesammelten Daten basieren. Bei prospektiven Studien werden die Daten erst im Laufe der Untersuchung gesammelt, sodass man die Zusammensetzung in einem gewissen Maß beeinflussen kann.
Die wesentliche Herausforderung bei Real-World-Studien besteht aus statistischer Sicht vor allem darin, systematische Fehler zu minimieren, die sich mangels Kontrolle der Studienbedingungen aus der zwangsläufig ungleichen Verteilung von Kovariablen in den verschiedenen Gruppen ergeben.
Ein Beispiel
Im Folgenden demonstrieren wir den Einfluss einer unausgewogenen Zusammensetzung von Kontroll- und Therapiegruppe anhand eines konstruierten Beispiels, bei dem wir den nachzuweisenden Therapieeffekt – beispielsweise eine Verlängerung des mittleren Gesamtüberlebens [1] um einen Monat – vorgeben und prüfen, ob dieser mit dem t-Test [2] tatsächlich nachweisbar ist.
Abb. 1 zeigt eine ungleiche Verteilung von Frauen und Männern in den beiden Gruppen, die dadurch zustande gekommen sein könnte, dass das Medikament vor allem an Männern getestet wurde, während kaum Daten von unbehandelten Männern vorlagen.