Wer glaubt, Statistik bestehe fast nur aus Zahlen und mathematischen Formeln, der irrt. Wann immer in Publikationen, Geschäftsberichten oder Nachrichten statistische Ergebnisse präsentiert werden, sehen wir als visuelle Ergänzung steigende und fallende Kurven, Torten- und Balkendiagramme oder farbig markierte Punktewolken. Graphiken sind gewissermaßen das Salz in der Suppe; ohne sie wären viele statistische Auswertungen „fad“ und schwer verdaulich.
Wir halten uns in dieser vierten Folge unserer Artikelserie an den Rat des berühmten Statistikers John W. Tukey, von dem der Ausspruch stammt: „There is no excuse for failing to plot and look.“ Sprich: Ehe man Daten mit aufwendigen mathematischen Verfahren analysiert, sollte man sie „plotten und anschauen“.
Tukeys womöglich berühmteste Graphik in diesem Kontext ist der Boxplot, den wir in der vorhergehenden Folge vorgestellt haben. Diesmal wollen wir das Thema Überlebenszeitanalyse aus der Sommerausgabe 2022 (Heft 6/7) noch einmal aufgreifen. Wir zeigen, wie man abstrakte Kennzahlen der „Survival Function“ mit Kaplan-Meier-Kurven und anderen graphischen Verfahren veranschaulichen und interpretieren kann.
Wie so oft erscheint es auf den ersten Blick trivial, in einer klinischen Studie die Zahl der Überlebenden zu ermitteln und graphisch aufzutragen, aber bei genauem Hinsehen ergeben sich diverse Fallstricke. Wer sich tiefer in die Materie einlesen möchte, dem sei eine Serie zum Thema Survival Analysis empfohlen, die vor 20 Jahren im British Journal of Cancer erschienen ist [1–4] und bis heute nichts an Aktualität eingebüßt hat.
Georg Hoffmann und Frank Klawonn