Überprüfung von Referenzintervallen: Zwei Verfahren im Praxisvergleich

Die regelmäßige Überprüfung von Referenzintervallen aus Daten des Laborinformationssystems ist eine wichtige Aufgabe im Routinelabor. Am Beispiel von Parametern des kleinen Blutbilds werden zwei weitgehend automatisierbare, indirekte Verfahren verglichen, wobei der Fokus auf Senioren liegt. Sie liefern trotz unterschiedlicher Algorithmen sehr ähnliche Ergebnisse, die aber von den Literaturangaben teilweise deutlich abweichen. Die Übernahme in die Stammdaten des jeweiligen Analyten darf nicht dem Computer überlassen werden.

Schlüsselwörter: Referenzintervalle, indirekte Verfahren, Senioren, Blutbild

Die leitliniengerechte Überprüfung von Referenzintervallen aus Literatur- oder Herstellerangaben gestaltete sich bislang schwierig, da für eine direkte Bestimmung mit großem Aufwand selektierte Referenzpersonen untersucht werden mussten. Deshalb stellt eine 2018 publizierte IFCC-Empfehlung von Jones et al. [1] eine erhebliche Entlastung der Laboratorien dar.
Sie geht von der Annahme aus, dass Referenzgrenzen mithilfe geeigneter statistischer Verfahren auch aus Routinedaten berechnet werden können, wenn diese zum Großteil aus unauffälligen Messwerten bestehen. Die Publikation zählt folgende Vorteile dieser indirekten Verfahren auf:

  • schnellere und preisgünstigere Ergebnisse, keine Risiken für Patienten;
  • identische analytische und präanalytische Bedingungen wie im Routinebetrieb;
  • größere statistische Sicherheit durch hohe Fallzahlen.

Als potenzieller Nachteil wird die Störung der statistischen Berechnungen durch pathologische Subpopulationen in den gemischten Datensätzen genannt. Die Autoren fordern deshalb Laboratorien auf, indirekte Verfahren in der Praxis zu evaluieren und so einen Beitrag zur Weiterentwicklung der neuen Technik zu leis­ten. Diesem Ziel soll auch der vorliegende Artikel dienen.

Beispiel Blutbild

Zu einer der häufigsten Anforderungen im klinischen Laboralltag zählt das kleine Blutbild [2]. Es stellt im medizinischen Laboratorium eine Basisuntersuchung dar, die durch den Einsatz von Hämatologie-Analysatoren in nur kurzer Zeit kostengünstig wichtige Hinweise auf Störungen der Hämatopoese oder reaktive Veränderungen liefern kann. Aufgrund von besonders vielen verfügbaren Werten wurden Blutbild-Parameter als Datengrundlage für die durchgeführten Untersuchungen ausgewählt. Außerdem durften interessante Abweichungen für ältere Menschen erwartet werden [3].
Nach verschiedenen Schritten zur Datenvorbereitung, wie beispielsweise Entfernung von Nichtzahlenwerten und Patientenduplikaten, standen für den Praxisvergleich zweier Anwendungen insgesamt 14.356 Daten für die 21- bis 60-Jährigen zur Verfügung – 7.196 von Frauen und 7.160 von Männern. Für den Vergleich in der Altersklasse 61 bis 80 Jahre konnten Daten von 6.619 Frauen und 6.066 Männern verwendet werden.

Methoden

Auf der Suche nach einem Werkzeug zur indirekten Überprüfung von Referenzintervallen, das auch für Fallzahlen in kleineren Einrichtungen oder für die Aufschlüsselung feinerer Alterskategorien geeignet ist, wurden zum einen der Reference Limit Estimator (RLE) von der Homepage der DGKL, zum anderen der Trillium Normalizer Professional (TNP) des Trillium Fachverlages miteinander verglichen. Bei diesen indirekten Methoden lassen sich Referenz­intervalle retroperspektiv aus bereits vorhandenen Labor-Routine­daten ableiten, wenn der Anteil der pathologischen Werte nicht zu hoch ist (in der Regel < 20 %).
Beim RLE erfolgen die sehr umfangreichen und komplexen Auswertungen mit dem Statis­tikprogramm R [4].

Tab. 1: Gegenüberstellung ausgewählter Eigenschaften der beiden verglichenen Tools RLE und TNP. Wesentliche Unterschiede für den Anwender zeigen sich bei der Daten- Selektierung und der Mindeststichprobengröße.

  RLE TNP
Mindeststichprobengröße 4.000 etwa 100 pro Subgruppe
Integration in Labor-EDV möglich derzeit nicht vorhanden

Daten-Selektierung

 

Geschlecht und Alter
automatisiert möglich
Auswahl durch Markierung mit der Maus
Auswertetechnik R und MS Excel VBA und MS Excel
Grafik Dichtekurve QQ-Plot
Grundlage des Verfahrens Kerndichteschätzung nach Box-Cox-Transformation [5] modifiziertes Boxplot- und
QQ-Plot-Verfahren [6]

 

Aufgrund der einfacheren und übersichtlicheren Bedienung wird jedoch als Steuer­element die Microsoft Excel-Oberfläche verwendet. Die Referenzintervalle werden auf Grundlage von Rechenoperationen eines Kerndichte-Verfahrens nach Box-Cox-Transformation mit Lambdawerten zwischen 0 (Lognormalverteilung) und 1 (Normalverteilung)  ermittelt [5].
Der TNP arbeitet mit einem modifizierten Boxplot-Verfahren, in dem automatisierte Schritte so oft wiederholt werden, bis das Programm keine Ausreißer mehr findet; anschließend berechnet man die Perzentilen 2,5 und 97,5 mit einem Quantil-Quantil-Plot (QQ-Plot)-Verfahren.

Ergebnisse Methodenvergleich

Die Daten-Selektierung war mit dem RLE automatisiert möglich, sofern der Datensatz Angaben zu Alter und Geschlecht enthielt; mit dem TNP konnten die Daten zur Auswertung der interessierenden Untergruppen mit der Maus manuell in verschiedene Gruppen unterteilt werden. Die aufwendigeren statistischen Algorithmen, Dichte­kurvenprüfungen und umfangreichen Rechenoperationen des RLE erforderten einen höheren Zeitaufwand pro Auswertung, lieferten jedoch auch detailliertere grafische Ergebnisse als der TNP. Die mit beiden Verfahren ermittelten Referenzintervalle stimmten in Anbetracht der sehr unterschiedlichen Algorithmen überraschend gut überein (vgl. Abb. 1 und Tab. 2).

Tab. 2: Methodenvergleich für 61- bis 80-jährige Frauen und Männer. UG = Untergrenze, OG = Obergrenze. Die Ergebnisse von RLE und TNP stimmen gut überein, weichen jedoch bei den Leukozyten an der Obergrenze von den publizierten Werten ab.

Analyt Geschlecht UG TNP UG RLE OG TNP OG RLE
Hb (mmol/l) w 7,4 7,5 10,0 10,2
m 7,8 8,0 10,8 10,9
MCV (fl) w 81 81 96 95
m 82 82 98 98
Thrombozyten (109/l) w 150 139 374 363
m 122 125 343 358
Leukozyten (109/l) w 4,3 4,3 14,1 12,9
m 4,2 4,1 14,0 13,6

 

Bei der Obergrenze der Leukozyten ergaben sich bei beiden Geschlechtern deutliche Abweichungen von den in der EDV hinterlegten Werten. Übereinstimmend zeigte sich jedoch nach weiterer Prüfung der Dichtekurven bzw. QQ-Plots, dass weder der RLE noch der TNP die Daten leicht erhöhter Messwerte bei den Leukozyten vom Hauptkollektiv der „offensichtlich Gesunden“ abtrennen konnte. Diese Beobachtung, die auch bei CRP, Ferritin und anderen Parametern gemacht werden kann, veranschaulicht eine Limitierung der Einsatzmöglichkeiten von indirekten Methoden bei Entzündungsparametern – zumindest im stationären Bereich. In diesem Fall müssen direkte Methoden angewendet werden.

Überprüfung bisher verwendeter Referenzintervalle

Solche Plausibilitätsprüfungen mit Blick auf die bisher verwendeten Referenzintervalle mussten für jeden Einzel-Analyten durchgeführt werden. Mit statistischen Verfahren, die in die beiden Programme integriert sind, wurde geprüft, ob sich die bisherigen Unter- und Obergrenzen eines Referenzintervalls innerhalb des zulässigen 95-%-Vertrauensbereichs befanden. Dies konnte sowohl mit dem RLE als auch dem TNP in der Altersklasse der 21- bis 60-Jährigen überwiegend bestätigt werden, weshalb es zumindest aus statistischer Sicht keinen Handlungsbedarf zur Anpassung der Referenzintervalle gab.

Besonderheiten älterer Menschen

Eine feinere Aufgliederung der Besonderheiten in der Altersstruktur gelang aufgrund der Mindeststichprobengröße (siehe Tab. 1) nur mit dem TNP, geriet aber auch hier bei der Auswertung von beispielsweise den über 100-Jährigen an Grenzen. Abb. 3 veranschaulicht am Beispiel von Hb die Abweichungen im höheren Alter anhand der Auswertung in Dekaden.

Man erkennt bei beiden Geschlechtern einen deutlichen Abfall der Untergrenzen, der bislang in der EDV nicht berücksichtigt war.
Zur Bestätigung wurden Untersuchungen in größeren Alterskategorien der 21- bis 60-jährigen sowie der 61- bis 80-jährigen Frauen und Männer durchgeführt, um auch für den RLE eine ausreichend große Fallzahl zu erhalten. Übereinstimmend ergaben sich Abweichungen nach unten besonders bei den 61- bis 80-jährigen Männern. Hier lagen die mit beiden Programmen ermittelten Referenzuntergrenzen beispielsweise für das Hb wesentlich niedriger als bei den jüngeren Patienten (vgl. Tab. 3).

Tab. 3: Methodenvergleich für Hb-Referenzintervalle mit dem RLE und dem TNP für die 21- bis 60-Jährigen und die 61- bis 80-Jährigen beider Geschlechter. Während der Altersgang bei den Frauen kaum Auswirkungen auf die ermittelten Referenzintervalle zeigte, konnten bei den älteren Männern Abweichungen besonders an der Referenz­intervalluntergrenze gefunden werden.

Analyt

Geschlecht

UG TNP
21–60 J.
UG TNP
61–80 J.
OG TNP
21–60 J.
OG TNP
61–80 J.
Hb (mmol/l) w 7,4 7,4 10,1 10,0
m 8,5 7,8 11 10,8
Analyt

Geschlecht

UG TNP
21–60 J.
UG TNP
61–80 J.
OG TNP
21–60 J.
OG TNP
61–80 J.
Hb (mmol/l) w 7,4 7,5 10,1 10,2
m 8,5 8,0 11,2 10,9

 

Diskussion

Grundsätzlich muss hier die Frage diskutiert werden, woher solche Veränderungen bei älteren Menschen resultieren und ob diese im Sinne einer reduzierten Knochenmarks­­­leistung tatsächlich als „physiologisch“ angesehen werden dürfen oder ob eine zunehmende Morbidität dieser Altersgruppe sowie Veränderungen im Lebensstil darauf Einfluss haben könnten. In der Literatur werden Ursachen teilweise mit einer Mangel­ernährung oder als Begleitung einer chronischen Erkrankung begründet, sind aber größtenteils unklarer Natur [7]. Anämien gemäß WHO-Definition findet man mit zunehmender Prävalenz im Alter [8] und noch häufiger bei Patientinnen und Patienten im Krankenhaus und bei Pflegeheimbewohnern [9]. Deshalb ist die Frage berechtigt, ob man tatsächlich eine Anpassung der gefundenen Referenzintervalle unter diagnostischen und therapeutischen Gesichtspunkten vornehmen sollte, wenn sich bei der routinemäßigen Überprüfung mit einem indirekten Verfahren Abweichungen von den aus der Literatur oder dem Beipackzettel erwarteten Grenzwerten ergeben. Diese Entscheidung ist medizinischer bzw. allenfalls organisatorischer und ökonomischer, nicht aber statistischer Natur und muss für jeden Einzelparameter kritisch geprüft werden.
Im Gegensatz zu den Männern ließen sich bei den älteren Frauen trotz eines nachweisbaren Altersgangs der Messwerte kaum Unterschiede bei den ermittelten Referenzintervallen im Vergleich zu den jüngeren Frauen finden. Der Grund liegt vermutlich darin, dass menstruationsbedingter Blutverlust vor der Menopause und verringerte Knochenmarksleistung im höheren Alter gleichsinnige Effekte auf die Hb-Konzentration haben.
Trotz der umfangreichen Statis­tik, die die hier vorgestellten Tools einsetzen, erfordern die Ergebnisse immer fachkundige Interpretation und Bewertung unter Einbeziehung physiologischer und pathophysiologischer Kriterien [1]. Statistische  Schätzwerte dürfen nicht automatisch in die Labor-EDV und damit auf den Befundbericht übernommen werden.  Die Ermittlung und Überprüfung von Referenzintervallen liegt letztlich immer in der Verantwortung des Labors und kann keinesfalls dem Computer überlassen werden.   

Auszug aus der Masterarbeit der Autorin im Fachgebiet Biomedical Sciences an der FHG Tirol.