Überprüfung von Referenzintervallen: Zwei Verfahren im Praxisvergleich
Die regelmäßige Überprüfung von Referenzintervallen aus Daten des Laborinformationssystems ist eine wichtige Aufgabe im Routinelabor. Am Beispiel von Parametern des kleinen Blutbilds werden zwei weitgehend automatisierbare, indirekte Verfahren verglichen, wobei der Fokus auf Senioren liegt. Sie liefern trotz unterschiedlicher Algorithmen sehr ähnliche Ergebnisse, die aber von den Literaturangaben teilweise deutlich abweichen. Die Übernahme in die Stammdaten des jeweiligen Analyten darf nicht dem Computer überlassen werden.
Schlüsselwörter: Referenzintervalle, indirekte Verfahren, Senioren, Blutbild
Die leitliniengerechte Überprüfung von Referenzintervallen aus Literatur- oder Herstellerangaben gestaltete sich bislang schwierig, da für eine direkte Bestimmung mit großem Aufwand selektierte Referenzpersonen untersucht werden mussten. Deshalb stellt eine 2018 publizierte IFCC-Empfehlung von Jones et al. [1] eine erhebliche Entlastung der Laboratorien dar.
Sie geht von der Annahme aus, dass Referenzgrenzen mithilfe geeigneter statistischer Verfahren auch aus Routinedaten berechnet werden können, wenn diese zum Großteil aus unauffälligen Messwerten bestehen. Die Publikation zählt folgende Vorteile dieser indirekten Verfahren auf:
- schnellere und preisgünstigere Ergebnisse, keine Risiken für Patienten;
- identische analytische und präanalytische Bedingungen wie im Routinebetrieb;
- größere statistische Sicherheit durch hohe Fallzahlen.
Als potenzieller Nachteil wird die Störung der statistischen Berechnungen durch pathologische Subpopulationen in den gemischten Datensätzen genannt. Die Autoren fordern deshalb Laboratorien auf, indirekte Verfahren in der Praxis zu evaluieren und so einen Beitrag zur Weiterentwicklung der neuen Technik zu leisten. Diesem Ziel soll auch der vorliegende Artikel dienen.
Beispiel Blutbild
Zu einer der häufigsten Anforderungen im klinischen Laboralltag zählt das kleine Blutbild [2]. Es stellt im medizinischen Laboratorium eine Basisuntersuchung dar, die durch den Einsatz von Hämatologie-Analysatoren in nur kurzer Zeit kostengünstig wichtige Hinweise auf Störungen der Hämatopoese oder reaktive Veränderungen liefern kann. Aufgrund von besonders vielen verfügbaren Werten wurden Blutbild-Parameter als Datengrundlage für die durchgeführten Untersuchungen ausgewählt. Außerdem durften interessante Abweichungen für ältere Menschen erwartet werden [3].
Nach verschiedenen Schritten zur Datenvorbereitung, wie beispielsweise Entfernung von Nichtzahlenwerten und Patientenduplikaten, standen für den Praxisvergleich zweier Anwendungen insgesamt 14.356 Daten für die 21- bis 60-Jährigen zur Verfügung – 7.196 von Frauen und 7.160 von Männern. Für den Vergleich in der Altersklasse 61 bis 80 Jahre konnten Daten von 6.619 Frauen und 6.066 Männern verwendet werden.
Methoden
Auf der Suche nach einem Werkzeug zur indirekten Überprüfung von Referenzintervallen, das auch für Fallzahlen in kleineren Einrichtungen oder für die Aufschlüsselung feinerer Alterskategorien geeignet ist, wurden zum einen der Reference Limit Estimator (RLE) von der Homepage der DGKL, zum anderen der Trillium Normalizer Professional (TNP) des Trillium Fachverlages miteinander verglichen. Bei diesen indirekten Methoden lassen sich Referenzintervalle retroperspektiv aus bereits vorhandenen Labor-Routinedaten ableiten, wenn der Anteil der pathologischen Werte nicht zu hoch ist (in der Regel < 20 %).
Beim RLE erfolgen die sehr umfangreichen und komplexen Auswertungen mit dem Statistikprogramm R [4].
Tab. 1: Gegenüberstellung ausgewählter Eigenschaften der beiden verglichenen Tools RLE und TNP. Wesentliche Unterschiede für den Anwender zeigen sich bei der Daten- Selektierung und der Mindeststichprobengröße.
RLE | TNP | |
---|---|---|
Mindeststichprobengröße | 4.000 | etwa 100 pro Subgruppe |
Integration in Labor-EDV | möglich | derzeit nicht vorhanden |
Daten-Selektierung
| Geschlecht und Alter automatisiert möglich | Auswahl durch Markierung mit der Maus |
Auswertetechnik | R und MS Excel | VBA und MS Excel |
Grafik | Dichtekurve | QQ-Plot |
Grundlage des Verfahrens | Kerndichteschätzung nach Box-Cox-Transformation [5] | modifiziertes Boxplot- und QQ-Plot-Verfahren [6] |
Aufgrund der einfacheren und übersichtlicheren Bedienung wird jedoch als Steuerelement die Microsoft Excel-Oberfläche verwendet. Die Referenzintervalle werden auf Grundlage von Rechenoperationen eines Kerndichte-Verfahrens nach Box-Cox-Transformation mit Lambdawerten zwischen 0 (Lognormalverteilung) und 1 (Normalverteilung) ermittelt [5].
Der TNP arbeitet mit einem modifizierten Boxplot-Verfahren, in dem automatisierte Schritte so oft wiederholt werden, bis das Programm keine Ausreißer mehr findet; anschließend berechnet man die Perzentilen 2,5 und 97,5 mit einem Quantil-Quantil-Plot (QQ-Plot)-Verfahren.
Ergebnisse Methodenvergleich
Die Daten-Selektierung war mit dem RLE automatisiert möglich, sofern der Datensatz Angaben zu Alter und Geschlecht enthielt; mit dem TNP konnten die Daten zur Auswertung der interessierenden Untergruppen mit der Maus manuell in verschiedene Gruppen unterteilt werden. Die aufwendigeren statistischen Algorithmen, Dichtekurvenprüfungen und umfangreichen Rechenoperationen des RLE erforderten einen höheren Zeitaufwand pro Auswertung, lieferten jedoch auch detailliertere grafische Ergebnisse als der TNP. Die mit beiden Verfahren ermittelten Referenzintervalle stimmten in Anbetracht der sehr unterschiedlichen Algorithmen überraschend gut überein (vgl. Abb. 1 und Tab. 2).
Tab. 2: Methodenvergleich für 61- bis 80-jährige Frauen und Männer. UG = Untergrenze, OG = Obergrenze. Die Ergebnisse von RLE und TNP stimmen gut überein, weichen jedoch bei den Leukozyten an der Obergrenze von den publizierten Werten ab.
Analyt | Geschlecht | UG TNP | UG RLE | OG TNP | OG RLE |
---|---|---|---|---|---|
Hb (mmol/l) | w | 7,4 | 7,5 | 10,0 | 10,2 |
m | 7,8 | 8,0 | 10,8 | 10,9 | |
MCV (fl) | w | 81 | 81 | 96 | 95 |
m | 82 | 82 | 98 | 98 | |
Thrombozyten (109/l) | w | 150 | 139 | 374 | 363 |
m | 122 | 125 | 343 | 358 | |
Leukozyten (109/l) | w | 4,3 | 4,3 | 14,1 | 12,9 |
m | 4,2 | 4,1 | 14,0 | 13,6 |
Bei der Obergrenze der Leukozyten ergaben sich bei beiden Geschlechtern deutliche Abweichungen von den in der EDV hinterlegten Werten. Übereinstimmend zeigte sich jedoch nach weiterer Prüfung der Dichtekurven bzw. QQ-Plots, dass weder der RLE noch der TNP die Daten leicht erhöhter Messwerte bei den Leukozyten vom Hauptkollektiv der „offensichtlich Gesunden“ abtrennen konnte. Diese Beobachtung, die auch bei CRP, Ferritin und anderen Parametern gemacht werden kann, veranschaulicht eine Limitierung der Einsatzmöglichkeiten von indirekten Methoden bei Entzündungsparametern – zumindest im stationären Bereich. In diesem Fall müssen direkte Methoden angewendet werden.
Überprüfung bisher verwendeter Referenzintervalle
Solche Plausibilitätsprüfungen mit Blick auf die bisher verwendeten Referenzintervalle mussten für jeden Einzel-Analyten durchgeführt werden. Mit statistischen Verfahren, die in die beiden Programme integriert sind, wurde geprüft, ob sich die bisherigen Unter- und Obergrenzen eines Referenzintervalls innerhalb des zulässigen 95-%-Vertrauensbereichs befanden. Dies konnte sowohl mit dem RLE als auch dem TNP in der Altersklasse der 21- bis 60-Jährigen überwiegend bestätigt werden, weshalb es zumindest aus statistischer Sicht keinen Handlungsbedarf zur Anpassung der Referenzintervalle gab.
Besonderheiten älterer Menschen
Eine feinere Aufgliederung der Besonderheiten in der Altersstruktur gelang aufgrund der Mindeststichprobengröße (siehe Tab. 1) nur mit dem TNP, geriet aber auch hier bei der Auswertung von beispielsweise den über 100-Jährigen an Grenzen. Abb. 3 veranschaulicht am Beispiel von Hb die Abweichungen im höheren Alter anhand der Auswertung in Dekaden.
Man erkennt bei beiden Geschlechtern einen deutlichen Abfall der Untergrenzen, der bislang in der EDV nicht berücksichtigt war.
Zur Bestätigung wurden Untersuchungen in größeren Alterskategorien der 21- bis 60-jährigen sowie der 61- bis 80-jährigen Frauen und Männer durchgeführt, um auch für den RLE eine ausreichend große Fallzahl zu erhalten. Übereinstimmend ergaben sich Abweichungen nach unten besonders bei den 61- bis 80-jährigen Männern. Hier lagen die mit beiden Programmen ermittelten Referenzuntergrenzen beispielsweise für das Hb wesentlich niedriger als bei den jüngeren Patienten (vgl. Tab. 3).
Tab. 3: Methodenvergleich für Hb-Referenzintervalle mit dem RLE und dem TNP für die 21- bis 60-Jährigen und die 61- bis 80-Jährigen beider Geschlechter. Während der Altersgang bei den Frauen kaum Auswirkungen auf die ermittelten Referenzintervalle zeigte, konnten bei den älteren Männern Abweichungen besonders an der Referenzintervalluntergrenze gefunden werden.
Analyt | Geschlecht | UG TNP 21–60 J. | UG TNP 61–80 J. | OG TNP 21–60 J. | OG TNP 61–80 J. |
---|---|---|---|---|---|
Hb (mmol/l) | w | 7,4 | 7,4 | 10,1 | 10,0 |
m | 8,5 | 7,8 | 11 | 10,8 | |
Analyt | Geschlecht | UG TNP 21–60 J. | UG TNP 61–80 J. | OG TNP 21–60 J. | OG TNP 61–80 J. |
Hb (mmol/l) | w | 7,4 | 7,5 | 10,1 | 10,2 |
m | 8,5 | 8,0 | 11,2 | 10,9 |
Diskussion
Grundsätzlich muss hier die Frage diskutiert werden, woher solche Veränderungen bei älteren Menschen resultieren und ob diese im Sinne einer reduzierten Knochenmarksleistung tatsächlich als „physiologisch“ angesehen werden dürfen oder ob eine zunehmende Morbidität dieser Altersgruppe sowie Veränderungen im Lebensstil darauf Einfluss haben könnten. In der Literatur werden Ursachen teilweise mit einer Mangelernährung oder als Begleitung einer chronischen Erkrankung begründet, sind aber größtenteils unklarer Natur [7]. Anämien gemäß WHO-Definition findet man mit zunehmender Prävalenz im Alter [8] und noch häufiger bei Patientinnen und Patienten im Krankenhaus und bei Pflegeheimbewohnern [9]. Deshalb ist die Frage berechtigt, ob man tatsächlich eine Anpassung der gefundenen Referenzintervalle unter diagnostischen und therapeutischen Gesichtspunkten vornehmen sollte, wenn sich bei der routinemäßigen Überprüfung mit einem indirekten Verfahren Abweichungen von den aus der Literatur oder dem Beipackzettel erwarteten Grenzwerten ergeben. Diese Entscheidung ist medizinischer bzw. allenfalls organisatorischer und ökonomischer, nicht aber statistischer Natur und muss für jeden Einzelparameter kritisch geprüft werden.
Im Gegensatz zu den Männern ließen sich bei den älteren Frauen trotz eines nachweisbaren Altersgangs der Messwerte kaum Unterschiede bei den ermittelten Referenzintervallen im Vergleich zu den jüngeren Frauen finden. Der Grund liegt vermutlich darin, dass menstruationsbedingter Blutverlust vor der Menopause und verringerte Knochenmarksleistung im höheren Alter gleichsinnige Effekte auf die Hb-Konzentration haben.
Trotz der umfangreichen Statistik, die die hier vorgestellten Tools einsetzen, erfordern die Ergebnisse immer fachkundige Interpretation und Bewertung unter Einbeziehung physiologischer und pathophysiologischer Kriterien [1]. Statistische Schätzwerte dürfen nicht automatisch in die Labor-EDV und damit auf den Befundbericht übernommen werden. Die Ermittlung und Überprüfung von Referenzintervallen liegt letztlich immer in der Verantwortung des Labors und kann keinesfalls dem Computer überlassen werden.
Auszug aus der Masterarbeit der Autorin im Fachgebiet Biomedical Sciences an der FHG Tirol.