Stuhluntersuchung bei chronisch-entzündlichen Darmerkrankungen: Keineswegs trivial

DOI: https://doi.org/10.47184/td.2023.04.04

Bei Colitis ulcerosa und Morbus Crohn, den beiden häufigsten chronisch-entzündlichen Darmerkrankungen, ist die Analyse von Stuhlproben wegweisend für die Beurteilung der Entzündungsaktivität und der gestörten Barriere­funktion. Den Vorteilen einer nicht-invasiven Probengewinnung stehen Herausforderungen bei der Interpretation der Messergebnisse gegenüber. Insbesondere die von der IFCC geforderte Überprüfung von Referenzintervallen aus Daten des eigenen Patientenguts ist keineswegs trivial.

Schlüsselwörter: CED, Stuhldiagnostik, Referenzintervalle, Calprotectin, Zonulin, CRP, IgA, Alpha-1-Antitrypsin

Bereits in der Antike war die zentrale Bedeutung des Magen-Darm-Trakts für das körperliche Wohlbefinden bekannt. Hippokrates wird der Satz zugeschrieben: „Alle Krankheiten beginnen im Darm“.

In Europa leben derzeit ungefähr zwei Millionen Menschen mit chronisch-entzündlichen Darmerkrankungen (CED). Mit ca. 250.000 bzw. 400.000 Fällen sind in Deutschland Morbus Crohn (MC) und Colitis ulcerosa (CU) die beiden Hauptvertreter. Während MC-Läsionen im gesamten Verdauungstrakt vorkommen können, fokussiert sich die CU auf das Kolon (Abb. 1).

Andere zum Formenkreis der CED gerechnete Erkrankungen wie die kollagene Kolitis treten weit seltener auf.

Typische Symptome sind starke Bauchschmerzen und Diarrhö. Der Verlauf ist allerdings sehr variabel und kann von einem einmaligen Ereignis bis zu lebenslanger Erkrankungsaktivität reichen. In etwa einem Drittel kommt es zu rezidivierenden Schüben, die von zwischenzeitlichen Ruhepausen geprägt sind. Bei MC können Fisteln, Stenosen und Konglomerattumoren, bei CU fibrotische Darmveränderungen mit erhöhtem Krebsrisiko auftreten.

Die Pathogenese der CED ist komplex und noch nicht abschließend geklärt. Gesichert erscheint eine genetische Prädisposition. Dabei spielen Gene, die an der Barrierefunktion, Immun­regulation, Autophagie und Zellmigration beteiligt sind, eine entscheidende Rolle [1]. Eine weitere Hypothese besagt, dass der gestiegene Hygienestandard in westlichen Ländern zu verminderter Auseinandersetzung mit Infektionskrankheiten führt, was sich negativ auf das Darm-assoziierte Immunsystem (Immuntoleranz versus Immunantwort) auswirken kann [2]. Auch eine verminderte Diversität unserer Darmmikrobiota wird als pathogenetisch bedeutsamer Faktor diskutiert [1].

Als Folge der chronischen Entzündung ist häufig die natürliche Barrierefunktion des Darms gestört. Zellkontakte zwischen den Epithelzellen der Darmschleimhaut – die sog. Tight Junctions – verhindern das Eindringen von Schadstoffen oder Mikroorganismen aus dem Darmlumen in den Körper und die Blutbahn. Eine intakte Darmbarriere ermöglicht neben der mechanischen Stabilisierung des Epithelverbands auch das Eindringen von Molekülen (u. a. Ionen und Wasser) über den parazellulären Transportweg. Als Regulator dient das von den Darmepithelzellen gebildete Zonulin, welches interepitheliale Kanäle öffnet und so die Permeabilität der Schleimhaut erhöht.

Bei CED und anderen Erkrankungen, wie etwa bakterieller Fehlbesiedelung, kann es zu dauerhafter Überexpression von Zonulin kommen, die den Übertritt von Mikroorganismen, unvollständig verdauten Nahrungsbestandteilen und Schadstoffen in den Organismus erleichtert. Dieser als leaky gut (durchlässiger Darm) bezeichnete Zustand kann zu systemischer Entzündungsaktivität mit Nahrungsmittelallergien und Bildung von Autoantikörpern führen [2].

Den Teufelskreis aus chronischer Entzündung und gestörter Barrierefunktion zu durchbrechen ist eine große therapeutische Herausforderung. Deshalb erfordern Behandlung und Verlaufskontrolle eine intensive interdisziplinäre Zusammenarbeit von Gastroenterologie, Viszeralchirurgie, Ernährungswissenschaften, Psychologie, Radiologie und Laboratoriumsmedizin [1].

 

Labordiagnostik

Über die Bestimmung von Biomarkern im Blut wurde in dieser Zeitschrift vor zwei Jahren bereits ausführlich berichtet [3]. Demnach kommen zur Bestätigung der Diagnose vor allem Autoantikörper wie etwa atypische ANCA (anti-neutrophile zytoplasmatische Antikörper) und ASCA (Anti-Saccharomyces-cerevisiae-Antikörper) zum Einsatz, die in klinisch unklaren Fällen auch eine Unterscheidung zwischen Colitis ulcerosa und Morbus Crohn erlauben. Anti-Tissue-Transglutaminase-Tests dienen der Abgrenzung der differenzial­diagnostisch wichtigen Zöliakie.

Für das Monitoring der Entzündungsaktivität eignen sich vor allem CRP und Differenzialblutbild, und für die Erkennung einer bei CED gehäuft auftretenden Mangelernährung sind u. a. Albumin, Hämoglobin, Ferritin, Zink sowie die Vitamine A, D, E, B12 und Folsäure indiziert.

 

Untersuchung von Stuhlproben

In dieser Ausgabe richten wir unser Augenmerk auf die Untersuchung von Stuhlproben. Tab. 1 zeigt eine Auswahl geeigneter Proteinmarker von A wie Alpha-1-Antitrypsin bis Z wie Zonulin.

Tab. 1: Ausgewählte Biomarker für die CED-Diagnostik im Stuhl.

Biomarker

Beurteilung

Alpha-1-Antitrypsin

Alpha-1-Antitrypsin wird vor allem in Hepatozyten gebildet und bei Entzündungen in den Darm   freigesetzt. Als Proteasehemmer begrenzt es die Schädigung von gesundem Gewebe. In der Stuhldiagnostik gilt es als indirekter Biomarker einer erhöhten Darmpermeabilität.

Calprotectin (CP)

CP hat eine immunregulatorische Funktion [8, 9]  und ist ein etablierter Biomarker zur Unterscheidung zwischen entzündlichen und nicht-entzündlichen Darmerkrankungen. Die Konzentration im Stuhl korreliert mit dem klinischen oder endoskopischen Krankheitsbild.

C-reaktives Protein (CRP)

CRP dient als Indikator für Entzündungen der Darmschleimhaut. Als klassisches Akute-Phase-Protein aktiviert es das unspezifische Abwehr­system vor allem gegen bakterielle Erreger.

sekretorisches Immunglobulin A (sIgA)

IgA-Antikörper werden insbesondere von Zellen der Darmschleimhaut gebildet. Sie bilden eine Art Schutzschicht zur Immunabwehr. Erhöhte Werte deuten auf eine gesteigerte lokale Entzündungs­aktivität der Darmschleimhaut hin.

Zonulin

Zonulin ist ein physiologischer Regulator der intestinalen Darmpermeabilität. Es gilt als Biomarker für das „Leaky-Gut-Syndrom“, das bei einer Vielzahl von chronisch-entzündlichen Darmerkrankungen auftritt [2,10].

Sie bieten dank der nicht-invasiven Probennahme und der unkomplizierten Präanalytik durchaus Vorteile gegenüber Blutuntersuchungen.

Wichtig ist eine ausreichende Befüllung der Stuhlröhrchen und Schutz vor extremer Hitze oder Kälte. In der Regel kommen die Proben innerhalb von zwei Tagen im Labor an, was für die Stabilität der Messungen völlig ausreicht. Der Postversand sollte nicht unmittelbar vor Wochenenden oder Feiertagen erfolgen. Gegebenenfalls können die Röhrchen im Kühlschrank aufbewahrt werden.

Laut einer Studie zur Probenstabilität für Mikrobiom- und Metabolomuntersuchungen im Stuhl [4] sind Aufbewahrung und Versand bei Raumtemperatur unproblematisch. Ein Versandmedium zur Stabilisierung wird nicht empfohlen. Vor der Analyse ist eine gute Durchmischung (Homogenisierung) der Proben wichtig. Bei Diarrhö kann es aufgrund von Verdünnungs­effekten zu falsch niedrigen Werten kommen.

Als intestinale Entzündungsmarker eignen sich neben dem in Tab. 1 aufgeführten Calprotectin (CP) und dem C-reaktiven Protein (CRP) auch Laktoferrin, Lysozym und PMN-Elastase. Das sekretorische Immunglobulin A (sIgA) gilt als Marker des Darm-assoziierten Immunsystems (GALT = gut-associated lymphoid tissue). Als Maß für die Intaktheit der Darmbarriere werden Zonulin und Alpha-1-Antitrypsin eingesetzt.

Von differenzialdiagnostischer Bedeutung sind darüber hinaus mikrobiologische und molekularbiologische Untersuchungen (Stuhlkultur, Mikrobiota-Analyse), um Infektionen und Fehlbesiedelungen des Darms auszuschließen, die die Symptome von CED imitieren können.

All diese Stuhluntersuchungen sind in erster Linie als ergänzende Maßnahmen anzusehen, wenn entweder die Diagnose einer CED mittels Bildgebung, Endo­skopie und Histologie bereits gesichert ist oder aber, wenn bei bestehenden Darmbeschwerden anderweitig keine eindeutige Diagnose gestellt werden konnte.

Im ersten Fall geht es oft darum, den Erfolg einer Therapie durch den Rückgang von Entzündungs- und Permeabilitätsmarkern zu dokumentieren, im zweiten – weitaus häufigeren – Fall soll geprüft werden, ob überhaupt Anzeichen für eine intestinale Entzündung oder eine Störung der Darmbarriere vorliegen.

Einsendungen mit dieser zweiten Fragestellung kommen nicht nur aus Haus- und Facharztpraxen, sondern vor allem auch aus der alternativ- und komplementärmedizinischen Szene oder von den Patientinnen und Patienten selbst. Deshalb muss bei Stuhluntersuchungen von laborärztlicher Seite besonderer Wert auf eine verantwortungsvolle Interpretation der Analysenergebnisse gelegt werden.

In der Tat war der Auslöser für die vorliegende Studie der hohe Anteil pathologischer Befunde bei Stuhlunter­suchungen. Dies fiel vor allem bei der am häufigsten angeforderten Calprotectinbestimmung auf. Hier gibt der Hersteller einen Grenzwert von 50 µg pro Gramm Stuhl an und empfiehlt jedem Labor, einen eigenen Referenzwert festzulegen. Da im Rahmen der Akkreditierung die Überprüfung von Herstellerangaben ohnehin vorgeschrieben ist, entschieden wir uns für eine syste­matische statistische Analyse auf Basis von Routinewerten aus dem Laborinformationssystem [5].

 

Referenzintervalle

Definitionsgemäß umfassen Referenz­intervalle die zentralen 95 % von Messwerten, die an einer gesunden Population erhoben wurden. Laut einer IFCC-Empfehlung aus dem Jahr 2018 ist es allerdings erlaubt bzw. sogar erwünscht, Daten aus gemischten Kollektiven von Gesunden und Kranken zu analysieren, die dem labor­eigenen Einsenderkollektiv möglichst nahekommen [6].

Die wichtigste Voraussetzung für dieses Vorgehen ist, dass der Anteil der pathologischen Werte einen bestimmten Prozentsatz – in der Regel 20 bis 25 % – nicht überschreitet. Mithilfe eines mehrstufigen mathematischen Verfahrens versucht man, im Datensatz eine „statistisch gesunde“, sprich homogen verteilte Hauptpopulation zu identifizieren, die durch eine Modellannahme – zum Beispiel eine Gaußverteilung – beschrieben werden kann [7]. Ist dies der Fall, dann lassen sich die Grenzwerte an den 2,5. und 97,5. Perzentilen aus dem Modell berechnen, auch wenn sich dort Überlappungen mit pathologischen Werten befinden. Für routinemäßige Blutuntersuchungen stehen mittlerweile ausgereifte statistische Verfahren zur Verfügung, aber die Überprüfung von Stuhlparametern ist unseres Wissens noch weitgehend Neuland.

Als größte Herausforderung sahen wir es an, dass wir den Anteil der Kranken in unserem Patientengut nicht kannten. Wir gingen aber davon aus, dass dieser relativ hoch ist, weil die Stuhlproben ja gezielt zur Abklärung intestinaler Beschwerden eingesandt wurden. Insofern war es spannend herauszufinden, ob man diesen Anteil mithilfe der Statistik abschätzen kann und ob das Referenz­intervall auch bei mehr als 25 % pathologischen Werten überprüfbar ist.

 

Statistische Standardverfahren

Zur ersten Orientierung erstellten wir Grafiken, um die Zielwerte der Hersteller mit den eigenen Messungen zu vergleichen. Abb. 2 zeigt, dass die meisten Messwerte für Alpha-1-Antitrypsin unterhalb des Grenzwerts von 26,6 mg/dl liegen, während beim Calprotectin die waagrechte gestrichelte Linie für den Grenzwert 50 µg/g mitten durch den dichtesten Wertebereich geht.

Es besteht weder ein Alters­trend (durchgezogene horizontale Linie), noch ein nennenswerter Unterschied der Wertelage für Frauen und Männer. Es war somit auch ohne ausgefeilte Statistik zu erwarten, dass der Grenzwert für Alpha-1-Antitrypsin in etwa bestätigt wird, während derjenige für Calprotectin zu niedrig liegt.

Zur Überprüfung der Grenzwerte für alle fünf in Tab. 1 aufgeführten Stuhlproteine setzten wir zwei statistische Standardverfahren ein, die in der Programmierumgebung von R (www.r-project.org) als gebrauchsfertige Softwarepakete zur Verfügung stehen: Das Package reflimR, das in einer Kooperation von Trillium und der Ostfalia Hochschule Wolfenbüttel entwickelt wurde, eignet sich zur sekundenschnellen Analyse mit einem einfachen robusten Datenmodell, das Package refineR der Universität Erlangen bietet sich zur genaueren Überprüfung dieser Ergebnisse mit einem flexibleren Datenmodell an, arbeitet aber um den Faktor 6.000 langsamer. Der wesentliche Unterschied besteht darin, dass reflimR nur zwischen Normal- und Lognormalverteilung unterscheidet, während refineR mithilfe der sog. Box-Cox-Transformation auch Zwischenstufen mit unterschiedlicher Schiefe modellieren kann.

Tab. 2 bestätigt die Vermutung, dass der Grenzwert von Alpha-1-Antitrypsin recht gut zu den eigenen Messungen passt, während für das Referenzintervall von Calprotectin eine etwa doppelt so hohe Obergrenze gefunden wird.

Tab. 2: Methodenvergleich für zwei Statistikpakete zur indirekten Ermittlung von Referenzintervallen.

Analyt

Einheit

Herstellervorgabe

reflimR

refineR

Alpha-1-Antitrypsin

mg/dl

< 26,8

3–34

2–29

Calprotectin

µg/g

< 50

29–106

25–116

C-reaktives Protein

ng/ml

< 56

1–257

1–77

Immunglobulin A

µg/ml

510–2.040

112–8.560

105–7.770

Zonulin

ng/ml

15–107

20–166

18–141

Für die übrigen drei Stuhlproteine CRP, sIgA und Zonulin liefern die beiden indirekten Verfahren ähnlich wie bei Calprotectin erheblich höhere Obergrenzen als vom Hersteller angegeben und differieren zudem untereinander deutlich.

Somit ergibt sich in der Tat die interessante Frage, ob die Herstellerwerte bei allen Analyten außer Alpha-1-Antitrpsin zu niedrig angesetzt sind, oder ob die indirekten Verfahren aufgrund eines zu hohen Anteils pathologischer Proben nicht in der Lage sind, das Normalkollektiv aus dem gemischten Datensatz herauszufiltern.

Maschinelles Lernen mit mclust

Die Antwort geht aus Abb. 3 hervor.

Beispielhaft zeigt sie links eine Standardauswertung für Zonulin. Im Hintergrund sieht man ein Histogramm der Originalwerte mit gestrichelter Dichtekurve. Die blaue Kurve repräsentiert die Modell­annahme einer Log­normalverteilung, aus der sich die Perzentilen des Referenz­intervalls ergeben. Während die reflimR-Untergrenze von gerundet 20 ng/ml recht gut zur Vorgabe des Herstellers passt, liegt der obere Wert mit etwa166 ng/ml deutlich über dem Zielwert von 107 ng/ml. Das Programm bietet eine Bewertung des berechneten Werts mit Ampelfarben an: Rot bedeutet eine erhebliche Abweichung, die größer ist als das labormedizinisch erlaubte Tole­ranzintervall (permissible uncertainty).

Beim visuellen Vergleich der modellierten und der tatsächlichen Werteverteilung erkennt man, dass sich die blaue Kurve zwar sehr gut an die gestrichelte Linie anpasst, dass letztere aber links vom Gipfel eine deutliche Schulter aufweist. Dies ist häufig ein Zeichen für das Vorliegen von stark überlappenden Subkollektiven, die mit dem Standardverfahren nicht aufgetrennt werden können. Um diese Vermutung zu bestätigen, setzten wir das ebenfalls in RStudio verfügbare Softwarepaket mclust ein. Es handelt sich dabei um ein Werkzeug für unüberwachtes maschinelles Lernen, das mit einem sog. Gaussian-Mixture-Modelling-Verfahren in den Daten potenzielle Subkollektive identifiziert, die die beobachtete Summenkurve mathematisch erklären.

Im vorliegenden Fall von Zonulin schlägt das Verfahren nicht ganz überraschend drei Subkollektive mit vergleichbar großen Anteilen von rund 28 %, 37 % und 35 % vor. Die linke Kurve entspricht der oben beschriebenen Schulter, die mittlere repräsentiert etwa die Hälfte des Hauptpeaks und die unterhalb liegende, breite Kurve erklärt den Rest der Verteilung. Es ist zu vermuten, dass es sich hier um erniedrigte, normale und erhöhte Zonulinwerte handelt. Für die mittlere Kurve ergibt sich ein Referenzintervall von etwa 32 bis 120 ng/ml, was angesichts der schwierigen Ausgangslage befriedigend zu den Herstellerangaben passt.

Die niedrigen Werte könnten von Messwerten bei Diarrhö stammen, bei denen der eingangs beschriebene Verdünnungseffekt zum Tragen kommt. Die nach rechts verbreiterte Kurve entspräche dann Fällen mit leicht erhöhter Darmpermeabilität. Anzumerken ist an dieser Stelle, dass wir für diese Auswertung aus Gründen der Übersichtlichkeit stark erhöhte Zonulinwerte bis zu 800 ng/ml entfernt haben, da diese für die Referenzintervallprüfung keine Bedeutung haben.

Auch beim Calprotectin erhielten wir mehrere überlappende Subkollektive. In Übereinstimmung mit der Punktewolke in Abb. 2 passte eines zur Hersteller­angabe von 50 µg/g und ein weiteres reichte bis etwa 100 µg/g.

Ohne klinische Angaben lässt sich keine klare Aussage treffen, ob die leicht erhöhten Werte tatsächlich Krankheitswert haben. Man könnte erwägen, hier einen Graubereich einzuführen, der bis etwa 100 µg/g reicht. Für CRP und sIgA bestätigte das mclust-Verfahren im Wesentlichen die Herstellerangaben.

Zusammenfassend kann man feststellen, dass die Referenzintervallprüfung für Stuhluntersuchungen noch Neuland ist, das mit neuen statistischen Verfahren betreten werden sollte. Unser Vorschlag, dafür maschinelles Lernen einzuführen, muss nun sorgfältig evaluiert werden.

Autoren
Dr. rer. nat. Steffen Hanselmann
Dr. med. Eduard Rosler
Labor Rosler GmbH
Prof. Dr. med. Georg Hoffmann
Herausgeber
Aus der Rubrik