Risiko und Likelihood
Das Laborresultat als Mass fuer die Wahrscheinlichkeit einer Diagnose.
Dr. Walter Fierz, LogoLab, Zuerich / 28. Februar 2008
Fast einem DJ an seinen Reglerknoepfen gleich, spielte Walter Fierz, ehemaliger medizinischer Leiter der Abteilung fuer Infektserologie am IKMI und aktueller Leiter des diagnostischen Labors LogoLab in Zuerich, auf der Klaviatur der statistischen Messmethoden; mit Sensitivitaet und Spezifitaet, Likelihood-Ratio und ROC-Kurven.
Fierz demonstrierte uns, wie wichtig es ist, die Güte eines diagnostischen Tests abzuschätzen, seine Aussagekraft und somit die Konsequenzen zu kennen. Der daraus resultierende Vorhersagewert ist die Leitplanke, an der wir uns als Praktiker orientieren, der uns hilft Therapieentscheidungen zu treffen. Wir nutzen diagnostische Tests, um die Wahrscheinlichkeit einer Verdachtsdiagnose zu erhöhen oder zu reduzieren. Je nach Testverfahren und Vor-Test-Wahrscheinlichkeit kann ein Test besser oder schlechter sein. Als Beispiel diente Fierz die Bestimmung des C-reaktiven Proteins zur Diagnose einer Bakteriämie. Kann und darf man einen isolierten Wert wie das CRP heranziehen, um zwischen einer schweren bakteriellen Infektion und einem viralen Infekt zu unterscheiden? Bei einer Verteilung der zu erwartenden CRP-Ergebnisse, die sich für beide Gruppen überschneidet, ist es schwierig, scharf zu trennen zwischen einem positiven und einem negativen Ergenbis.
Zur Bewertung der Güte eines diagnostischen Tests dienen dem Labormediziner statistische Grössen, wie die Likelihood-Ratio (LHR). Diese Ratio sagt, um wie viel das positive (respektive das negative) Resultat die Diagnose wahrscheinlicher (weniger wahrscheinlich) macht. Interessant ist nun, dass die LHR auch für einen quantitativen Laborwert ausgedrückt werden kann. Je höher (im Fall vom CRP) der Wert, desto höher ist die LHR. Leider fehlen uns für die meisten Testverfahren exakte Angaben zur LHR. Wie die Beantwortung der Publikumsfragen jedoch zeigte, hätte ein Grossteil der Anwesenden den CRP-Wert «aus dem Bauch» richtig interpretiert.
Je näher die Messwerte der gesunden und der kranken Population beieinander liegen und sich überlappen, desto schwieriger ist es, einen guten Test zu entwickeln. Ist zudem die Prävalenz («a-priori-Wahrscheinlichkeit») einer Erkrankung in der zu untersuchenden Gruppe hoch, so ist die Wertigkeit eines positiven Resultats gut – der Getestete ist «echt positiv». Ist aber die Prävalenz einer Erkrankung klein, wie zum Beispiel eine HIV-Infektion in der Gesamtbevölkerung, so wird der Anteil an falsch positiven Ergebnissen grösser, auch bei hoher Sensitivität und Spezifität des Tests, der positive Vorhersagewert («a-posteriori-Wahrscheinlichkeit») ist relativ schlecht.
So schwierig es manchmal ist für den Praktiker, die statistischen «Spielereien» zu verstehen, so wichtig ist es, das Testresultat für den Patienten in seinen Verständnisrahmen zu transponieren und nicht mit Begriffen wie Sensitivität und Spezifität zu jonglieren.
Den Vortrag von Dr. Walter Fierz (pdf-file) finden Sie hier