Statistisches Gaslighting [1]

Jeden Montag wird mit der Bekanntgabe der Anzahl positiver PCR-Tests von Sonntag die vergangene Woche statistisch abgeschlossen. RTL veröffentlichte hierzu jeweils einen Artikel am 01.02.2021 [2] und
08.02.2021 [3]. Betitelt wurde jedes Mal mit der Aussage, dass die Infektionszahlen um 19 bzw. 14 Prozent gestiegen seien. Im zweiten Artikel wird folgende Grafik angezeigt:

Die Steigerung bezieht sich also auf die prozentuale Änderung (p) der absoluten Wochenzahlen (oder der entsprechenden Mittelwerte) zur Vorwoche [4]. Sie berechnet sich wie folgt:

    \[  p = 100 \cdot \frac{ \text{positive Tests aktuelle Woche} - \text{positive Tests vorherige Woche}}{ \text{positive Tests vorherige Woche} } \]

Lassen Sie uns die Zahlen in einen Kontext setzen und dazu die Tabelle um einige Informationen erweitern.

Je mehr man testet, umso mehr Positive wird man finden. Es ist deshalb unumgänglich, nicht die absolute Zahl sondern den Anteil an der Gesamtzahl der positiven Tests (Positivenrate) zu betrachten.

Die Anzahl der Tests hat in den Kalenderwochen 4 und 5 jeweils um rund 13 bzw. 20 Prozent zugenommen.

Die prozentuale Änderung der Positivenrate beträgt so für die KW 4 lediglich 4,9% und ist für die KW 5 mit rund -5% sogar rückläufig.

Die in der Tabelle nicht aufgeführte 7-Tage-Inzidenz berechnet sich unmittelbar aus der Anzahl der positiven Tests einer Woche. Für die aktuelle Bevölkerungszahl von 626108 gilt:

    \[ \text{7-Tage-Inzidenz} = \frac{100000 \cdot \text{Anzahl positive Tests pro Woche}}{626108} \\ = \frac{ \text{ Anzahl positive Tests pro Woche } }{6,26108} \]

Sie unterscheidet sich also nur um einen Faktor von der absoluten Zahl an positiven Tests und variiert somit in der gleichen Art und Weise. Am Beispiel von KW 5 zeigt sich auch hier, dass ein Anstieg der 7-Tage-Inzidenz in keiner Weise auf eine Verschlimmerung der epidemiologischen Lage schließen lässt.

Die folgenden Grafiken visualisieren die Daten der Tabelle noch einmal: Gesamtzahl Tests (blau), positive Tests (rot), Positivenrate (grün) und 7-Tage-Inzidenz (dunkelrot).

Bleibt zu erwähnen, dass für die Kalenderwoche 6 mit 1099 Testpositiven und einer Gesamtzahl von 70608 Tests die absolute Anzahl um 41 gefallen ist, was einer prozentualen Änderung von -3,6% entspricht. In Bezug auf die Positivenrate von 1,56% ist dies sogar eine prozentuale Änderung von rund -16%.

Sensitivität und Spezifität

Wissenschaftlich betrachtet stellt das Testen von Personen in einem bestimmten Zeitraum eine Messung dar, bei der es nicht üblich ist, das Resultat ohne eine Fehleranalyse zu veröffentlichen. Diagnostische Tests im Allgemeinen, und somit der für den Nachweis des SARS-CoV-2-Virus verwendete PCR-Test im Besonderen, haben immer eine bestimmte Fehlerquote.

Wir sind in unserem Artikel über PCR-Tests [5] bereits kurz auf die charakteristischen Eigenschaften eines Testes eingegangen. Da sie für die Berechnung der Fehlerquote eine entscheidende Rolle spielen, wollen wir die mathematischen Grundlagen hierzu noch etwas vertiefen.

Je nachdem ob man eine Krankheit hat oder nicht, und je ob der entsprechende diagnostische Test positiv oder negativ ausfällt, ergeben sich 4 mögliche Situationen, welche in der folgenden Tabelle dargestellt sind.


positiver Testnegativer Test
krankrichtig positiv (RP)falsch negativ (FN)
nicht krankfalsch positiv (FP)richtig negativ (RN)

Um die Zuverlässigkeit eines Testes zu bewerten, betrachtet man die beiden Eigenschaften Sensitivität und Spezifität [5]:

Die Sensitivität gibt an, wie sicher eine erkrankte Person als solche erkannt wird. Ein Test mit einer Sensitivität von 100% erkennt also alle Kranken korrekt: der Anteil an richtig Positiven (RP) ist entsprechend 100%, an falsch Negativen (FN) 0%. Kleinere Sensitivitäten mindern den Anteil an RP und erhöhen den Anteil an FN.

Die Spezifität ist für die Erkennung von gesunden Personen zuständig: wie sicher wird eine gesunde Person als solche erkannt? Ein Spezifität von 100% erkennt also hier alle Gesunden korrekt: die richtig Negativen (RN) haben einen Anteil von 100%, falsch Positive (FP) gibt es keine. Entsprechend erhöht eine kleinere Spezifität den Anteil der FP und vermindert den Anteil der RN.

Die Anzahl der tatsächlich Kranken berechnet sich also aus der Summe von RP und FN (obere Zeile in der Tabelle) und entspricht nicht der Anzahl positiver Tests. Betrachtet man hiervon den Anteil an der Gesamtzahl von Getesteten erhält man die Prävalenz. Es gilt zu beachten, dass die Prävalenz im Allgemeinen nicht a priori bekannt ist, und geschätzt werden muss!

Da kein Test eine Sensitivität und Spezifität von 100% vorweisen kann, ist es eine mathematische Tatsache (Bayes’sche Theorem), dass wenn nur ein kleiner Anteil krank ist, daher die Prävalenz gering ist, der Anteil an FP bezüglich der positiven Tests ansteigt [7].

Anstelle die mathematischen Grundlagen zum Bayes’sche Theorem zu erläutern, zeigen wir dessen Effekt an 2 Rechenbeispielen, einmal mit hoher und einmal mit niedriger Prävalenz.

Beispiel 1:
Gegeben sei eine Prävalenz von 30%, eine Sensitivität von 99% und eine Spezifität von 98%. Die Anteile in der Tabelle berechnen sich dann:


positiver Testnegativer TestTotal
krankRP = 99% von 30%
= 29,7%
FN = 1% von 30%
= 0,3%
30%
nicht krankFP = 2% von 70%
= 1,4%
RN = 98% von 70%
= 68,6%
70%
Total31,1%68,9%100%

Die Zahl der positiv Getesteten (31,1%) ist ein guter Wert für die 30% tatsächlich Kranken, auch der Anteil der negativen Tests (68,9%) stimmt mit dem Tatsächlichen (70%) gut überein. Die Anteile an FP und FN sind in diesem Fall gering. Die Wahrscheinlichkeit, dass ein positiv Getesteter auch wirklich krank ist, ist somit hoch.
Man bezeichnet sie als der positive prädiktive Wert, auf Englisch: positive predictive value (PPV). Er berechnet sich aus dem Quotienten:

    \[ \text{PPV} = \frac{\text{Anzahl RP}}{\text{Anzahl aller positiven Tests} } \]

Hier ergibt sich für den \text{PPV [\%]} also:

    \[ \text{PPV [\%]} = 100 \cdot \frac{29,7}{31,1} = 95,5 \text{\%} \]

Mit anderen Worten: die Wahrscheinlichkeit, dass ein positiv Getesteter auch wirklich krank ist beträgt 95,5%.

Beispiel 2:
Die Prävalenz sei nun 1%, Sensitivität und Spezifität bleiben gleich. Für die Tabelle ergibt sich:


positiver Testnegativer TestTotal
krankRP = 99% von 1%
= 0,99%
FN = 1% von 1%
= 0,01%
1%
nicht krankFP = 2% von 99%
= 1,98%
RN = 98% von 99%
= 97,02%
99%
Total2,97%97,03%100%

Bei einem Test mit diesen Spezifikationen werden also 2,97% ein positives Testergebnis erhalten, tatsächlich krank sind aber nur 1%, also knapp ein Drittel. Der Anteil von FP ist in diesem Fall doppelt so hoch wie die der RP.

Die Wahrscheinlichkeit, dass ein positiv Getesteter auch wirklich krank ist, ist klein.

Für den \text{PPV[\%]} gilt entsprechend:

    \[ \text{PPV[\%]} = 100 \cdot \frac{0,99}{2,97} = 33,3\text{\%} \]

Der Anteil negativ Getesteter (97,03%) unterscheidet sich jedoch nur unwesentlich von dem der tatsächlich Gesunden (99%).

Ein wesentlicher Punkt noch zum Schluss:
Für den Anteil der \text{FP} gilt:

    \[ \text{FP[\%]} = ( 100 - \text{Spezifität [\%]} ) \cdot ( 100 - \text{ Prävalenz [\%] } ) \]

Für den Fall, dass niemand krank ist (Prävalenz = 0%) liegt der Anteil der \text{FP} immer noch bei 100 - \text{Spezifität [\%]}. Dieser Anteil positiver Tests stellt das Minimum dar, welches nicht unterschritten werden kann.

Beispiel:
Bei einer Spezifität von 99% wird es unabhängig von der Prävalenz immer mindestens 1% positive Tests geben!

Es ist in diesem Zusammenhang zu bemerken, dass genaue Werte für Sensitivität und Spezifität für die in Luxemburg verwendeten Tests, lange Zeit offiziell nicht mitgeteilt wurden. Erst auf eine parlamentarische Frage antwortete Frau Lenert am 9. Juli 2020 [8], dass die Spezifität zwischen 99 und 100% liegen würde, und dass es aus dem Grund auch nicht notwendig wäre bei einem positiven Test zur Bestätigung nachzutesten. Ein Wert für die Sensitivität wurde nicht angeben. Die Angabe von 20% falsch Negativen bezieht sich unseren Informationen nach auf schwere Verläufe mit typischen Symptomen, wo die Patienten trotzdem negativ getestet wurden [5] und kann daher so nicht auf die allgemeine Testsituation übertragen werden.

Die Mischung macht’s

Die täglich kommunizierten Resultate der PCR-Tests beziehen sich auf alle Tests die an dem vorangegangenen Tag, oder möglicherweise auch früher, ausgeführt wurden. Aktuell wird bekanntermaßen jedoch in zwei sehr unterschiedlichen Kontexten getestet.

Zum einen ist das der Large Scale Test, zu dem auch die Teststation am Flughafen gerechnet werden kann. Bezeichnend ist hier, dass es bei den getesteten Personen keine Verdachtsmomente auf eine Infektion gibt. Die Positivenrate ist entsprechend gering.

Die anderen Tests werden auf ärztliches Rezept („ordonnance“) ausgeführt. Dies ist der Fall, falls eine Person symptomatisch ist. Bei dem hier betrachteten Zeitraum wurde auch das Tracing, d.h. die Nachverfolgung und Überprüfung von Personen die mit einer positiv getesteten Person in Kontakt waren, dieser Kategorie zugeordnet. Hier ist die Positivenrate erwartungsgemäß höher.

Die prozentuale Aufteilung ist für die Kalenderwochen 2020/43 bis 2021/5 in der folgenden Grafik dargestellt:

Die globale Positivenrate bezieht alle Tests der jeweiligen Woche ein und steht mit den Positivenraten von „ordonnance“ und LST über den gewichteten Mittelwert [9] in direkter Beziehung.

Beispiel:
In der Kalenderwoche 5 war der Anteil „ordonnance“ zu LST, 34,33% zu 65,6%. Die Positivenraten waren 4,83% bzw. 0,3%. Die globale Positivenrate ergibt dann:

    \[ 34,33 \cdot 0,0483 + 65,6 \cdot 0,003 \approx 1,66 + 0,2 = 1,86 \% \]

Der Verlauf der 3 Positivenraten für die Kalenderwochen 2020/44 bis 2021/5:

Betrachten wir zunächst die Positivenrate des LST: ab KW 52 fluktuiert sie um 0,3%. Wenn wir davon ausgehen, dass hiermit das Minimum erreicht ist, können wir schlussfolgern, dass es sich hierbei fast ausschließlich um falsch Positive handelt, was also einer Spezifität von ca. 99,7% entspricht.

Es ist sehr wahrscheinlich, dass seit Mitte Dezember ein sehr hoher Anteil, wenn nicht fast alle der positiv Getesteten des LST falsch Positive sind.

Die absolute Anzahl an positiv Getesteten beim LST betrug in der KW 5 beispielsweise 121 was 0,3% entspricht. Diese dürften daher eigentlich nicht in der Statistik berücksichtigt werden bzw. es müsste mindestens auf den Umstand hingewiesen werden, dass es hier aufgrund der sehr niedrigen Prävalenz zu einem wesentlichen Fehler kommen kann.

In der „ordonnance“-Gruppe liegt die Positivenrate selbstverständlich höher. In KW 5 hatten wir 1019 Positive auf 21109, was einer Positivenrate von 4,83% entspricht. Da diese also fast um den Faktor 15 größer als in der Gruppe des LST ist, bestimmt sie im Wesentlichen die globale Positivenrate. Das Gleiche gilt alleine auch schon für die Aufteilung der Anteile von „ordonnance“ und LST an der Gesamtzahl der Tests.

Vergleichen wir die Positivenraten in den beiden Kategorien, sollte klar sein, dass die alleinige Betrachtung der globalen Positivenrate die tatsächliche Situation verfälscht darstellt. Immerhin ist das Virus in der allgemeinen Bevölkerung quasi nicht existent, und dafür nur in einer verhältnismäßig kleinen Gruppe verbreitet. Selbst hier wird nur jeder Zwanzigste positiv getestet, wobei zudem die Asymptomatischen entgegen einer aktuellen WHO-Richtlinie [10] nicht überprüft werden.

Schlusswort

Es sollte ja eigentlich jedem einleuchten, dass die Realität nicht einmal kurz mit einigen Zahlen vollends beschrieben werden kann und dennoch geben wir uns für den Großteil der Zeit damit zufrieden.

Unakzeptabel ist die Kommunikation von absoluten Zahlen, welche nicht in einen sinnvollen Zusammenhang gesetzt werden und auf diese Art und Weise auch nicht relativierbar sind. Des Weiteren kann die Tatsache, dass „negative“ Entwicklungen meistens eine breite mediale Aufmerksamkeit erfahren, während „hoffnungsvolle“ Evolutionen in der Regel totgeschwiegen werden, den Schluss nahe legen, dass es nicht immer um eine objektive Berichterstattung geht.

Das Bewusstsein für die Notwendigkeit, ja überhaupt das Wissen, dass jede wissenschaftliche Messung selbstverständlich auf ihre Zuverlässigkeit überprüft werden muss, scheint nicht vorhanden zu sein. Man beschränkt sich darauf, Zahlen durchzureichen (so gesehen eigentlich „Rohdaten“ im wortwörtlichen Sinn) und suggeriert der Öffentlichkeit, dass diese Daten verlässlich und bedeutsam sind.

Wir hoffen mit diesem Artikel veranschaulicht zu haben, dass die Situation an sich sehr viel komplexer ist und auch eine entsprechend aufwendige Auseinandersetzung benötigt. Zudem haben wir nur den statistischen Aspekt beleuchtet. Vor der Covid19-Pandemie wäre es in der Medizin undenkbar gewesen, dass ein diagnostischer Test allein zur Einschätzung des gesundheitlichen Zustandes einer Person (fähig und) ausreichend wäre.

Quellen:

[1] Als Gaslighting […] wird in der Psychologie eine Form von psychischer Gewalt bzw. Missbrauch bezeichnet, mit der Opfer gezielt desorientiert, manipuliert und zutiefst verunsichert werden und ihr Realitäts- und Selbstbewusstsein allmählich deformiert bzw. zerstört wird.
Quelle: Wikipedia https://de.wikipedia.org/wiki/Gaslighting

[2] RTL (01.02.2021): Infektiouns-Zuele bannent enger Woch ëm 19 Prozent geklommen
https://www.rtl.lu/news/national/a/1664746.html

[3] RTL (08.02.2021): Infektiounszuele bannent enger Woch ëm 14 Prozent geklommen
https://www.rtl.lu/news/national/a/1668631.html

[4] maths2mind: Änderungsmaße
https://www.maths2mind.com/schluesselwoerter/relative-anderung

[5] Expressis Verbis: PCR-Test
https://www.expressis-verbis.lu/2021/02/11/pcr-test/

[6] Lecturio: Epidemiologie: Statistische Grundlagen
https://www.lecturio.de/magazin/epidemiologie-statistische-grundlagen/

[7] Institut für Allgemeinmedizin und Versorgungsforschung: Zur Notwendigkeit einer Methodik abgestuften Diagnostik in der Allgemeinmedizin als Konsequenz des Bayes’schen Theorems
http://www.am.med.tum.de/sites/www.am.med.tum.de/files/Stufendiagnostik_Bayes_0.pdf

[8] Antwort auf parlamentarischen Anfrage von Françoise Hetto-Gaasch
https://download.rtl.lu/2020/08/06/116f9932a65449c1e1f4c212404d9824.pdf

[9] Gewichteter Mittelwert
https://de.wikipedia.org/wiki/Gewichtung

[10] WHO Information Notice for IVD Users 2020/05
https://www.who.int/news/item/20-01-2021-who-information-notice-for-ivd-users-2020-05

Dieser Beitrag wurde in deutscher Sprache verfasst und in die Englische und Französische Sprache übersetzt. Auf der luxemburgischen Seite veröffentlichen wir ein Duplikat des deutschen Originaltextes.