Détournement cognitif via les statistiques ^[1]

Posted On 04/03/2021

Chaque lundi, la semaine précédente se termine par l’annonce des statistiques autour du nombre de tests PCR positifs à partir du dimanche. RTL a publié un article à ce sujet le 01.02.2021 [2] et 08.02.2021 [3]. Intitulé à chaque fois avec l’affirmation que le nombre d’infections avait augmenté de 19 et 14 % respectivement. Dans le deuxième article, le graphique suivant est affiché :

Ainsi, l’augmentation fait référence à la variation en pourcentage ( $p$ ) des chiffres hebdomadaires absolus (ou des valeurs moyennes correspondantes) par rapport à la semaine précédente [4]. Il est calculé comme suit :

$p = 100 \cdot \frac{ \text{ tests positifs semaine en cours} - \text{ tests positifs semaine précédente}}{ \text{ tests positifs semaine précédente} }$

Remettons les chiffres dans leur contexte en ajoutant quelques informations au tableau.

Plus vous faites de tests, plus vous trouverez des résultats positifs. Il est donc essentiel d’examiner non pas le nombre absolu mais la proportion du nombre total de tests positifs (taux de positivité).

Le nombre de tests a augmenté d’environ 13 et 20 % au cours des semaines civiles 4 et 5, respectivement.

Le pourcentage de variation du taux positif ne s’élève donc qu’à 4,9 % pour la quatrième semaine et tombe même à environ -5 % pour la cinquième semaine.

L’incidence sur 7 jours non indiquée dans le tableau est calculée directement à partir du nombre de tests positifs dans une semaine. Pour la population actuelle de 626108 s’applique :

${7-jours d'incidence} = \frac{100000 \cdot \text{nombre de tests positifs par semaine}}{626108} = \frac{ \text{ nombre de tests positifs par semaine } }{6,26108}$

Il ne diffère donc que d’un facteur du nombre absolu de tests positifs et varie en conséquence de la même manière. En prenant l’exemple de la semaine 5, on peut voir ici aussi qu’une augmentation de l’incidence sur 7 jours n’indique en aucun cas une aggravation de la situation épidémiologique.

Les graphiques suivants visualisent à nouveau les données du tableau : nombre total de tests (bleu), tests positifs (rouge), taux de positivité (vert) et incidence sur 7 jours (rouge foncé).

Il reste à mentionner que pour la sixième semaine civile, avec 1099 tests positifs et un nombre total de 70608 tests, le nombre absolu a diminué de 41, ce qui correspond à une variation en pourcentage de -3,6%. Par rapport au taux positif de 1,56%, cela représente même une variation en pourcentage d’environ -16%.

Sensibilité et spécificité

D’un point de vue scientifique, les tests effectués sur des individus pendant une période donnée représentent une mesure dont il n’est pas habituel de publier le résultat sans analyse d’erreur. Les tests de diagnostic en général, et donc le test PCR utilisé pour la détection du virus du SRAS-CoV-2 en particulier, ont toujours une certaine marge d’erreur.

Dans notre article sur les tests PCR [5], nous avons déjà abordé brièvement les propriétés caractéristiques d’un test. Comme ils jouent un rôle décisif dans le calcul du taux d’erreur, nous aimerions en détailler les principes mathématiques.

Selon que l’on est atteint d’une maladie ou non, et selon que le test de diagnostic correspondant est positif ou négatif, il existe 4 situations possibles, qui sont présentées dans le tableau suivant.

	test positif	test négatif
malade	réellement positif (RP)	faux négatif (FN)
pas malade	faux positif (FP)	réellement négatif (RN)

Afin d’évaluer la fiabilité d’un test, on considère les deux propriétés de la sensibilité et de la spécificité [5] :

La sensibilité indique la fiabilité avec laquelle une personne malade est détectée comme telle. Un test avec une sensibilité de 100 % identifie donc correctement tous les patients : la proportion de réellement positifs (RP) est donc de 100 %, et celle des faux négatifs (FN) de 0 %. Les sensibilités plus faibles réduisent la proportion de RP et augmentent la proportion de FN.

La spécificité est responsable de la détection des personnes en bonne santé : avec quelle fiabilité une personne en bonne santé est-elle détectée en tant que telle ? Une spécificité de 100% identifie correctement toutes les personnes en bonne santé : la proportion de réellement négatifs (RN) est de 100%, les faux positifs (FP) sont inexistants. En conséquence, une spécificité plus faible augmente la proportion de FP et diminue la proportion d’RN.

Le nombre de personnes effectivement malades est donc calculé à partir de la somme de RP et FN (ligne supérieure du tableau) et ne correspond pas au nombre de tests positifs. Si l’on considère la proportion du nombre total de personnes testées, on obtient la prévalence. Il est à noter que la prévalence n’est généralement pas connue a priori et doit être estimée !

Comme aucun test ne peut démontrer une sensibilité et une spécificité de 100%, il est un fait mathématique (théorème de Bayes) que lorsque seule une petite proportion est malade, donc que la prévalence est faible, la proportion de FP augmente en termes de tests positifs [7].

Au lieu d’expliquer les fondements mathématiques du théorème de Bayes, nous montrons son effet dans deux exemples de calcul, l’un avec une prévalence élevée et l’autre avec une faible prévalence.

Exemple 1 :
Avec une prévalence de 30 %, une sensibilité de 99 % et une spécificité de 98 %. Les proportions du tableau sont ensuite calculées :

	test positif	test négatif	Total
malade	RP = 99% de 30% = 29,7%	FN = 1% de 30% = 0,3%	30%
pas malade	FP = 2% de 70% = 1,4%	RN = 98% de 70% = 68,6%	70%
Total	31,1%	68,9%	100%

Le nombre de tests positifs (31,1 %) est une bonne valeur pour les 30 % de personnes réellement malades, de même que la proportion de tests négatifs (68,9 %) correspond bien à la réalité (70 %). Les proportions de FP et de FN sont faibles dans ce cas. Ainsi, la probabilité qu’une personne dont le test est positif soit réellement malade est élevée.
C’est ce qu’on appelle la valeur prédictive positive (VPP). Il est calculé à partir du quotient :

$\text{PPV} = \frac{\text{\nombre de RP}}{\text{\nombre de tous les tests positifs} }$

Ici, le résultat pour le $\text{PPV [\%]}$ est donc :

${PPV [\%]} = 100 \cdot \frac{29,7}{31,1} = 95,5 \text{\%}$

En d’autres termes, la probabilité qu’une personne dont le test est positif soit réellement malade est de 95,5 %.

Exemple 2 :
Que la prévalence soit maintenant de 1 %, la sensibilité et la spécificité restent les mêmes. Le résultat pour le tableau est :

	test positif	test négatif	Total
malade	RP = 99% de 1% = 0,99%	FN = 1% de 1% = 0,01%	1%
pas malade	FP = 2% de 99% = 1,98%	RN = 98% de 99% = 97,02%	99%
Total	2,97%	97,03%	100%

Ainsi, dans un test répondant à ces spécifications, 2,97 % recevront un résultat positif, mais seulement 1 % sont effectivement malades, soit un peu moins d’un tiers. La proportion de FP dans ce cas est deux fois plus élevée que celle de RP. La probabilité qu’une personne, dont le test est positif, soit réellement malade est faible.

Pour le $\text{PPV[\%]}$ s’applique en conséquence :

$\text{PPV[\%]} = 100 \cdot \frac{0,99}{2,97} = 33,3\text{\%}$

Cependant, la proportion des personnes testées négatives (97,03%) ne diffère que marginalement de celle des personnes réellement en bonne santé (99%).

Enfin, un point essentiel :
Pour la fraction de $\text{FP}$ s’applique :

$\{FP[\%]} = ( 100 - \{spécificité [\%]} ) \cdot ( 100 - \{prévalence [\%] } )$

Dans le cas où personne n’est malade (prévalence = 0%), la proportion de $\text{FP}$ est toujours de 100 $- \text{specificity [\%]}$ . Cette proportion de tests positifs représente le minimum qui ne pourra plus être réduit.

Exemple :
Avec une spécificité de 99%, il y aura toujours au moins 1% de tests positifs, indépendamment de la prévalence !

Il convient de noter dans ce contexte que, pendant longtemps, les valeurs exactes de sensibilité et de spécificité des tests utilisés au Luxembourg n’ont pas été officiellement communiquées. C’est seulement en réponse à une question parlementaire que Mme Lenert a répondu le 9 juillet 2020 [8] que la spécificité serait comprise entre 99 et 100%, et que pour cette raison il ne serait pas nécessaire de refaire un test de confirmation en cas de test positif. Une valeur pour la sensibilité n’a pas été donnée. Selon nos informations, l’indication de 20 % de faux négatifs fait référence à des cas graves avec des symptômes typiques, où les patients ont néanmoins été testés négatifs [5] et ne peuvent donc pas être transférés à la situation générale du test.

Tout est dans le mix

Les résultats des tests PCR communiqués quotidiennement se réfèrent à tous les tests effectués la veille, ou éventuellement plus tôt. Toutefois, on sait qu’actuellement, les tests sont effectués dans deux contextes très différents.

L’un d’entre eux est le test à grande échelle, auquel on peut aussi compter la station de test de l’aéroport. Il est significatif ici qu’il n’y ait pas de suspicion d’infection chez les personnes testées. Le taux positif est par conséquent faible.

Les autres tests sont effectués sur prescription médicale (« ordonnance »). C’est le cas si une personne est symptomatique. Pour la période considérée ici, le traçage, c’est-à-dire le suivi et la vérification des personnes qui ont été en contact avec une personne testée positivement, a également été affecté à cette catégorie. Comme prévu, le taux positif est plus élevé ici.

La répartition en pourcentage est indiquée pour les semaines calendrier 2020/43 à 2021/5 dans le graphique ci-dessous :

Le taux positif global comprend tous les tests de la semaine respective et est directement lié aux taux positifs d' »ordonnance » et de LST via la moyenne pondérée [9].

Exemple :
Au cours de la cinquième semaine civile, le rapport était de 34,33 % à 65,6 % pour l' »ordonnance » par rapport à l' »ELT ». Les taux positifs ont été respectivement de 4,83 % et 0,3 %. Le taux global positif en résulte alors :

$34,33 \cdot 0,0483 + 65,6 \cdot 0,003 \approx 1,66 + 0,2 = 1,86 \%$

La progression des 3 taux positifs pour les semaines civiles 2020/44 à 2021/5 :

Examinons d’abord le taux positif de la LST : à partir de la semaine 52, il fluctue autour de 0,3 %. Si l’on suppose que c’est le minimum, on peut conclure qu’il s’agit presque exclusivement de faux positifs, ce qui correspond donc à une spécificité d’environ 99,7%.

Il est très probable que depuis la mi-décembre, une très forte proportion, voire la quasi-totalité, des personnes ayant obtenu un résultat positif au test LST sont des faux positifs.

Le nombre absolu de personnes testées positives pour la LST en semaine 5, par exemple, était de 121, ce qui correspond à 0,3 %. Il ne faut donc pas les prendre en compte dans les statistiques, ou du moins faire référence au fait qu’une erreur importante peut se produire ici en raison de la très faible prévalence.

Evidemment, dans le groupe « ordonnance », le taux positif est plus élevé. En semaine 5, nous avons eu 1019 positifs à 21109, soit un taux positif de 4,83%. Ainsi, comme ce taux est presque 15 fois supérieur à celui du groupe LST, il détermine essentiellement le taux positif global. Il en va de même pour la répartition des parts d' »ordonnance » et de LST dans le seul nombre total de tests.

Si l’on compare les taux positifs dans les deux catégories, il devrait être clair que le fait de ne considérer que le taux positif global falsifie la situation réelle. Après tout, le virus est pratiquement inexistant dans la population générale, et donc seulement répandu dans un groupe relativement restreint. Même ici, seule une personne sur vingt est testée positive et, en outre, contrairement à une directive actuelle de l’OMS [10], les personnes asymptomatiques ne sont pas testées.

Mot final

Il devrait être évident pour tout le monde que la réalité ne peut être décrite à court terme à l’aide de quelques chiffres, et pourtant nous nous en sommes satisfaits pour la plupart du temps.

La communication de chiffres absolus, qui ne sont pas mis dans un contexte significatif et par conséquent ne peuvent donc pas être relativisés, s’avère inacceptable. En outre, le fait que les évolutions « négatives » reçoivent généralement une large attention médiatique, tandis que les évolutions « prometteuses » sont généralement étouffées, peut laisser un défaut d’objectivité dans les comptes-rendus nous présentés.

La conscience sur la nécessité, voire même le savoir que chaque saisie de données scientifiques devrait faire l’objet d’une vérification consciencieuse fait défaut. On se limite à des chiffres de passage (donc considérés comme des « données brutes » au sens littéral) et on suggère au public que ces données sont fiables et significatives.

Nous espérons avoir illustré la complexité de la situation actuelle qui du fait nécessite une analyse approfondie. De plus, nous n’avons mis en évidence que l’aspect statistique. Avant la pandémie de Covid19, il aurait été inimaginable en médecine qu’un test de diagnostic soit seul (capable de et) suffisant pour évaluer l’état de santé d’une personne.

Sources

[1] Le gaslighting ou gas-lighting, connu sous le nom de détournement cognitif (…) ^{est une forme d’abus mental dans lequel l’information est déformée ou présentée sous un autre jour, omise sélectivement pour favoriser l’abuseur, ou faussée dans le but de faire douter la victime de sa mémoire, de sa perception et de sa santé mentale.} https://fr.wikipedia.org/wiki/Gaslighting

[2] RTL (01.02.2021): Les taux d’infection on progressé de 19% endéans 1 semaine.
https://www.rtl.lu/news/national/a/1664746.html

[3] RTL (08.02.2021): Les taux d’infection on progressé de 14% endéans 1 semaine.
https://www.rtl.lu/news/national/a/1668631.html

[4] maths2mind: Änderungsmaße
https://www.maths2mind.com/schluesselwoerter/relative-anderung

[5] Expressis Verbis: PCR-Test
https://www.expressis-verbis.lu/2021/02/11/pcr-test/

[6] Lecturio: Épidémiologie : Notions statistiques de base https://www.lecturio.de/magazin/epidemiologie-statistische-grundlagen/

[7] Institut de recherche sur la médecine générale et les services de santé : sur la nécessité d’une méthodologie de diagnostic gradué en médecine générale comme conséquence du théorème de Bayes http://www.am.med.tum.de/sites/www.am.med.tum.de/files/Stufendiagnostik_Bayes_0.pdf

[8] Réponse à la question parlementaire de Françoise Hetto-Gaasch https://download.rtl.lu/2020/08/06/116f9932a65449c1e1f4c212404d9824.pdf

[9] Moyenne pondérée https://de.wikipedia.org/wiki/Gewichtung

[10] WHO Information Notice for IVD Users 2020/05 https://www.who.int/news/item/20-01-2021-who-information-notice-for-ivd-users-2020-05

Cet article a été écrit en allemand et traduit en anglais et en français. Sur le site luxembourgeois, nous publions un double du texte original allemand. Traduit à l’aide de deepl.com

Share on Social Media