COVID-19: Comprendre les lacunes dans les données

Les données disponibles sur la pandémie causée par le coronavirus sont recueillies de manière inégale et sont certainement incomplètes. Il est donc nécessaire de les traiter avec soin, en étant conscient de ce qu'ils peuvent et ne peuvent pas détecter.

Published On: mars 24th, 2020
COVID-19: Comprendre les lacunes dans les données_62cf00badc650.jpeg

COVID-19: Comprendre les lacunes dans les données

Les données disponibles sur la pandémie causée par le coronavirus sont recueillies de manière inégale et sont certainement incomplètes. Il est donc nécessaire de les traiter avec soin, en étant conscient de ce qu’ils peuvent et ne peuvent pas détecter.

Photo: Younghart/Flickr  – CC BY-SA 2.0

L’un des problèmes de la pandémie COVID-19 est lié à la rapidité avec laquelle la contagion se propage, ce qui rend difficile non seulement le traitement de toutes les personnes affectées, mais aussi simplement d’avoir une image à jour, complète et fiable de la situation, dans un pays donné et dans le reste du monde.

Les informations sur lesquelles nous pouvons compter sont approximatives et fournissent souvent des chiffres par défaut, par exemple sur le nombre de personnes infectées et de décès causés par la pandémie. Il est important d’être conscient de ces limites et d’examiner attentivement les données en circulation, qui sont encore les meilleures dont nous disposons dans les circonstances actuelles. Parmi les données officielles qui donnent une image globale de la situation, celles agrégées par le Centre européen de prévention et de contrôle des maladies (CEPCM) sont considérées comme étant parmi les plus fiables. Cependant, des études de plus en plus précises sont publiées chaque jour, qui fournissent des éléments supplémentaires pour comprendre la pandémie et la manière dont elle se développe.

Combien de personnes sont réellement infectées ?

Nous ne le savons pas. Ce que nous savons, c’est le nombre de cas d’infection confirmés – c’est-à-dire les personnes dont le test de dépistage est positif – et des estimations très approximatives de l’ensemble des cas d’infection.

Le test qui détecte l’infection (le “prélèvement”) consiste en un échantillon de salive ou de mucus, qui est ensuite analysé pour rechercher des traces du code génétique du virus. Toutefois, le nombre de personnes testées varie énormément d’un pays à l’autre, en fonction principalement de leur capacité à effectuer des tests à grande échelle (en général, ce ne sont pas les kits de prélèvement qui manquent, mais le personnel et les laboratoires pour tester d’énormes quantités de prélèvements). 

Dans certains pays, les autorités décident de concentrer les prélèvements sur les personnes présentant déjà des symptômes compatibles avec le COVID-19, ou même uniquement sur les personnes hospitalisées présentant des symptômes graves. Cependant, nous savons que de nombreuses personnes qui ont contracté le virus ne présentent pas de symptômes, ou commencent à en présenter plusieurs jours après l’infection.

Le pourcentage de personnes infectées qui est détecté varie probablement beaucoup d’un pays à l’autre, ce qui rend difficile la comparaison des tendances pandémiques entre différents contextes. Par exemple, l’Italie a jusqu’à présent (24 mars) réalisé environ 3 500 tampons par million d’habitants, contre 6 100 en Corée du Sud ou 600 en Espagne. Selon une estimation du Centre pour la modélisation mathématique des maladies infectieuses de la London School of Hygiene & Tropical Medicine, l’Italie et l’Espagne n’auraient détecté qu’environ 5 % des personnes effectivement infectées.

Combien de morts y a-t-il réellement ?

Nous n’en savons rien non plus, bien que nous puissions estimer les décès avec plus de précision que les cas d’infection.

Ce que nous savons, c’est le nombre de décès dont la cause a été attribuée au COVID-19 (toutefois, les critères d’attribution ne sont pas encore totalement uniformes au niveau international). Et nous ne sommes pas certains que tous les décès causés par le coronavirus ont réellement été détectés : de nombreux rapports provenant des régions les plus touchées d’Italie suggèrent , par exemple, que toutes les victimes de la pandémie ne sont pas soumises à un prélèvement (par exemple, beaucoup de ceux qui meurent chez eux ou dans les maisons de retraite échappent à cette statistique). D’autre part, les régimes autoritaires tels que la Chine ou l’Iran pourraient avoir intérêt à ne communiquer que des données partielles, ce qui réduirait l’ampleur du problème à l’intérieur de leurs frontières – les décès causés par la pandémie pourraient donc être plus nombreux que ceux résultant des comptages officiels.

Quelle est la létalité de COVID-19 ?

Nous n’avons pas non plus de certitude dans ce domaine. La dangerosité d’une maladie peut être mesurée par son taux de létalité – c’est-à-dire la proportion de personnes qui meurent par rapport au nombre d’individus infectés – ou par son taux de mortalité, qui mesure la proportion de personnes qui meurent par rapport à la population totale. Un taux de létalité de 4 % indique que, pour 100 personnes infectées, la maladie provoque en moyenne 4 décès.

Les estimations circulantes du taux de létalité de COVID-19 varient beaucoup – trop – selon le contexte. D’une part, cette variation peut en fait être liée à des spécificités locales : par exemple, la maladie est susceptible d’affecter plus sévèrement les régions ou les pays où la population est en moyenne plus âgée ou plus sensible aux problèmes respiratoires, comme dans la vallée du Pô. D’autre part, la variation ne peut être qu’apparente et liée à la manière dont les données sont collectées. Le taux de létalité met en effet en relation deux chiffres, celui des décès et celui des personnes infectées – mais, comme nous l’avons vu, ces chiffres sont souvent relevés de manière différente et parfois avec des écarts énormes.

En tout état de cause, le taux de létalité du syndrome induit par le coronavirus est d’un ordre de grandeur supérieur à celui des maladies virales les plus communes , comme la grippe saisonnière. Cette dernière cause généralement la mort de moins de 0,1 % des personnes touchées, diluée sur plusieurs mois, alors qu’on estime que COVID-19 provoque la mort d’au moins vingt à trente fois plus de personnes, concentrée en quelques semaines.

Deux techniques utiles pour comparer les données

Outre toutes les lacunes et les incohérences dans la collecte des données, les comparaisons entre les régions et les pays touchés par le coronavirus sont compliquées par le fait que l’infection n’a pas débuté partout en même temps. Comparer la situation actuelle dans la région du Hubei en Chine – où la contagion dure depuis des mois – avec celle des pays où elle est arrivée récemment ne serait pas d’une grande utilité : pour comparer différents contextes, il est plus utile de prendre comme point de départ le jour respectif où les premiers cas ont été confirmés pour chacun d’entre eux, et de comparer la tendance depuis cet instant . Par exemple, quinze jours après le début de la contagion, l’Italie a compté environ 800 victimes officielles, tandis que l’Espagne en a compté près de 2 000.

Une autre façon de comparer les tendances en matière de contagion entre des pays qui collectent des données de différentes manières est de comparer le taux de croissance de la contagion dans chaque pays – par exemple, en mesurant le nombre de jours nécessaires pour doubler le nombre de décès enregistrés. En Allemagne, ce nombre double tous les deux jours, en Italie tous les cinq jours – tandis qu’en Corée du Sud, il s’écoule maintenant 13 jours entre le doublement du nombre de décès, de sorte que la contagion s’y est considérablement ralentie.

Stay up to date with our newsletter!