Oxford - étude Recovery : où sont passés les morts ?

  •  SOUTENEZ L'INDEPENDANCE DE FRANCESOIR, FAITES UN DON !  

Oxford - étude Recovery : où sont passés les morts ?

Publié le 06/08/2020 à 15:54 - Mise à jour à 18:38
Pexels
PARTAGER :

Auteur(s): Valère Lounnas et Xavier Azalbert pour FranceSoir

-A +A

ANALYSE : L’analyse des données de l’étude phare britannique Recovery suite aux diverses publications a donné lieu à l’identification de multiples incohérences. Nous présentons ici ces analyses en détail. Elles comprennent deux approches :

  • Une analyse des données publiées à des moments clés présentant de nombreuses incohérences qui posent réellement question,
  • Une analyse de rétro-ingénierie des courbes de mortalité de Recovery qui révèle vraisemblablement des incohérences dans les données publiées. 

La simple analyse des données publiées complétée par celle issue des échanges entre les parties prenantes est plus qu’inquiétante et mériterait un véritable audit indépendant complet tellement les conséquences observées sont critiques et amènent des questions sur la gestion de cette étude.

La rétro-ingénierie a été utilisée en support de l'analyse de l'incohérence des données. De plus, il nous a paru intéressant d’étalonner les résultats de Recovery sur l’étude de l’AP-HP. Nous arrivons à estimer correctement les bras Soins Standards, dexaméthasone. Pour ce qui est du bras hydroxychloroquine, de nombreuses incohérences apparaissent qui démontreraient une surmortalité les premiers jours qui pourrait correspondre au surdosage (2400 mg de Plaquenil le premier jour de traitement et plus de 9000 mg sur 10 jours). 

Faute intentionnelle ou pas, il s’agit ici de morts. Cette étude appelle à un véritable audit indépendant car la prépublication de Recovery ne saurait être approuvée tellement les incohérences sont nombreuses.

(Mise à jour le 6 août et le 7 août pour apporter des corrections ortographiques et des précisions sur des calculs suite à la suggestion d'un internaute).

Avant-propos

France Soir a déjà publié deux articles sur le surdosage d'hydroxychloroquine (HCQ) au premier jour de traitement des patients atteints de symptômes aiguës du Covid-19 dans le bras HCQ de l'essai Recovery (12). Dans cet essai, une dose de charge de 2400 mg a été utilisée au jour 1 du traitement, répartie en 4 prises sur 24h, suivie de 800 mg/jour sur les 9 jours suivants. Ces doses sont à comparer avec celles raisonnablement administrées dans les hôpitaux de l'Assistance Publique de Paris (600 mg au jour 1 suivis de 400 mg les 9 jours suivants) (3). Nous avons affirmé dans ces 2 articles, auxquels le lecteur peut se référer, que de toute évidence, il y a eu un surdosage très dangereux, que nous pensons potentiellement mortel sur des patients âgés, hospitalisés et physiologiquement très fragilisés par la maladie du Covid-19. 

L'interview du Pr Martin Landray de l'Université d'Oxford, co-investigateur principal de l'essai avec le Pr Peter Horby également de l'Université d'Oxford, que France Soir a réalisée le 6 juin, avait mis en évidence une méconnaissance de la dose de toxicité limitante pour l'HCQ de la part d'un instigateur principal de l'essai Recovery (4). Ce qui nous avait inquiété, ainsi que bien des experts.

Nous présentons ici une analyse méthodique par rétro-ingénierie des résultats préliminaires du bras HCQ et de son comparateur de soins standards (SOC : standard of care) déposé sur le site MedRxiv de l'Université de Cornell (5).

Nous déplorons que le site de prépublication de l'Université de Cornell soit détourné, en cette période de crise pandémique, à des fins de communication certainement plus politiques que scientifiques étant donnée la controverse qui continue de sévir sur l'usage de l'hydroxychloroquine, malgré les preuves qui continuent d'être apportées sur son efficacité (678910) non seulement à un stade précoce ou en prophylaxie mais aussi très vraisemblablement également à un stade avancé de la maladie (11). 

Analyse I - Les données globales de l'essai ne sont pas cohérentes entre elles

Nous présentons dans le tableau ci-dessous à la manière d'un Sudoku géant, les données de Recovery dont les publications ont été parcellaires et incomplètes. Avec l’aide de correspondants anglo-saxons, nous avons obtenus certains échanges dans le cadre de la législation FOI (Freedom of Information Act) qui existe au Royaume-Uni et permet d’obtenir les informations sur les échanges entre diverses parties. Nous avons donc analysé ces divers échanges et, à la manière d’un Sudoku géant, avons reconstitué le tableau des données à diverses dates.

Plusieurs dates importantes :

  • Le 22 mai 2020 : c’est la date de la publication de l’étude de Mehra dans The Lancet. Etude rétractée depuis, mais qui a déclenché des échanges entre le Comité de Surveillance de Recovery (DMC, un organe réglementaire obligatoire constitué pour tout essai au Royaume-Uni), l’équipe de Recovery et le MHRA (équivalent de notre Agence Nationale de Sécurité du Médicament ANSM).
  • Le 26 mai : date de réponse de Recovery au DMC.
  • Le 4 juin : le DMC demande à Recovery de faire une analyse des données complètes en enlevant la confidentialité des données. C’est aussi la date de l’analyse des données qui fera l’objet du préprint dans MedRxiv en juillet.
  • Le 5 juin : communiqué de presse parcellaire de Recovery qui indique que le bras HCQ est arrêté car il n’y a pas d’effet et indique un taux de mortalité.
  • Le 8 juin : communiqué de presse de Recovery annonçant le succès de la dexaméthasone.
  • Le 30 juin : vidéo conférence de Recovery au sujet du bras hydroxychloroquine (HCQ).

 

Nous avons reconstitué le tableau à partir des tous les documents fournis, y compris certains éléments de langage qui mettent en évidence des incohérences entre les bras hydroxychloroquine (HCQ) et de soins standards (SOC)). Nous résumons les principales observations.

  • Le 22 mai, le DMC demande aux investigateurs de Recovery s'ils peuvent confirmer le ratio de HR = 1,335 (ratio entre le pourcentage des décès entre les bras HCQ et SOC de l’étude Mehra et al.) dans le bras HCQ de l’étude Recovery.

    La réponse des investigateurs principaux de Recovery par email est éloquente : nous recommandons de continuer l’inclusion car le DMC est satisfait que le HR (ratio de risque) de Recovery soit significativement différent du ratio de l’étude de Mehra al. Surprenant, mais le chiffre exact de ce ratio n’est donné nulle part dans les échanges. 
    Sûrement aveuglé par le HR de l’étude Mehra, ce que le DMC ne demande pas et qui n’est pas non plus divulgué par les investigateurs de Recovery, ce sont les taux de mortalité dans ces deux bras. Ces taux sont forcément connus puisqu’ils servent à calculer le HR. Et nous verrons plus loin pourquoi ceci est si important. De plus, il est totalement invraisemblable que cette donnée clé n'ait pas été échangée officiellement par courriers puisqu'il s'agit là de l'information sur la base de laquelle la décision est prise... Les deux parties se seraient-elles donc tacitement entendues pour que ces chiffres ne soient pas divulgués ?
  • Le 4 juin 2020, jour de la rétractation de l’étude Mehra, le MHRA demande que la confidentialité des données soit levée et que l’analyse complète soit faite. Nous ne savons pas pourquoi.
     
  • Le 5 juin 2020, les investigateurs principaux annoncent l’arrêt du bras HCQ de Recovery au motif que ce médicament ne démontre aucune efficacité et que le taux de mortalité est identique à celui du bras soins standards. C’en est fini pour l’hydroxychloroquine.
     
  • Le 8 juin 2020, Recovery annonce que la dexaméthasone aurait un impact significatif sur le taux de mortalité HR = 0,89 versus le bras de soins standards (colonne 8 juin dans mis en dernière annexe).

Les incohérences dans les données et l’analyse :

  • A la date du 4 juin, le nombre de morts du bras HCQ et SOC sont différents. Une première version dans le communiqué du 5 juin donne seulement les ratios de 25,7% pour HCQ et 23,5% pour SOC, ce qui permet de recalculer les décès à 396 et 736 pour chacun des bras respectifs. Le 30 juin 2020, dans une conférence, ces chiffres se montent respectivement à 411 et 766 alors que dans le préprint ils sont de 418 et 768.
  • Cependant dans le préprint, la courbe de Kaplan-Meier fait état de 436 morts dans le bandeau patients à risque dans le bras HCQ et 809 dans le bras SOC. Incohérence avec la courbe elle-même (voir section 2 de l'article).
  • En reconstituant les données pour le 22 mai, nous avons trouvé dans les échanges avec le DMC qu’il y avait 1026 morts pour 4515 randomisés dans le bras HCQ (1515 patients) et SOC (3060 patients). Mais nous n’avons pas le détail des morts entre HCQ et SOC.
  • Entre le 22 mai et le 4 juin, le taux d’inclusion dans l’essai a augmenté de 4,84%, le taux de patients inclus dans le bras HCQ est de 3,08%. Incohérent donc car le DMC avait demandé de continuer l’inclusion des partients car il n’y avait aucun souci.
  • Entre le 22 mai et le 4 juin, le nombre de morts dans le bras HCQ est donc passé de 1026 à soit: 1132 ou 1177 ou 1206 ou 1245 selon que le documentt que l'on prend en compte (et ce pour la même date d'analyse du 4 juin) ! Le nombre de morts dans ce bras a augmenté de 21,35% entre ces deux dates alors que l’inclusion n’augmentait que de 3%. Difficile de comprendre donc.
  • Un autre point qui attire notre attention est le taux de mortalité du bras SOC au 4 juin (25%) par rapport à celui du bras SOC dans la partie dexaméthasone de l’étude (25,7%).

Nous sommes donc devant de trop nombreuses incohérences qui ne peuvent que semer le doute sur les données. Et il manque toujours le nombre de morts exact dans le bras HCQ au 22 mai.

La courbe de Kaplan-Meier publiée dans MedRxiv va nous donner cette information. En faisant le calcul du nombre de morts au bout de 13 jours par le biais d’une simple règle de trois, nous trouvons 659 morts au 13ème jour dans le bras SOC (différence qui existe entre le 22 mai et le 4 juin). Par différence avec les 1026 morts (donnée obtenue dans les échanges par courrier), nous avons donc 367 morts dans le bras HCQ. Les ratios de mortalité seraient donc de 24,22% (HCQ) et 21,54% (SOC) avec un HR de 1,12.  (modification le 7 août, précision le calcul est basée sur le SOC qui nous parait plus stable suite à l'analyse du rétrofit, il peut exister une variation selon l'usage d'une estimation logarthmique ou pas). 

Différence significative et problème

  • Ce ratio de HR = 1,12 est bien différent statistiquement du ratio de l’étude Mehra à un test bilatéral avec p = 0,01; Mais Recovery et le DMC avaient-ils raison de continuer sur cette base car un facteur politique très important planait sur la réalisation de cet essai et un tel ration aurait du inquieter?
  • Cependant cette étude était viciée, et personne n’a posé la question de ce qu’il se passait au niveau du suivi de l'essai le 22 mai entre les bras HCQ et SOC.
  • Le DMC et le MHRA, probablement aveuglés par le HR = 1,335 annoncé par l'étude de Mehra, n’ont pas cherché plus loin. Le fait que le ratio de 1,12 soit différent a suffit pour continuer, mais ce n'est peut-être pas l'unique raison car un facteur politique très important planait sur la réalisation de cet essai.
  • Ici, une question apparaît : existe-t-il à cette date une différence d’effet entre les bras HCQ et le SOC ? C’est cette différence qui aurait dû attirer l’attention des experts. Ces chiffres sont forcément connus des deux parties puisque le ratio a pu être calculé.
  • En faisant le test statistique entre le taux de mortalité HCQ (24,22%) et le taux de mortalité SOC (21,54%), nous trouvons une différence statistiquement significative. (IC 95% p=0,02).

Le 22 mai, les Investigateurs en Chef de Recovery savaient s’il existait une différence significative entre le bras HCQ et le bras SOC. Cette information n’est pas parvenue au DMC. Pas plus que le DMC n’a posé la question dans les échanges. N’importe quel expert en biostatistique se serait posé la question à la vue du ratio de 1,12.

De plus, l’analyse des mortalités ou patients à risque (436 morts soit 27,9% dans le bras HCQ et 809 soit 25,6% dans le bras SOC) issues des données fournies avec la courbe de Kaplan-Meier (mais pas la courbe elle-même) donne un HR de 1,09. En utilisant un test statistique unilatéral et non bilatéral, on trouve une différence significative à 95% avec p=0,0481. Une preuve de plus que le sérieux des résultats de cette étude ne peut qu’être remis en cause.

L’inclusion des patients dans le bras HCQ a donc continué alors que l'étude était viciée dès le départ et que mère prudence aurait commandé de vérifier les données intrinsèques à l’étude. Donc incompétence initiale sur le dosage et volonté de cacher l’information par la suite nous semblent avoir été les tenants et aboutissants de cette étude qui restera dans les annales de ce qu'il ne faut pas faire. Seule une enquête approfondie pourrait le confirmer. Toujours est-il que cette information combinée avec le surdosage montre bien que le 22 mai, il y avait une surmortalité dans le bras HCQ qui aurait dû alerter les Investigateurs en Chef. Cependant fournir cette information aurait sûrement déclenché une enquête du DMC et du MHRA car l’HCQ aurait été montrée plus nocive que le SOC.

De plus, nous attirons l’attention sur le fait que le 23 mai, les investigateurs de Recovery écrivaient qu’ils attendaient une nouvelle étude sur la pharmacocinétique de l’HCQ :

En réponse à une demande antérieure de la MHRA, nous présenterons bientôt un amendement au protocole pour l’autorisation d’une sous-analyse dans RECOVERY pour étudier la pharmacocinétique de l’hydroxychloroquine plus en détail, et aussi pour étudier la pharmacogénomique de hydroxychloroquine et azithromycine sur les arythmies cardiaques. Il s’agit d’identifier les facteurs de risque pour les arythmies induites par le médicament et la fièvre.

Nous maintenons nos accusations que les Chefs Investigateurs ont caché des informations.

 

Analyse II - Par rétro-ingénierie : les données de mortalités du texte prépublié sont incomplètes, parcellaires et incohérentes

Nous relevons qu'en ce qui concerne la toxicité du traitement HCQ dans les premières 48 heures de son administration, la prépublication botte en touche en restant exagérément peu informative malgré les questions parues dans la presse française (France Soir) et internationale.

Pour toute réponse, les auteurs se contentent d'affirmer que : « We did not observe excess mortality in the first 2 days of treatment with hydroxychloroquine, the time when early effects of dose-dependent toxicity might be expected. » (sic). Ce qui se traduit par : « Nous n'avons pas observé d'excès de mortalité sur les 2 premiers jours de traitement avec l'hydroxychloroquine, la période où on s'attend à observer la toxicité dépendante de la dose. » Les auteurs indiquent également qu'aucune toxicité cardiaque n'a été observée au moment de l'élaboration du texte des résultats préliminaires.

Il faut noter que le flou le plus artistique entoure le nombre de patients ayant reçu le traitement puisque le texte mentionne que seulement 1395 patients ont reçu l'HCQ sur 1516 en intention de traiter parmi les 1561 patients randomisés dans le bras HCQ !... La seule information chiffrée fournie, potentiellement indicative d'une toxicité liée à une surdose de traitement, est l'intervalle interquartile de jours de traitement (IQR) allant de 3 à 10 jours. Cela veut dire que le quart des patients ayant reçu au moins une dose de traitement, 349 patients donc, ont arrêté le traitement dans un délai de 3 jours ! Les seules causes d'arrêt de traitement sont en principe la toxicité, le refus du patient ou bien son décès. Ou bien encore sa sortie d'hôpital ! Ce qui paraît peu probable en l'occurrence étant donné que le temps médian jusqu'à la sortie d'hôpital rapporté par l'étude de l'AP-HP était de 9 jours pour les patients recevant l'HCQ. Aucun arrêt pour toxicité ni à la suite d'un refus du patient n'est mentionné dans le texte déposé sur MedRxiv.

L'information des décès au jour le jour peut être déduite des courbes de mortalité qui donnent avec justesse le nombre de patients encore en vie aux jours 7, 14, 21 et 28 suivant la randomisation et donc depuis le début du traitement (le même jour). Pour les autres jours, ce nombre peut être déduit de façon assez fiable graphiquement avec une équerre à partir des courbes elles-mêmes (Fig. 1).

Nous avons rassemblé ces valeurs dans le tableau suivant. De prime abord, il révèle plusieurs incohérences. Tout d'abord, les données des nombres de patients à risque (c'est-à-dire ceux encore vivants à un jour J donné suivant la randomisation) indiquent qu'il y a 436 décès à 28 jours dans le bras HCQ contre 809 dans le bras SOC, alors que dans le texte il est fait mention de 418 décès pour HCQ et 788 pour SOC à 28 jours, en se référant à 1561 et 3155 comme nombre total de patients randomisés dans chaque bras ! D'autre part, l'analyse graphique des courbes indique des nombres de décès qui divergent à 7, 14, 21 et 28 jours par rapport à ceux que l'on peut déduire directement du nombre de patients à risque.

A partir de l'évolution des décès en fonction des jours, on peut déduire que le temps médian avant décès et le premier quartile sont de 6,6 IQR [3,7 – 12,71] jours dans le bras HCQ et de 6,9 IQR [3,7 – 12,47] jours dans le bras SOC. Donc aucune différence ne peut se déduire des courbes en ce qui concerne le premier quartile Q1 = 3,7 jours ! Si cette information est exacte, pourquoi ne pas la donner clairement chiffrée, au lieu de la laisser paraître seulement de façon cryptée, alors qu'il s'agit d'une question d'importance ? Est-ce que c'est pour éviter d'en discuter les implications. Les chiffres pré-publiés par l'AP-HP sur le temps médian avant décès sont 8,52 IQR [4,52 – 14,26] pour l'HCQ et 7,54 IQR [3,94 – 13,0] pour le bras de soins standards (SOC)... Donc les chiffres de Recovery sont cohérents avec ceux de l'AP-HP en ce qui concerne le bras SOC, mais présentent une incohérence fondamentale avec les chiffres de l'AP-HP en ce qui concerne le bras HCQ avec un raccourcissement de 2 jours du temps médian de décès et de 1 jour du temps du premier quartile Q1 !

La rétro-ingénierie des courbes de mortalité révèle une incohérence mathématique pour la mortalité du bras HCQ

Pour vérifier la cohérence des courbes, nous avons procédé à leurs rétro-ingénierie en utilisant un modèle mathématique ad hoc décrit en détail en annexes 1 et 2. Ce modèle calcule la probabilité p(j) pour un patient donné de mourir à un jour donné j en fonction de la probabilité de décès de la veille p(j – 1) pondérée par un facteur d'évolution de cette probabilité qui varie de jour en jour de façon complexe mais qui peut être modélisée avec un nombre restreints de 6 paramètres, qui sont ajustés pour permettre de reproduire avec autant d'exactitude que possible l'évolution du nombre de décès journaliers. L'observation de la courbe SOC montre que la maladie s'aggrave considérablement dans les 2 premiers jours et que la probabilité de décéder atteint un pic vers le 3ème ou 4ème jour. Cela force un facteur de forme des courbes contrôlé par les paramètres f1 et f2, estimés à 0,2 et 0,8 pour le bras SOC, qui déterminent le facteur de délai avant aggravation à J1 et J2, respectivement. Ensuite les chances de mourir s'amenuisent statistiquement de jour en jour suivant une décroissance exponentielle contrôlée par 4 paramètres (A, Amax., B et α) dont les valeurs comprises dans des intervalles restreints (1 ≤ A ≤ 1,2 ; 2 ≤ Amax. ≤ 5,5 ; 14 ≤ B ≤ 37 ; 1,2 ≤ α ≤ 1,8) permettent de reproduire une très grande variété de formes de courbes.

Ainsi si l'on connaît les probabilités P0 de décès d'un patient au jour j=0 dans le bras HCQ et dans le bras SOC, on peut en déduire alors les probabilités aux jours suivants pour chacun des bras. Chaque jour, un nombre de patients décédés dans chaque bras est déduit par tirage au sort selon un processus de Monte-Carlo. Les patients morts sont retirés de l'ensemble (pool) des patients encore vivants et susceptibles de mourir le jour suivant. Les probabilités de départ sont inférées à partir des courbes elles-mêmes (cf. annexes 1 et 2).

Les annexes 1 et 2 rendent compte intégralement du modèle utilisé de sorte que ceux qui voudraient le vérifier ou le critiquer puissent avoir tout loisir de le faire. Les probabilités moyennes < P> de départ sont fixées par le nombre de décès rapportés entre J1 et J7. Les paramètres quasi optimums pour la courbe SOC ont été établis assez facilement manuellement par recherche visuelle (courbe SOC Fig. 3, paramètres annexe 2). La recherche systématique des meilleurs paramètres peut aussi s'effectuer automatiquement et s'établissent autour de valeurs optimales très précises qui permettent de reproduire la forme des courbes avec une excellente exactitude de J1 à J28 (Fig. 2). Il faut noter cependant que les valeurs obtenues par recherche automatique peuvent différer largement de celles obtenues empiriquement par tâtonnement. Cela traduit le fait que les courbes peuvent être approximées par différents sets de paramètres.

Une incohérence pouvant correspondre à un excès de mortalité dans les 3 premiers jours est mis en évidence pour la courbe HCQ.

Ce modèle ne rend certainement pas compte de toute la réalité d'une courbe de mortalité mais vaut par ce qu'il permet de déduire. Malgré la souplesse mathématique du modèle, nous n'avons pas complètement pu reproduire la courbe de mortalité HCQ avec exactitude de J1 à J28.

En l'occurrence, selon tout logique, en suivant les conclusions des auteurs de Recovery, l'HCQ n'étant ni toxique ni active contre le Covid-19, la nature de la courbe de mortalité HCQ et les paramètres qui la décrivent ne devraient différer que très marginalement de ceux du bras SOC. Donc nous avons gardé les paramètres de forme identiques à J1 et J2 (f1 = 0,2 et f2 = 0,8 décrivant une faible aggravation) pour HCQ et conduit une recherche exhaustive pour ajuster les 4 autres paramètres (A, Amax., B et α) en testant systématiquement plus 6 millions de combinaisons de valeurs possibles sans pouvoir obtenir un fit parfait de J1 à J28 comme pour la courbe SOC. Entre J6 et J9, et également à J4, une différence non négligeable apparaît entre la meilleure courbe HCQ modélisée possible et la courbe de Recovery (Fig. 3). Dans la courbe modélisée, il manque environ 12 à 13 décès entre J1 et J9 alors qu'il y a 13 décès de trop à J4. Il s'agit peut-être là que de variabilité naturelle. Cependant, comme nous le voyons pour SOC (Fig. 2) et nous le verrons plus loin dans l'article (Fig. 7 pour la dexaméthasone), la courbe de mortalité du bras HCQ est la seule à résister à la modélisation complète de J1 à J28.

 

Nous avons alors élargi la fenêtre de recherche des paramètres B et α qui contrôlent la hauteur de la courbe, en autorisant des valeurs de B inférieures (10 à 14) et supérieures de α (1,8 à 2,2) pour permettre un meilleur ajustement dans la zone 5 à 10 jours. Cependant cela n'a pas permis d'obtenir un meilleur fit mais de reproduire, avec des paramètres différents, une courbe approximée quasiment identique avec la même déplétion de mortalité entre J6 et J9.

La mortalité moyenne entre J1 et J7 de la courbe HCQ de Revovery (< P0 > = 0,0239) est 15% plus élevée que celle du bras SOC (< P0 > = 0,0210). Cela nous conduit à envisager la possibilité d'une différence des paramètres f1 et f2 d'aggravation de la probabilité de décès dans les 2 premiers jours. Nous avons donc fait varier ces deux paramètres, 0,2 < f1 < 0,7 et 0,6 < f2 < 0,9 avec les autres paramètres, générant ainsi 108 millions de combinaisons.

Nous n'avons fait entrer dans le calcul du meilleur fit possible que les jours J4 à J28 et laissé les différences de mortalité entre J1 et J3 par rapport aux données de Recovery sans influence sur la valeur du fit. Cela permet à f1 et f2 de s'établir uniquement en fonction de leur influence à partir de J4 en agissant sur le nombre de patients à risque disponible à partir de J3. Ce procédé a permis de mieux reproduire la courbe HCQ de Recovery entre J5 à J28, réduisant la déplétion entre J6 à J9, mais créant un décalage en sus de la courbe entre J1 et J4 dû à 15 décès en excès à J1 (23 au lieu de 8) qui se répercute à J2, J3 et J4 (Fig. 4a). Les meilleurs paramètres se sont établis comme suit : A = 1,09, Amax. = 5,40, B = 14,5, α = 1,53, f1 = 0,45 et f2 = 0,6.

Pour valider ce résultat, nous avons refait exactement le même calcul à la différence que le meilleur fit a été recherché entre J1 à J28 au lieu de J4 à J28. Nous retrouvons alors le même le fit correct de J1 à J3, avec f1 et f2 qui s'ajustent librement comme les autres paramètres en prenant les valeurs f1 = 0,2 et f2 = 0,75 (A = 1,08, Amax. = 4,80, B = 14, α = 1,61), en accord avec les valeurs estimées empiriquement à partir du bras SOC, et la déplétion de mortalité entre J6 et J9 produisant une courbe (Fig. 4b) en tout point équivalente à la courbe HCQ (Fig. 3)

 

Notre modèle permet donc de reproduire très fidèlement la courbe du bras SOC mais ne permet pas de rendre compte correctement de la courbe de mortalité dans le bras HCQ de Recovery. Nous estimons que sa nature est donc mathématiquement différente de la courbe SOC.

Nous soulignons que la probabilité moyenne de décès de départ <P> = 0,0239 dans le bras HCQ (donnée observationnelle réelle) est trop élevée pour permettre un simple décalage de 2% de la courbe, en particulier dans la région J1-3, sans sous-tendre une modification profonde de la forme de la courbe !

Il n'est pas interdit de supposer que deux effets contradictoires, toxicité et activité, puissent se confondre dans la même courbe empêchant sa modélisation de la même façon que le bras SOC.

Notons également que le test d'égalité des proportions, appliqué aux nombres de décès à J1 entre le bras HCQ modélisé et le bras SOC de Recovery, indique qu'un excès de 15 décès à J1 dans le bras HCQ correspondrait à d'une différence de mortalité significative par rapport à SOC.

Les paramètres IQR du « temps au décès » de l'AP-HP indiquent une efficacité significative de l'HCQ.

Afin de vérifier la cohérence de notre modèle, nous avons calculé la courbe de mortalité du bras HCQ avec les paramètres que l'on peut déduire de l'étude rétrospective des hôpitaux de l'Assistance Publique de Paris (AP-HP) publiée dans MedRxiv. Nous avons ajusté les paramètres afin d'obtenir une probabilité initiale cohérente pour HCQ (voir annexe 2) et un temps médian avant décès d'environ 8,4 jours ainsi qu'un temps Q1 de 4,5 jours pour nous rapprocher autant que possible des paramètres de l'AP-HP tout en gardant la différence du ratio de mortalité à 28 jours, entre HCQ et SOC, dans un écart de 4% cohérent avec les données de l'AP-HP. Nous avons obtenu sans difficulté les courbes suivantes en gardant les paramètres de la courbe SOC inchangés.

 

A 28 jours le taux de mortalité de la courbe HCQ ainsi simulée est de 21,0% alors que celle de la courbe SOC est de 25,0% ce qui donne un rapport de 1,19 en accord avec le ratio de mortalité à 28 jours de l'AP-HP entre HCQ et SOC (1,23 = 21,9%/17,8%)

 

A 28 jours, le taux de mortalité de la courbe HCQ ainsi simulée est de 21,0% alors que celle de la courbe SOC est de 25,0%, ce qui donne un rapport de 1,19 en accord avec le ratio de mortalité à 28 jours de l'AP-HP entre HCQ et SOC (1,23 = 21,9%/17,8%).

Reconstruction des courbes de mortalité de Recovery pour la comparaison dexaméthasone avec SOC

Le modèle a permis de reconstruire très fidèlement les courbes de survie de Recovery pour le bras dexaméthasone et le bras SOC augmenté de 1166 patients (Fig. 6a). Le calcul de la probabilité moyenne initiale à partir des patients à risque (entre J1 et J7) du bras SOC a légèrement changé et devient <P0> = 0,0218 ajusté à P0 = 0,0246 pour le modèle, les autres paramètres restant inchangés. Les paramètres de probabilité pour la dexaméthasone sont calculés également à partir des patients à risque (entre J1 et J7) comme suit : <P0> = 0,0151 ajusté à P0 = 0,0172 pour le modèle (Fig. 6b), avec les autres paramètres ajustés à : α = 1,68, B = 24, A = 1,15, Amax. = 2,65, f1 = 0,2 et f2 = 0,8. 

Nous voyons donc que notre modèle mathématique permet de reproduire avec exactitude les courbes de mortalité de Recovery pour le bras dexaméthasone.

 

Discussion

Ce modèle ad hoc ne rend certainement pas compte de toute la réalité des courbes de mortalité mais vaut par ce qu'il permet de déduire. Malgré des imperfections probables, la modélisation par rétro-ingénierie des courbes de mortalité permet de mettre en évidence une évolution dans le bras HCQ de nature mathématiquement différente de celle du bras SOC, en contradiction donc avec l'affirmation que le traitement puisse être sans effet et non toxique. Cela traduit probablement une différence médicale réelle au niveau de l'évolution des décès au cours du temps.

Au contraire de la courbe SOC (et de la courbe dexaméthasone), il n'est possible de produire un set de paramètres qui reproduise entièrement avec exactitude la courbe HCQ de J1 à J28. Par rapport aux données de Recovery, on observe une déplétion de mortalité d'environ 13 décès entre J6 et J9, et un excès équivalent à J4, que l'on ne peut réduire partiellement qu'en autorisant l'optimisation des paramètres d'aggravation à J1 et J2. Ces paramètres ont été déduits empiriquement pour SOC. Ce facteur d'aggravation à J1 et J2 entraîne mécaniquement une différence du nombre de patients à risque à J1 et J2 avec des répercussions de J3 à J28. En laissant les paramètres f1 et f2 variés en même temps que les autres paramètres de la courbe HCQ et en optimisant le fit entre J4 et J28, le facteur f1 à J1 prend une valeur 225% supérieure à celle du SOC (f1 = 0,45 au lieu de 0,2). Cela correspond à un excès de 15 décès à J1. Pourquoi notre modèle permettrait-il de reproduire fidèlement la courbe SOC et celle du dexaméthasone et pas celle de HCQ ? Nous pensons que la courbe de mortalité HCQ est une courbe composite entre un effet toxique mortel délétère masquant le bénéfice de survie. 

De plus, la transposition à notre modèle des paramètres de mortalité médiane et IQR prépubliés par l'AP-HP permet de montrer l'efficacité significative de l'HCQ, avec un taux de réduction de mortalité de 18% identique à celui mesuré par l'AP-HP en analyse univariée. Cela correspondrait à une réduction totale de 90 décès, dont 85 dans les 7 premiers jours, par rapport au bras HCQ de Recovery ! 

Lorsque les auteurs de Recovery affirment que l'HCQ ne se révèle pas toxique dans leur essai, il s'agit d'un abus de langage qui découle de la convention sur l'interprétation de la valeur p traduisant la puissance statistique des essais. Le seuil de signification est fixé arbitrairement à 0,05 ce qui signifie 5 % de chance de se tromper à conclure que les courbes de mortalité sont différentes. Dans Recovery, la valeur obtenu, p = 0,18 entre les bras HCQ et SOC, nous dit objectivement qu'il y a 18% de chances de se tromper (et donc 82% de chances d'avoir raison) à affirmer que le traitement HCQ a engendré plus de décès que SOC. Tout cela est redoutable pour les 2 investigateurs principaux de l'essai qui font semblant de pas comprendre que le seuil de significativité de 5% est une convention parfaitement subjective. D'ailleurs de façon schizophrénique, ils écrivent dans la section résultat, juste le contraire de leur conclusion, i.e. que : « Patients allocated to hydroxychloroquine were less likely to be discharged from hospital alive within 28 days (60,3% vs. 62,8%; rate ratio 0,92; 95% CI (0,85-0,99) and those not on invasive mechanical ventilation at baseline were more likely to reach the composite endpoint of invasive mechanical ventilation or death (29,8% vs. 26,5%; risk ratio 1,12; 95% CI 1,01-1,25). » Ce qui se traduit par : « Les patients dans le bras HCQ avaient vraisemblablement moins de chances de quitter l'hôpital vivant dans les 28 jours suivant la randomisation (60,3% vs. 62,8%; rate ratio 0,92; 95% CI (0,85-0,99). De même que ceux qui n'étaient pas sous assistance respiratoire mécanique à l'inclusion avaient vraisemblablement plus de chances d'y être placés par la suite (29,8% vs. 26,5%; risk ratio 1,12; 95% CI 1,01-1,25) dans le bras HCQ.

Nous pensons que les auteurs de l'essai doivent être plus transparents en ce qui concerne le fait que 272 patients (349 – 77 décès cumulé à J3) du bras HCQ ont arrêté le traitement entre J1 et J3 ! Quelles sont les raisons de ces arrêts de traitement qui ne sont certainement pas des sorties d'hôpital ? Il n'y a pas de raison de penser que les données interquartiles de suivi du traitement IQR = [3 to 10 jours] ne s'appliquent pas également aux nombre de décès ce qui indiquerait 109 décès à 3 jours, et non pas 77 comme l'indique la courbe de mortalité de l'HCQ. D'ailleurs cette information aurait été plus pertinente étant donné les critiques qui avaient été portées dans la presse au sujet du surdosage du premier jour.

Les auteurs de la prépublication se défendent en affirmant qu'il n'y a pas de surdosage dans Recovery en comparaison de l'essai brésilien de Borba et al. (12) où la chloroquine était administrée dans sa forme base, ce qui correspondrait à des dosages substantiellement plus élevés d'HCQ sous forme de sel (sulfate). En fait, 800 mg sous forme de sel correspondent à 620 mg sous la forme base. Donc dans l'essai brésilien, il est clair que l'équivalent de 1550 mg de chloroquine sous forme de sel ont été administrés chaque jour (premier jour inclus), ce qui a très rapidement conduit à des décès par arrêt cardiaque et à… un procès. Mais n'en déplaise aux auteurs de Recovery, ils ont bel et bien administré 2400 mg d'HCQ sous forme de sel, l’équivalent de 1860 mg sous forme de base le premier jour. En fait, les doses de Recovery pour le premier et le deuxième jours cumulés dépassent celles de l'essai brésilien avec 3200 mg d'HCQ contre l'équivalent de 3100 mg pour l'essai brésilien. A J3, la dose cumulée est de 4000 mg dans Recovery contre l'équivalent de 4500 mg dans l'essai brésilien. Nous ne pensons pas qu'il n'y a pas là de quoi pavoiser et prétendre que les doses dans l'essai de Borba et al. sont substantiellement plus élevées que dans Recovery. En tout cas, cela est faux sur les 3 premiers jours !

 

Conclusion

Nous continuons donc de penser qu'un surdosage d'hydroxychloroquine dans l'essai Recovery a potentiellement entraîné une grande toxicité dans les 3 premiers jours de traitement, même si de façon peut-être moins spectaculaire que dans l'essai brésilien, masquant son activité bénéfique. En fait, il y a probablement eu, avec de nombreux arrêts de traitement, également des décès toxiques difficiles à élucider car le surdosage de l'HCQ entraîne une défaillance respiratoire aiguë tout comme le Covid-19 ! Une réalité sur laquelle les auteurs de l'essai restent très discrets, pour ne pas dire muets ! Ils préfèrent attirer l'attention sur la mesure de l'arythmie cardiaque mieux connue des médias et donc du public en se couvrant à l'avance de toute tentative d'enquête de ce côté en spécifiant que l'essai Recovery n'a pas collecté d'informations physiologiques ou d'électrocardiogrammes : «We did not collect information on physiological, electrocardiographic, laboratory or virologic parameters. » Cependant, la présence de défaillance respiratoire dûe à la toxicité de l'HCQ serait donc bien en cohérence avec leurs résultats qui indiquent que les patients sous HCQ avaient 12% de chances en plus de passer en soins intensifs sous assistance respiratoire mécanique, entraînant ainsi des chances accrues de décès.

Finalement, il est malheureux de constater que par manque de patient traités par HCQ, l'essai rétrospectif de l'AP-HP a manqué de puissance pour fournir un résultat significatif en analyse multivariée. Comme deuxième malchance, un problème de surdosage, que nous pensons irresponsable, a conduit l'essai Recovery à l'échec alors qu'il était dimensionné pour produire un résultat significatif.

 

 


 

Annexe 1 : modèle mathématique de rétro-ingénierie des courbes de mortalités

 

Annexe 2 : paramètres de la reconstruction par rétro-ingénierie des courbes de mortalités

 

 

 

 

 

Tableau complet

 
 

Auteur(s): Valère Lounnas et Xavier Azalbert pour FranceSoir


PARTAGER CET ARTICLE :


Oxford - étude Recovery : où sont les morts ?

Annonces immobilières

Newsletter





Commentaires

-