Lecture critique d’articles médicaux Convertir en PDF Version imprimable Suggérer par mail
Écrit par Philippe RICHARD   
18-05-2009

Lecture critique d’articles médicaux :

quelques pièges à éviter



A- Problématique :

 

La lecture – trop rapide – d’articles médicaux ne risque t-elle pas d’entraîner des changements majeurs inadaptés dans la pratique des médecins ?

Lors de la lecture d’un article, certains pièges peuvent fausser l’interprétation des résultats d’une étude. Parmi les pièges fréquents, les ODDS ratios sont souvent interprétés à tort comme des risques relatifs ce qui surévalue l’impact d’un facteur de risque. Les études randomisées évaluant l’efficacité d’un nouveau médicament ou d’une nouvelle indication mesurent parfois l’impact sur un facteur intermédiaire au lieu de mesurer l’impact sur des événements cliniques. Les résultats de ces études devraient être considérés avec grande prudence, particulièrement avant leur application dans la pratique clinique. Concernant le dépistage, les résultats d’études d’observation peuvent montrer des pistes intéressantes mais elles peuvent donner des résultats peu valides.

 

B- Introduction :

 

Il ne sera pas question ici de faire allusion aux formations continues « classiques », parfois nommées « EPU », pas plus qu’aux contacts avec des délégués médicaux, dont une part grandissante de médecins savent quoi en penser, mais essentiellement de lectures d'articles médicaux.

Il existe un certain nombre de pièges dont il est utile d'être conscient, particulièrement dans l'interprétation des résultats de ces études, mis en évidence par deux auteurs suisses[1], en utilisant des exemples récemment publiés dans des journaux réputés.


Parmi les pièges les plus importants : les ODDS RATIOS et les MARQUEURS INTERMEDIAIRES.


[1] Nicolas Rodondi Jacques Cornuz  Université de Lausanne 1011 Lausanne

 

C -Dans un premier temps : odds ratio (OR)

 

Abordons la différence entre risque relatif et ODDS ratio (OR) : la limite des critères biologiques pour apprécier l'efficacité d'une intervention et le piège des études observationnelles pour l'évaluation d'un dépistage.


Récemment, l'étude Interheart a réévalué les facteurs de risque pour la survenue d'un infarctus aigu dans 52 pays. Cette étude est très souvent citée. Il s'agit d'une étude cas-témoin ayant comparé 15 152 patients avec un infarctus aigu à 14 820 sujets témoins et qui s'est intéressée à l'association entre l'infarctus du myocarde et plusieurs variables prises individuellement ou en combinaison. Cette étude a montré que la combinaison «tabac, diabète et hypertension» était associée à un odds ratio (OR) pour un infarctus du myocarde de 13. Elle a montré également que l'adjonction du rapport ApoB/A1 (comparant le taux de particules d'apolipoprotéines ApoB favorisant l'athérosclérose et de particules ApoA anti-athérogènes) augmentait l'odds ratio à 42,3. Par ailleurs la présence celle d'une obésité abdominale (index taille sur hanches), entraînait un odds ratio à... 68,5 ! 


La combinaison de ces facteurs de risque correspondant à une situation proche de celle du syndrome métabolique, une interprétation rapide de cette figure pourrait laisser suggérer que le syndrome métabolique entraîne un risque d'infarctus aigu 68,5 fois plus élevé, constituant dès lors une situation à très haut risque de problèmes cardiovasculaires, bien au-delà de la simple somme des facteurs de risque individuels. Cependant, ces odds ratios ne sont pas équivalents à des risques relatifs et un odds ratio de 68 n'équivaut pas à une augmentation du risque de 68 fois. Pourquoi cela ? Tout simplement parce qu'un odd (cote) n'est pas synonyme de risque. Il est donc important de différencier le concept de risque de celui d'odd, traduit en langue française par le terme cote. La cote, bien connue des parieurs des pays anglo-saxons et des bookmakers, se définit comme le rapport de survenue d'un événement / non-survenue d'un événement. On peut illustrer la différence de ces deux concepts à la fois en parlant de la prévalence et de l'incidence d'une maladie.


1. Si la prévalence d'une maladie M est égale à 0,20 cela signifie que tout sujet de cette population a, en moyenne, un risque sur cinq d'être porteur de la maladie M (donc un risque de 1/5, soit 20%) et, par conséquent, quatre chances sur cinq de ne pas être porteur de cette même maladie (donc une chance de 4/5, soit de 80%). Cela signifie aussi que chaque personne de cette population étudiée a une probabilité d'être atteinte de la maladie contre quatre de ne pas avoir cette maladie. Qu'en est-il de la cote ou de l'odd ? On peut également raisonner en disant que chaque personne de cette population étudiée a une probabilité d'être atteinte de la maladie contre quatre de ne pas avoir cette maladie. Pour chacune des personnes, la cote en faveur de la maladie M est de un contre quatre ou 1/4 soit 0,25. Le risque, lui, est, rappelons-le, de 1/5 soit 0,20. L'odd est donc supérieur au risque.


2. En termes d'incidence, on retrouve également une différence notable entre ces deux concepts. Le risque relatif permet d'exprimer facilement l'association entre l'exposition à un facteur (par exemple un traitement ou un facteur de risque) et la survenue d'une maladie (cancer) ou d'un événement clinique (infarctus). C'est le chiffre par lequel le risque de maladie ou d'événement est multiplié en présence de l'exposition au facteur. Ainsi donc, un risque relatif de quinze de cancer du poumon chez le fumeur actif de 50 ans, fumant depuis une trentaine d'années, signifie que le risque de cancer chez cette personne est multiplié par quinze en comparaison à celles et ceux qui n'ont pas ce facteur. Un rapport de cote n'est pas un rapport de risque. Il n'apporte une information similaire à celle du risque relatif que si le risque est très faible, inférieur à 10%.


Les odds ratios et les risques relatifs peuvent se calculer à partir des données initiales et donc des mêmes chiffres, les odds ratios surestiment de façon systématique le risque relatif. Cette surestimation est d'autant plus grande que la fréquence (incidence ou prévalence) de l'événement considéré dans l'étude est grande. C'est seulement lorsque l'événement est rare, c'est-à-dire survenant chez moins de 10% de la population étudiée, que les valeurs des odds ratios correspondent aux valeurs des risques relatifs, et plus la fréquence de l'événement augmente, plus les odds ratios surestiment les risques relatifs. 


Vu que l'étude Interheart est une étude cas-témoin, elle ne permet de calculer que des odds ratios et non des risques relatifs. Sans expliquer tous les détails méthodologiques, l'incidence ou la prévalence des infarctus n'est pas estimable dans le cadre d'une étude cas-témoin car, en raison de la forme idéale de ce type d'étude, la moitié des personnes ont eu un infarctus, et la moitié n'en ont pas eu. Les résultats publiés sont donc corrects, mais c'est leur interprétation qui doit être faite avec prudence ; on ne devrait donc pas parler de risque (comme malheureusement c'est le cas dans l'article original publié dans The Lancet), mais seulement d'odds pour éviter la confusion chez le lecteur. Les études de cohortes prospectives ont d'ailleurs montré que le syndrome métabolique augmentait le risque d'infarctus aigu, mais de façon plus modérée, (par un risque relatif de 1,51 avec un intervalle de confiance à 95% de 1,12-2,05), bien plus modeste et moins spectaculaire que ne le laissent supposer les résultats de l'étude Interheart. 


Comment éviter que les odds ratios ne soient interprétés comme des risques relatifs ? Au-delà de la connaissance de leur signification objective, deux options sont possibles : soit rapporter les risques absolus des événements, soit convertir les odds ratios en risques relatifs ou en pourcentages ajustés si les odds ratios ne peuvent pas être évités, comme dans le cas d'une étude cas-contrôle.

 

D – LES MARQUEURS INTERMEDIAIRES

 

Dans un second temps : Etudions les marqueurs intermédiaires : il s'agit de variables qui augmentent ou diminuent le risque de survenue d'un événement clinique, comme le taux de cholestérol pour le risque de maladie coronarienne ou la mesure de la densité osseuse pour évaluer le risque de fracture. La modification de ces marqueurs n'est pas directement en soi importante pour le patient qui n'en ressent pas directement les bénéfices. Ces marqueurs intermédiaires sont utilisés lors de l'évaluation du développement d'un nouveau traitement (études de phase II) ou si les ressources sont trop limitées pour permettre de faire une étude avec un nombre suffisant de patients pour évaluer l'impact clinique. Certains médicaments sont toutefois mis sur le marché avec des résultats sur ces seuls marqueurs intermédiaires avant que les études avec des événements cliniques soient disponibles, comme l'ont accepté plusieurs organismes d'enregistrement des nouveaux médicaments, en particulier la Food and drug administration (FDA) dès 1992.


Prenons comme exemple le torcetrapib et effet sur le cholestérol hdl et notamment le récent échec du développement du torcetrapib, un inhibiteur de la cholesteryl ester transfer protein (CETP). Ce nouvel hypolipémiant prometteur entraîne une augmentation du cholestérol HDL de 60% et une baisse du cholestérol LDL de 20%, en addition à un traitement d'atorvastatine. Cependant, la première étude clinique qui incluait 15 000 patients à haut risque de maladie coronarienne a du être stoppée prématurément après moins d'une année à cause d'un excès d'infarctus du myocarde, d'angines de poitrine, de décès et d'insuffisances cardiaques dans le groupe traité par torcetrapib. Une augmentation majeure du cholestérol HDL, un marqueur de risque intermédiaire, ne s'est donc pas traduite par un impact positif sur les événements cliniques, possiblement en partie à cause d'un effet défavorable sur la tension artérielle systolique qui avait augmenté dans le groupe traité par torcetrapib.


Comment expliquer que l'amélioration d'un marqueur intermédiaire, qui prédit bien un risque, ne se traduise pas toujours par une baisse des événements cliniques ? Trois explications peuvent être avancées : premièrement la survenue d'une maladie dépend souvent de la conjonction de plusieurs facteurs de risque et non d'un seul ; deuxièmement l'effet du traitement peut ne pas être similaire sur chacun de ces facteurs de risque, comme démontré par l'exemple du torcetrapib ; troisièmement l'effet du traitement sur les événements cliniques peut être influencé par des mécanismes non anticipés, agissant de façon indépendante du facteur de risque traité.


Il faut donc être prudent dans l'interprétation des résultats des études randomisées qui montrent des résultats sur un facteur de risque intermédiaire, mais pas sur des événements cliniques, particulièrement quand il s'agit de démontrer l'efficacité d'un nouveau médicament ou d'une nouvelle indication. De plus, il y a un certain nombre de critères à remplir avant de valider un marqueur intermédiaire pour démontrer qu'il est un excellent prédicteur d'événement clinique, y compris la démonstration que l'abaissement de ce marqueur intermédiaire par un traitement entraîne un impact positif sur les événements cliniques. De nombreux marqueurs intermédiaires ne répondent pas à tous ces critères et ne peuvent donc pas être utilisés à la place des événements cliniques pour valider des nouveaux traitements, sans risque d'obtenir des effets différents ou moindres sur les événements cliniques. C'est notamment le cas de la plupart des facteurs de risque cardiovasculaire dits «émergents», comme la protéine C-réactive (CRP). Parmi les marqueurs de risque intermédiaires validés, on peut citer la virémie pour le VIH ou la densité osseuse pour l'ostéoporose, même si certains auteurs recommandent d'être prudent avec leur utilisation pour valider de nouveaux médicaments.

 

E - Concernant les études d'observation pour des tests de dépistage :

 

Le choix des examens de dépistage dont l'efficacité préventive est clairement démontrée reste un sujet controversé. Les essais randomisés contrôlés sont la forme idéale pour évaluer l'efficacité d'un test de dépistage. Pour de nombreuses maladies, mêmes fréquentes, ce type d'étude n'est pas encore disponible, à l'instar du dépistage du cancer de la prostate ou le dépistage du cancer du poumon par scanner. 

 

F – Conclusion sur cette publication :


A l'aide de ces quelques exemples publiés dans des journaux réputés, les auteurs suisses ont essayé de montrer qu'il existe un certain nombre de pièges classiques dans l'interprétation des résultats d'une étude. Comme illustré par les exemples ci-dessus, certaines études pourraient suggérer à tort qu'il est urgent d'effectuer un changement radical d'une pratique clinique ou d'un choix d'un examen de dépistage, sans attendre des études complémentaires confirmant les résultats de ces dernières. De plus, le retrait de plusieurs nouveaux médicaments récemment mis sur le marché pousse à la prudence ; il est important de bien évaluer la qualité et la validité des données avant d'utiliser de nouveaux traitements en pratique clinique.


Idéalement, les nouveaux traitements devraient avoir prouvé leur impact sur les événements cliniques avant leur utilisation à large échelle. Avant d'effectuer des changements majeurs dans leur pratique, les médecins devraient rester vigilants et avoir un esprit critique face à certaines recommandations d'experts ou de sociétés qui se modifient parfois rapidement, sans attendre les résultats d'études randomisées ou d'études de confirmation.

 

 G – Rappel des règles d’une bonne lecture critique :

 

Des organismes de Formation Continue conventionnelle et agréée ont déjà eu l’occasion d’organiser des séminaires sur ce sujet important de la lecture critique d’articles scientifiques, notamment sur une grille, parfois plus connue sous le nom de grille du Pr. CAULLIN


La grille CONSORT (Consolidated Standards of Reporting Trials) a pour but d’aider les auteurs (et donc les lecteurs) d’un article à s’assurer qu’ils ont donnés suffisamment d’informations dérivées du schéma expérimental, le déroulement et l’analyse des résultats d’un essai, afin que les lecteurs puissent juger de la qualité de l’essai et à la généralisation des résultats. La grille contient 21 items/éléments.


Points importants

* But de l’essai : il doit être défini, précis
* Critères de sélection : doivent être adaptés, représentatifs
* Critères d’évaluation : unique, pertinent, valide ou intermédiaire
* Schéma expérimental : contrôle, aveugle.
* Traitements à l’étude : bien définis, versus placebo…
* Nombre de sujets nécessaires : qualité de l’échantillon
* Qualité : randomisation, suivi.
* Résultats : données de tous les patients au bon moment, suivi complet, comparabilité des groupes.
* Différence significative observée : portant sur critère principal, en intention de traiter, significative, précision.
* Pertinence clinique de la différence (NST)
* Extrapolation des résultats : attention de ne pas extrapoler les résultat à l’ensemble de la population.

 

H – NIVEAUX DE PREUVES :


Pour conclure


– Trois forces (grades) de recommandations ont été adoptées par l’AFSSAPS / HAS.

• Une recommandation de grade A fondée sur une preuve scientifique établie à partir d’études de haut niveau de preuve.
• Une recommandation de grade B fondée sur une présomption scientifique fournie par des études de niveau intermédiaire.
• Une recommandation de grade C établie sur un faible niveau de preuve scientifique.

– L’ANAES (Agence nationale d’accréditation et d’évaluation en santé) désormais HAS (Haute autorité de Santé) utilise la classification générale suivante du niveau de preuve des études cliniques :
– Un fort niveau de preuve correspond à une étude adaptée à la question posée, effectuée sans biais majeur, dont l’analyse est adaptée aux objectifs, et de puissance suffisante.
– Une méta-analyse est une synthèse systématique et quantifiée de tous les essais comparables conduits pour répondre à la même question.
– Un niveau intermédiaire correspond à une étude adaptée à la question posée mais présentant une puissance insuffisante et/ou des anomalies mineures.
– Un faible niveau de preuve peut être attribué aux autres types d’études.

 

Dernière mise à jour : ( 13-02-2010 )
 
Suivant >