Analyses de biologie médicale : spécifications et normes d’acceptabilité à l’usage de la validation de techniques


Annales de Biologie Clinique. Volume 57, Numéro 6, 685-95, Novembre - Décembre 1999, Articles originaux


Résumé   Summary  

Auteur(s) : A. Vassault, D. Grafmeyer, J. de Graeve, R. Cohen, A. Beaudonnet, J. Bienvenu, Hôpital Necker-Enfants malades, 149, rue de Sèvres, 75743 Paris cedex 15.

Résumé : La définition de critères de qualité destinés à valider une technique de dosage dans le domaine de la biologie clinique a fait l’objet du travail d’un groupe d’experts. Sur la base des données expérimentales provenant de l’application du protocole de validation de techniques de la SFBC et de l’exploitation des résultats de différents programmes de contrôle de qualité intra et interlaboratoires, des limites acceptables sont proposées pour une liste étendue d’analytes (n = 116). La gamme des analytes concernés a été classée en différentes rubriques incluant respectivement la biochimie générale (électrolytes, substrats et métabolites plasmatiques et urinaires), les enzymes, les protéines, les hormones, les marqueurs tumoraux, les gaz du sang, les médicaments et toxiques. Ces limites sont destinées à juger de la qualité d’une technique de dosage et à la valider en fonction de sa reproductibilité et de sa justesse. Pour chaque analyte, sont rapportés le domaine de mesure, les valeurs usuelles applicables à titre indicatif, les trois niveaux de concentration des préparations de contrôle à utiliser pour l’évaluation ainsi que l’intervalle des valeurs dans lequel elles peuvent être choisies et les limites de répétabilité et de reproductibilité, exprimées en termes de CV %. L’erreur systématique (justesse) ainsi que l’erreur d’exactitude maximales tolérables sont également fournies et s’appliquent à la fois aux résultats obtenus avec les préparations de contrôle et avec les spécimens biologiques provenant de patients, comparés à ceux d’une technique choisie comme référence. Des critères de choix de ces derniers spécimens sont également proposés dans le cadre de ce travail. Ces données sont utilisables essentiellement dans le cadre de l’application du protocole de validation de techniques de la SFBC et permettront de mettre à la disposition des biologistes et des organismes compétents, des critères objectifs de qualité destinés au choix et à la validation des dispositifs utilisés en biologie clinique.

Mots-clés : Limites acceptables - Spécifications - Validation - Evaluation - Qualité.

Illustrations

ARTICLE

La qualité des analyses de biologie médicale dépend de différents facteurs parmi lesquels le choix de la technique et sa validation jouent un rôle très important. Il appartient donc au biologiste de bien sélectionner ses outils et de justifier objectivement ses décisions comme le rappelle le Guide de bonne exécution des analyses de biologie médicale [1].

Ce souci ne peut être complètement satisfait en l'absence de référentiel. Comment et sur quels critères décider que la technique ou le système analytique utilisés sont satisfaisants et peuvent être validés ?

Les résultats fournis doivent être suffisamment fiables pour ne pas entraîner d'erreur d'interprétation dans le cadre du diagnostic, du pronostic, de la surveillance, de la prévention, du dépistage et de l'épidémiologie des maladies.

Objectifs

Le respect des règles d'assurance qualité des laboratoires oblige à procéder à la validation des techniques en préalable à leur utilisation et à le justifier. Il s'agit d'un pré-requis indispensable dans le cadre de l'accréditation des laboratoires. Cette opération s'effectue en deux étapes : l'évaluation des performances de la technique suivie de leur validation pour vérifier leur conformité à des normes.

Ces exigences sont réglementaires, mais le référentiel permettant de définir les qualités souhaitables d'une technique d'analyse n'existe pas. Le Guide de bonne exécution des analyses de biologie médicale [1] indique (chapitre I.1) que « c'est au biologiste qu'incombe le choix de méthodes optimisées, utilisées dans un grand nombre de laboratoires et recommandées par les sociétés scientifiques nationales ou internationales de biologie ou, le cas échéant, validées par lui-même à condition qu'elles permettent, dans la mesure du possible, le transfert des résultats » et (chapitre III.1) que « des procédures opératoires doivent être techniquement validées afin d'assurer la qualité des résultats ».

La commission de validation de techniques de la SFBC avait proposé en 1986 un protocole de validation accompagné de normes d'acceptabilité [2] établies pour une vingtaine d'analytes. Ce protocole a été largement utilisé et a permis un dialogue fructueux entre les différents partenaires de la biologie médicale : biologistes entre eux, biologistes et industriels, biologistes et cliniciens, biologistes et partenaires administratifs. Il est apparu très vite que le nombre d'analytes décrits dans ce document était insuffisant. C'est pourquoi les initiateurs du premier projet ont souhaité rassembler un groupe de travail, sous l'égide de la SFBC, pour réactualiser et proposer des critères de validation dans un domaine plus étendu.

Le présent document permet la définition de normes d'acceptabilité (limites de reproductibilité, de justesse et d'exactitude) pour une centaine d'analytes et des niveaux de concentration pertinents choisis pour correspondre le plus souvent à des niveaux de décision médicale différents.

Définitions [3-6]

Chaque résultat de mesure est affecté d'une erreur totale (inexactitude) qu'il convient d'identifier en recherchant ses composantes, de qualifier et de quantifier. Les erreurs mises en évidence à partir des résultats d'une évaluation sont la résultante d'erreurs systématiques (erreur de justesse...) et d'erreurs aléatoires (imprécision) auxquelles s'ajoutent des erreurs de spécificité et des erreurs grossières.

La plupart des définitions sont issues des documents de l'Organisation internationale de normalisation auxquels le lecteur peut se référer (Afnor, Tour Europe, Paris-La Défense).

* Capabilité. La capabilité correspond à la mesure établissant le rapport entre la performance réelle d'un procédé et la performance demandée. Elle permet de mesurer la capacité d'un procédé à réaliser des pièces dans l'intervalle de tolérance fixé par le cahier des charges. Une capabilité s'exprime par un chiffre ; un procédé est capable si ce chiffre est supérieur à 1 ; en réalité le minimum de capabilité exigé aujourd'hui est de 1,33 (par ex. : relation et répétabilité entre reproductibilité).

* Critères d'acceptabilité. Ce sont les critères selon lesquels les performances d'une technique sont jugées satisfaisantes dans les conditions d'emploi définies par l'utilisateur. Ces critères s'appuient en particulier sur les concepts d'imprécision, d'erreur systématique et d'inexactitude (figure 1).

* Erreur systématique. C'est la différence entre la moyenne qui résulterait d'un nombre infini de mesurages du même mesurande, effectués dans des conditions de répétabilité et une valeur vraie du mesurande. L'erreur systématique est égale à l'erreur moins l'erreur aléatoire.

* Erreur de justesse. Il s'agit de l'erreur systématique d'indication d'un instrument de mesure. Elle est normalement estimée en prenant la moyenne de l'erreur d'indication sur un nombre approprié d'observations répétées. Elle est aussi appelée biais.

* Exactitude de mesure. Elle correspond à l'étroitesse de l'accord entre le résultat d'un mesurage et une valeur vraie du mesurande.

* Facteur d'élargissement. C'est le facteur numérique utilisé comme multiplicateur de l'incertitude-type composée pour obtenir l'incertitude élargie (1,96 pour un intervalle de confiance de 5 % si le nombre de mesures est supérieur à 30).

* Incertitude type. Elle correspond à l'incertitude du résultat d'un mesurage exprimée sous la forme d'un écart-type.

* Incertitude élargie. Parfois appelée incertitude globale, c'est la grandeur définissant un intervalle, autour du résultat d'un mesurage, dont on puisse s'attendre à ce qu'il comprenne une fraction élevée de la distribution des valeurs qui pourraient être attribuées raisonnablement au mesurande. La fraction peut être considérée comme la probabilité ou le niveau de confiance de l'intervalle (généralement 95 %).

* Incertitude-type composée. C'est l'incertitude type du résultat d'un mesurage, lorsque ce résultat est obtenu à partir des valeurs d'autres grandeurs, égale à la racine carrée d'une somme de termes, ces termes étant les variances ou covariances de ces autres grandeurs, pondérées selon la variation du résultat de mesure en fonction de celle de ces grandeurs.

* Mesurande. Il correspond à une grandeur particulière soumise à un mesurage.

* Mesurage. Ce terme définit l'ensemble des opérations ayant pour but de déterminer une valeur d'une grandeur.

* Répétabilité. Elle se définit comme l'étroitesse de l'accord entre les résultats des mesurages successifs du même mesurande, les mesurages étant effectués dans la totalité des mêmes conditions. Elle est estimée par les paramètres d'évaluation de la dispersion : ET (écart-type) et CV (coefficient de variation).

* Reproductibilité. Elle se définit comme l'étroitesse de l'accord entre le résultat des mesurages du même mesurande, les mesurages étant effectués en faisant varier les conditions de mesure. Elle est estimée par les paramètres d'évaluation de la dispersion : ET et CV.

Champ d'application

Les spécifications et normes d'acceptabilité définies sont liées à l'application du protocole de validation de technique de la SFBC [2]. Elles varient en fonction de chaque analyse. Elles sont rapportées pour les constituants sériques, plasmatiques, sanguins et urinaires parmi les plus fréquemment mesurés dans le domaine de la biochimie clinique et concernent les électrolytes, les enzymes, les lipides, les protéines, les substrats, les métabolites, les hormones, les marqueurs tumoraux, les gaz du sang et les médicaments.

Ces critères sont destinés aux biologistes dans leur pratique de validation des performances des techniques utilisées et aux organismes compétents qui effectuent des expertises lors de l'évaluation ou de la validation de nouveaux réactifs, techniques ou systèmes analytiques, mais aussi aux industriels dans les différentes phases du développement de nouveaux produits.

Les différentes approches de détermination des normes d'acceptabilité

La variabilité des résultats d'une analyse inclut les facteurs de variations :

- pré-analytiques dus, par exemple, à la technique de prélèvement, à la durée de stockage, aux conditions de prétraitement du spécimen, etc. ;

- analytiques engendrés par l'imprécision et le biais ;

- biologiques physiologiques (intra- et/ou inter-individuelles).

Les normes d'acceptabilité varient en fonction de l'analyse considérée et peuvent être exprimées en termes de limites d'erreur de reproductibilité, limites d'erreur de justesse et de limites d'erreur d'exactitude.

Différents critères de jugement ont été utilisés pour établir des spécifications en matière de performance analytique. Elles reposent sur différentes approches : l'intervalle des valeurs de référence (prise en compte de la variation biologique interindividuelle et de la variation analytique), les variations biologiques interindividuelles et intra-individuelles, l'opinion des cliniciens et l'état de l'art.

Intervalle de référence

Les qualités d'une technique de dosage doivent être telles qu'elles lui permettent de distinguer un résultat « normal » d'un résultat pathologique. Les techniques devront, de ce fait, présenter une précision d'autant plus grande que l'intervalle des valeurs de référence est étroit. Certains auteurs [7] estiment que les limites tolérables d'erreur (2 CV analytiques) en termes de pourcentage doivent être inférieures à :

1/4 intervalle de référence x 100

moyenne de l'intervalle de référence

Cette approche est simple - les valeurs de référence existent pour toutes les analyses - elle est donc toujours applicable. Cependant la valeur 1/4 est donnée de façon arbitraire et les valeurs données pour l'intervalle de référence dépendent de la population étudiée, de la technique statistique utilisée et des performances analytiques de la technique.

Variations biologiques intra-individuelles

De façon à mettre en évidence des variations anormales chez un même individu, ou par rapport à un groupe d'individus choisis comme référence, il faut disposer d'une technique dont la reproductibilité est inférieure à la variation biologique. Par exemple, certains auteurs ont proposé que l'imprécision analytique acceptable, exprimée en termes de coefficient de variation, soit inférieure à la moitié du coefficient de variation observé pour la variation biologique intra-individuelle [8-15]. C'est une approche dont le modèle est simple et en relation avec la physiopathologie, mais la fraction 1/2 est totalement arbitraire. Cette approche conduit très souvent à des spécifications plus strictes que celles qui peuvent être obtenues avec les techniques actuelles disponibles et, de ce fait, ne peut être considérée que comme un objectif à long terme. Elle peut également conduire à des exigences très larges par rapport aux possibilités des techniques actuelles dont la reproductibilité est très performante pour certains analytes pour lesquels il existe de très grandes variations intra-individuelles. Aussi, les partisans de ce type de détermination [8] proposent-ils de choisir les normes à partir des données de l'état de l'art dans les cas où les limites déterminées en fonction des variations intra-individuelles « trahissent l'état de l'art ». Ces auteurs proposent également que soient définies des spécifications pour l'erreur systématique acceptable en appliquant la formule :

ES = (check)(CV2 intra-individuel + CV2 inter-individuel)

Les normes proposées sur ce schéma diffèrent, pour un grand nombre d'analyses, des normes d'acceptabilité adoptées par les autorités responsables des programmes d'évaluation externe de la qualité dans les différents pays [6, 13].

Opinions des cliniciens

Les exigences des cliniciens varient en fonction de l'objectif clinique. L'estimation et l'interprétation formulée par le clinicien tient compte non seulement de la variation analytique, mais aussi de la variation biologique. Elles sont générées par des informations rapportées à des changements se produisant dans des situations cliniques bien définies. Ces changements ne sont pas seulement dus à des variations analytiques, mais résultent également des variations pré-analytiques. Les exigences des cliniciens varient avec leur spécialisation [17], leur cursus, leur expérience, leurs conditions d'exercice et, de plus, en fonction des performances des laboratoires avec lesquels ils travaillent habituellement. Elles sont donc variables et, de ce fait, très peu transférables.

État de l'art

L'état de l'art représente les performances analytiques obtenues, à un moment donné, dans un certain nombre de laboratoires. Il est, en général, établi à partir des résultats des programmes de contrôle de qualité intra et/ou interlaboratoires. Le niveau de performance atteint par un certain nombre de laboratoires parmi ceux qui fournissent les meilleurs résultats (20 à 50 % des laboratoires selon les auteurs) pourrait constituer un objectif à atteindre pour tous [16].

C'est une approche pragmatique et facile à définir à condition que les spécimens de contrôle utilisés se comportent comme des spécimens « biologiques ». Un exemple est donné dans le tableau 1 correspondant aux normes établies avec chacun des critères destinés à définir les normes d'acceptabilité pour le dosage du calcium.

Le groupe de travail a retenu globalement le critère de l'état de l'art pour établir les normes publiées en 1986. Ces normes ont été largement utilisées pendant plus de 10 ans pour les évaluations de réactifs ou d'appareils réalisées en France [2, 18, 19]. La même approche a été adoptée pour établir les normes proposées dans le présent document.

Stratégie adoptée pour définir les spécifications

1. Établissement d'une liste d'analyses pour lesquelles des données sont disponibles (tableau 2).

2. Choix des critères à retenir et définition des modes de calcul.

3. Recueil de données provenant des différentes expériences des membres du groupe responsable d'associations de contrôle de qualité : Asqualab (Paris), CTCB (Toulouse), Probioqual (Lyon).

4. Recueil des données provenant des expériences d'évaluation externe de la qualité effectuées sur le plan national.

5. Confrontation des données des différents membres du groupe et consensus.

6. Évaluation interne des valeurs définies et modifications.

7. Diffusion du projet.

8. Re-évaluation des limites.

Critères proposés

La liste des spécifications retenues pour les analyses définies est présentée dans le tableau 3. Elle correspond à une proposition de limites acceptables d'erreur de reproductibilité, d'exactitude et de justesse.

* Nom de l'analyse

* Unité. Le système international est privilégié. Les unités conventionnelles sont également utilisées lorsqu'elles sont les plus pratiquées.

* Domaine de mesure (en unité). Donné à titre indicatif, il correspond à l'étendue de la zone de linéarité des techniques habituellement utilisées.

* Valeurs usuelles (en unité). Données à titre indicatif, elles correspondent aux valeurs les plus souvent rencontrées avec les techniques les plus courantes chez les adultes ou à la zone thérapeutique dans le cas du dosage des médicaments.

* Niveaux de concentration ou d'activité (en unité). Ils sont choisis pour se situer à des niveaux de décision clinique d'une part, être représentatifs de l'étendue du domaine de mesure d'autre part. Ainsi, le plus souvent ils correspondent à trois niveaux distincts, le premier se situant à une concentration proche de la limite basse des valeurs usuelles (B), le second à une valeur proche de la limite haute des valeurs usuelles (M) et le troisième à la limite haute de linéarité de la technique (E). Ils sont destinés au choix des préparations de contrôle, à la définition des valeurs limites acceptables pour chacun des trois niveaux définis.

* Intervalle de variation (en pourcentage). Il correspond à l'intervalle de concentrations possibles pour le choix des spécimens de contrôle par rapport aux valeurs rapportées dans le paragraphe 5.

* Répétabilité (estimée par le CV exprimé en pourcentage). Le CV limite de répétabilité a été calculé à partir de la valeur du CV limite donnée pour l'évaluation de la reproductibilité, en appliquant la formule :

reproductibilité = 1,33 répétabilité

soit, répétabilité = reproductibilité/1,33

CV répétabilité = CV reproductibilité x 0,75

* Reproductibilité (estimée par le CV exprimé en pourcentage). Le CV limite pour chaque niveau de concentration est défini (état de l'art) à partir des CV obtenus par les 50 % de laboratoires les plus performants parmi les participants aux différents programmes de contrôle de qualité intra/interlaboratoire.

* Justesse (en pourcentage) = erreur systématique. Elle est calculée à partir de la formule :

erreur de justesse (en %) = (check)(erreur d'exactitude en %)2
- (CV % reproductibilité)2

* Inexactitude (en pourcentage). Elle est la résultante de l'erreur systématique et de l'erreur aléatoire : lors de son utilisation, il faut tenir compte du facteur d'élargissement, c'est-à-dire de multiplier par 2 la limite donnée dans letableau 3 (pour un risque de 5 %). Ainsi utilisée, elle permet de juger de la qualité des résultats obtenus par les participants à différents contrôles ponctuels effectués en France.

* Normes de suivi (NS) (en unité). Elles sont destinées à permettre la détection des spécimens déviants lors de la comparaison de techniques, c'est-à-dire des résultats qui présentent une erreur supérieure à l'erreur de reproductibilité, démontrant qu'il ne s'agit pas d'une erreur aléatoire. Elles sont calculées pour chaque niveau de concentration par la formule :

NS = (check)(3 ET reproductibilité technique testée)2 + (3 ET reproductibilité technique comparée)2

= 4,24 x ET (reproductibilité)

en supposant que CV1 = CV2 (CV du même ordre pour les deux techniques).

* Normes d'interprétation de la droite de régression [18, 19]. Elles correspondent, pour chaque niveau de concentration défini, aux erreurs systématiques maximales tolérables.

NI = (limite d'erreur de justesse systématique x 2 x niveau B, M, E).

Le terme x 2 correspond au facteur d'élargissement pour un risque de 5 %.

* Répartition des spécimens de patients en fonction de leur niveau de concentration [18, 19]. Pour le choix des spécimens de patients destinés à être mesurés par la technique testée et la technique de comparaison lors de la comparaison de techniques, il est important de respecter une répartition régulière en fonction de la concentration. Cette répartition est facilitée par la définition de quatre classes de concentration. Elle est donnée, à titre indicatif dans le tableau 4pour chacune des analyses sélectionnées.

CONCLUSION

Ce référentiel est destiné à ceux qui effectuent des évaluations de techniques pour juger de leur qualité et les valider en fonction de leur reproductibilité, et de leur justesse en comparant les résultats avec ceux d'une technique choisie comme référence. Pour chaque analyte et chacun des trois niveaux de concentration des préparations de contrôle à utiliser pour une évaluation, des spécifications de répétabilité, de reproductibilité, de justesse (erreur systématique) et d'exactitude sont définies en suivant un protocole commun.

Ces spécifications s'appliquent à la fois aux résultats obtenus avec les préparations de contrôle et avec les spécimens biologiques provenant de patients. Ces données sont utilisables essentiellement dans le cadre de l'application du protocole de validation de techniques de la SFBC et permettront de mettre à la disposition des biologistes et des organismes compétents des critères objectifs de qualité destinés au choix et à la validation des dispositifs utilisés en biologie clinique.

Ce processus de validation s'intègre dans une démarche d'évaluation globale de la qualité d'une technique d'analyse, de la définition de sensibilité et spécificité cliniques dans le cadre du diagnostic, de la prévention, de la surveillance, du pronostic, de la prévention et de l'épidémiologie des maladies. Ces normes peuvent être utilisées dans les laboratoires comme critères d'évaluation des résultats du contrôle de la qualité des analyses (interne et externe).

Ce référentiel est un outil qui doit évoluer et constitue un élément de dialogue propice au développement du partenariat entre biologistes et cliniciens, biologistes et industriels. À titre d'exemple, la définition des critères de qualité pour le dosage de l'acide urique, comparé à ceux proposés en 1986 est présenté dans le tableau 5.

Les biologistes sont invités à donner leur avis, à susciter des discussions et enrichir de leur expérience les données présentées.

Article reçu le 19 juin 1999, accepté le 10 août 1999.

REFERENCES

1. Guide de bonne exécution des analyses de biologie médicale. Décret du 2 novembre 1994, Journal officiel, 4 décembre 1994.

2. Vassault A, Grafmeyer D, Naudin C, et al. et les membres de la commission Validation de techniques de la SFBC. Protocole de validation de techniques (Document B). Ann Biol Clin 1986 ; 44 : 686-745.

3. Vassault A, Dumont G, Labbé D. Définitions des critères de qualité d'une méthode d'analyse. Le Moniteur Internat 1992 ; 26, 20-33.

4. Organisation internationale de normalisation : ISO (1993). Vocabulaire international des termes fondamentaux et généraux de métrologie. Suisse.

5. Organisation internationale de normalisation : ISO (1995). Guide pour l'expression de l'incertitude de mesure.

6. Mollard JF, Naudin C, Dumont G, Vassault A, Azzedine MC, Bailly M et les membres de la commission Validation de techniques de la SFBC. Dictionnaire des termes à l'usage de la validation de techniques (glossaire). Ann Biol Clin 1986 ; 44 : 679-85.

7. Tonks DB. A study of the accuracy and precision of clinical chemistry determinations in 170 Canadians laboratories. Clin Chem 1963 ; 9 : 217-33.

8. Fraser CG, Hyltoft Petersen P, Ricos C, Haeckel R. Proposed quality specifications for the acceptability of analytical systems for clinical chemistry. Eur J Clin Chem Clin Biochem 1992 ; 30 : 311-7.

9. Williams GZ, Young DS, Stein MR, Cotlove E. Biological and analytic components of variation in long-term studies of serum constituents in normal subjects. I. Objectives, subject selection, laboratory procedures and estimation of analytic deviation. Clin Chem 1970 ; 16 : 1016-21.

10. Harris EK, Kanofsky P, Shakarji G, Cotlove E. Biological and analytic components of variation in long. Clin Chem 1970 ; 16 : 1022-7.

11. Cotlove EH, Harris EK, Williams GZ. Biological and analytic components of variation in long-term studies of serum constituents in normal subjects. III. Physiological and medical implications. Clin Chem 1970 ; 16 : 1028-32.

12. Harris EK. Statistical principles ubderlying analytic goal-setting in clinical chemistry. Am J Clin Pathol 1979 ; 72 : 374-82.

13. Stöckl D. European specifications for imprecision and inaccuracy compared with US CLIA proficiency-testing criteria. Clin Chem 1995 ; 41 : 120-1.

14. Barnett RN. Medical significance of laboratory results. Am J Clin Pathol 1968 ; 50 : 671-6.

15. Skendzel LP, Barnett RN, Platt R. Medically useful criteria for analytical performance of laboratory tests. Am J Clin Pathol 1985 ; 83 : 200-5.

16. Westgard JO, Bawa N, Ross JW, Lawson NS. Laboratory precision performance. State of the art versus operating specifications that assure the analytical quality required by clinical laboratory improvement amendments proficiency testing. Arch Pathol Lab Med 1996 ; 120 : 621-5.

17. Elion-Gerritzen WE. Analytical goals in clinical chemistry and medical decision. Am J Clin Pathol 1980 ; 73 : 183-95.

18. Eynard JC, Grafmeyer D. Protocole Validation de techniques. Exploitation des données par le logiciel Mac Valtec. Inf Sci Biol 1987 ; 13 : 216-7.

19. Vassault A, Baud M, Castagnier M, et al. Commission Validation de techniques de la SFBC et groupe de travail SFBC/Corata « Comparaison de Techniques ». Recommandations pour la comparaison de techniques. Ann Biol Clin 1992 ; 50 : 727-30.