Les Infirmières en Soins intensifs Évaluent de Manière Inadéquate Les Scores SAPS II des Patients Très Malades dans la Vie réelle

Résumé

Contexte. Des scores de gravité fiables en soins intensifs ont été obtenus par divers travailleurs de la santé, mais on ne sait rien de l’exactitude dans la vie réelle des scores de gravité enregistrés par des infirmières non formées. Méthode. Dans cet audit multicentrique rétrospectif, trois examinateurs ont réévalué indépendamment 120 notes du SAPS II. La corrélation et l’accord des scores/variables entre les évaluateurs et entre les infirmières et l’étalon-or des évaluateurs ont été évalués à l’échelle mondiale et pour les tertiles. Bland et Altman (étalon—or – infirmières) des scores de somme et de la régression de la différence ont été déterminés. Un modèle de régression logistique identifiant les facteurs de risque d’évaluations erronées a été calculé. Résultat. La corrélation pour les scores de somme parmi les évaluateurs était presque parfaite (ICC moyen = 0,985). Le score de somme SAPS II enregistré par une infirmière moyenne (±ET) était comparé à l’étalon-or (pour la différence) avec un ICC inférieur (0,81). Le test de Bland et d’Altman était + avec une régression significative entre la différence et l’étalon-or, indiquant globalement une surestimation (sous-estimation) de la valeur inférieure (supérieure; > 32 points) scores. L’accord le plus faible a été trouvé dans les tertiles SAPS II élevés pour l’hémodynamique (k = 0,45–0,51). Conclusion. Dans la vraie vie, les scores SAPS II enregistrés par une infirmière de patients très malades sont inexacts. La précision des scores n’était pas associée aux caractéristiques des infirmières.

1. Introduction

Le score de physiologie aiguë simplifié II (SAPS II) est probablement encore le score le plus couramment utilisé en Europe pour comparer la gravité d’un patient gravement malade et — par sa forme élargie — pour évaluer l’évolution clinique et les résultats. En outre, le SAPS II est devenu un élément clé pour définir le degré de remboursement des hôpitaux en Allemagne, et une procédure analogue est prévue en Suisse pour le début de l’année 2012. Compte tenu des diverses implications, l’exactitude de l’évaluation des scores SAPS II est de la plus haute importance.

Peu d’études ont fait état d’une fiabilité intercalaire adéquate du SAPS II et de petites différences dans les valeurs de certaines variables du SAPS II entre les observateurs ont déterminé des différences importantes dans les scores. Le système de notation de la physiologie aiguë et de l’Évaluation de la santé chronique II (APACHE II) a été étudié de manière plus approfondie, et des scores globaux fiables d’APACHE II ont été obtenus par divers travailleurs de la santé (abstracteurs hospitaliers formés, infirmières, médecins résidents et intensivistes). Il a été démontré que la fiabilité augmentait encore grâce à la formation ainsi qu’à une intervention multiforme et multidisciplinaire d’amélioration de la qualité. Cependant, ces résultats se réfèrent tous à des contextes d’étude bien définis avec des observateurs spécifiquement formés, et une seule étude a jusqu’à présent mesuré l’exactitude des scores de gravité enregistrés par les médecins dans la vie réelle.

Dans nos unités de soins intensifs (USI), le score SAPS II est évalué manuellement par des infirmières spécialisées en soins intensifs. Cette procédure est requise exactement 24 heures après l’admission ou notre système de dossier médical électronique empêche toute utilisation ultérieure pour le patient en question. L’évaluation par les infirmières a été choisie pour répondre à des carences médicales et organisationnelles (petites unités de soins intensifs avec des médecins débutants inexpérimentés en rotation à court terme et des tâches supplémentaires simultanées pendant les quarts de nuit, pas de spécialiste permanent des soins intensifs) et parce que les infirmières spécialisées sont présentes dans les unités de soins intensifs à toutes les heures et à tous les jours et sont habituées à gérer personnellement la plupart des variables SAPS II (récupération des données physiologiques et des tests de laboratoire avec leur enregistrement dans les dossiers des patients).

Le but de notre étude était (1) d’évaluer la fiabilité des scores SAPS II enregistrés par les infirmières dans la vie réelle, (2) de reconnaître les variables sujettes aux erreurs et (3) de concevoir une intervention d’amélioration appropriée.

2. Méthodes

2.1. Patients et cadre

Il s’agit d’une étude multicentrique rétrospective, menée au sein du Département de Médecine de Soins intensifs de l’Ente Ospedaliero Cantonale, Tessin, Suisse. Notre service regroupe les unités de soins intensifs mixtes de 4 hôpitaux d’enseignement régionaux (Bellinzone, Locarno, Lugano et Mendrisio), dispose d’un total de 34 lits et prend en charge environ 3 200 patients adultes par an. Parmi les 159 infirmières (avec divers degrés d’occupation), 70% sont inscrites en soins intensifs, tandis que les autres sont des infirmières autorisées ayant une formation spécifique continue. Le ratio infirmière / patient est généralement de 1: 1,5. Aucun programme de formation structuré concernant le SAPS II n’est offert aux infirmières.

La notation SAPS II est réalisée de manière semi-automatique : (1) acquisition manuelle des données: pour les informations diagnostiques (type d’admission, variables de la maladie sous-jacente), les infirmières ont un accès complet aux dossiers médicaux. Les données physiologiques (fréquence cardiaque, pression artérielle systolique, fréquence urinaire, température corporelle, état d’oxygénation et échelle de Coma de Glasgow) et les résultats de laboratoire (accès complet à toutes les variables du système de dossier médical électronique) sont documentés consécutivement par les infirmières sur les graphiques d’enquête quotidienne des patients, à partir desquels ils sont finalement récupérés pour l’enregistrement du score SAPS II. (2) Pour chaque variable, l’infirmière doit sélectionner l’option la plus réfléchie (parmi la valeur la plus basse et la plus élevée), qui est finalement entrée dans le système de dossier médical électronique. Consécutivement, ce système calcule automatiquement le score final. L’identification de l’infirmière-enregistreur est assurée au moyen d’un code personnel.

Les patients âgés de ≥ 18 ans, admis dans nos unités de soins intensifs entre janvier 2010 et octobre 2010, étaient éligibles. Compte tenu de la conception rétrospective et non conventionnelle de cette étude d’assurance qualité, aucun consentement éclairé n’a été requis par le Comité d’éthique cantonal.

2.2. Protocole de l’étude

Parmi 2386 patients éligibles, l’investigateur principal a sélectionné au hasard 30 patients par unité de soins intensifs présentant les principaux diagnostics de sortie suivants (nombre de patients): choc septique (5), accident vasculaire cérébral ischémique aigu (3), infarctus aigu du myocarde (3), arrêt cardiopulmonaire (3), insuffisance cardiaque aiguë (3), insuffisance respiratoire aiguë due à une pneumonie (3), maladie pulmonaire obstructive chronique (2), pancréatite aiguë (2), polytraumatisme (2), arythmies (2) et patients en séjour aux soins intensifs moins de 24 heures (2). Les dossiers des patients ont ensuite été obtenus par les employés des services locaux de contrôle de la qualité correspondants et colocalisés pour l’examen « in loco. »

Deux intensivistes expérimentés inscrits au conseil d’administration et une infirmière autorisée en soins intensifs spécialement formée pour l’utilisation du SAPS II ont créé un formulaire structuré d’examen qui était principalement basé sur les définitions originales des variables nécessaires au SAPS II. Les problèmes suivants ont été spécifiés avec plus de précision afin de refléter correctement le dysfonctionnement des organes: (1) en cas de traitement vasopresseur ininterrompu pour instabilité hémodynamique au cours du premier jour, les définitions ont été adaptées en fonction des éléments proposés dans le score SOFA, (2) l’arrêt cardiaque conduisant à l’admission en soins intensifs a été considéré comme égal à l’arrêt cardiaque en soins intensifs afin de réfléchir à l’augmentation de la mortalité; (3) l’utilisation des tests de laboratoire effectués immédiatement avant l’admission en soins intensifs a été autorisée, car les tests de suivi dans nos soins intensifs sont généralement exécutés par une approche prudente et sélective; (4) l’aphasie sensorielle et motrice due à un AVC ischémique aigu chez un patient présentant une mentation autrement adéquate n’a pas été prise en compte pour le calcul de l’échelle de coma de Glasgow.

2.3. Collecte et évaluation des données

L’analyse a été effectuée par les trois chercheurs au moyen du modèle susmentionné. Le processus d’examen s’est déroulé en deux étapes. Au cours de la première étape, les enquêteurs ont examiné indépendamment les graphiques des 30 patients et évalué les scores SAPS II. Les résultats ont été évalués, les différences entre les jugements des examinateurs ont finalement été résolues par une discussion et un consensus final (étalon-or) a été atteint. La deuxième étape a servi à évaluer l’accord entre les scores SAPS II enregistrés par l’infirmière (extraits du système de dossiers médicaux électroniques par l’investigateur principal) et l’étalon-or.

Cette procédure a été répétée dans les quatre unités de soins intensifs pour un total de 120 patients. Pour chaque patient, les données suivantes ont été enregistrées: (1) Note de somme du SAPS II, (2) chaque élément du score du SAPS II, (3) différences dans les jugements des examinateurs et (4) différences entre le score du SAPS II enregistré par l’infirmière et l’étalon-or. Les variables suivantes ont été récupérées pour les infirmières qui ont obtenu la notation SAPS II : centre, sexe, certification et durée de l’expérience professionnelle spécifique.

2.4. Analyse statistique

Les variables sont exprimées en moyenne ± écart type (ET) sauf indication contraire. A a été considéré comme statistiquement significatif. Toutes les analyses ont été effectuées avec le logiciel statistique Stata, version 11.0 (Stata Corporation, College Station, TX, États-Unis) et Statview (SAS institute Inc., Cary, NC, États-Unis).

2.4.1. La validation de l’accord de l’étalon-or

entre les examinateurs a été évaluée par le coefficient de corrélation interclassique (ICC) de mesure moyenne (correction de Spearman-Brown) pour les variables continues (scores de somme) et avec des statistiques kappa pondérées (et un intervalle de confiance de 95%) pour l’analyse des différents éléments du SAPS II. Les Kappas ont été calculés uniquement pour les éléments dont plus de 20 % des valeurs différaient de la valeur de référence. L’accord moyen entre les évaluateurs pour les notes de somme et pour les éléments a été évalué en calculant leur pourcentage moyen de classifications identiques parmi une paire d’évaluateurs. L’accord parfait a été défini comme une catégorisation identique des scores de somme et des éléments. Les différences entre les examinateurs ont été analysées selon le tertile SAPS II (faible, moyen et élevé) et selon leur mécanisme.

2.4.2. La comparaison des scores SAPS II évalués par l’infirmière et des différences de l’Étalon-or

dans les scores de somme a été évaluée par un test t apparié. La différence moyenne (avec un IC à 95%) et la différence absolue moyenne (c’est-à-dire la moyenne de la valeur de la différence) entre les scores de somme des SAPS II (étalon-or moins infirmières) ont été calculés.

L’accord entre les infirmières et l’étalon-or a été évalué entre les examinateurs. L’accord a été défini comme une catégorisation identique des scores de somme et des éléments. Kappas et l’accord ont été analysés en fonction du tertile SAPS II (faible, moyen et élevé) et l’ICC des scores de somme a été analysé en fonction du tertile SAPS II et du centre. En ce qui concerne le score de somme SAPS II, une analyse Fade et Altman modifiée avec sur l’axe l’étalon-or et sur l’axe la différence entre les deux scores de somme (étalon-or moins la valeur nurse) a été effectuée, complétée par une analyse de régression entre l’étalon-or SAPS II et l’étalon-or SAPS II moins le score de somme de la valeur nurse. Un diagramme de dispersion entre la différence de mortalité prévue calculée avec le score de somme étalon-or SAPS II moins la mortalité prévue par le score de somme enregistré par l’infirmière SAPS II (sur l’axe) et le score de somme étalon-or SAPS II (sur l’axe) a été effectué. La différence entre les mortalités prévues (dérivant des sum-scores SAPS II: étalon-or moins les valeurs évaluées par l’infirmière) a été modélisée à l’aide de la formule identifiée dans l’analyse de régression décrite ci-dessus.

Une analyse univariée a été effectuée pour définir les facteurs de risque de survenue d’une erreur dans les scores des items ou de la somme, y compris les caractéristiques des centres et des infirmières (sexe, expérience professionnelle et certification). Les résultats sont présentés sous forme de rapports de cotes (OU; IC à 95%) afin d’estimer la taille de l’effet des facteurs de risque associés à une estimation erronée. Une régression logistique multivariée a été réalisée afin d’obtenir des estimations ajustées des SRO et d’identifier les facteurs associés indépendamment aux erreurs, y compris pour le modèle toujours les 3 variables infirmières et les 4 centres. L’analyse multivariée a été effectuée uniquement pour les éléments présentant suffisamment d’erreurs pour permettre l’analyse: en supposant que pour chacune des 6 variables prédictives considérées (centres et caractéristiques des infirmières), environ 5 à 10 événements devraient être disponibles, nous avions besoin d’un minimum de 30 et d’un maximum de 90 erreurs.

3. Résultats

3.1. Étalon-or Créé par les examinateurs

Un total de 120 scores SAPS II différents (1800 variables) ont été évalués et pour 171 cas de divergence (9% de toutes les variables), un étalon-or devait être défini par consensus. Le score SAPS II de l’étalon-or minimum-maximum (médian) dans l’ensemble, des tertiles SAPS II faibles, moyens et élevés était 6-111 (38), 6-31 (22), 32-47 (38), et 48-111 (70), respectivement. L’accord pour les scores de somme parmi les évaluateurs était presque parfait (ICC moyen = 0,985; corrélation significative; pour la différence significative > 0,05). Le tableau 1 montre la fiabilité des évaluateurs en ce qui concerne les variables individuelles évaluées; la précision était la plus élevée pour la température et la bilirubine (accord parfait = 1,0 et 0,99, resp.) et le plus bas pour la pression artérielle systolique (accord parfait = 0,75). Les erreurs dans l’évaluation des examinateurs (tableau 2) ont été les plus fréquemment observées dans le tertile SAPS II élevé (79 erreurs), suivi du tertile moyen (52) et du tertile faible (40). L’apparition d’erreurs était essentiellement due à une négligence (49% des cas), suivie d’un problème lié à la définition de la variable (22%), à un calcul incorrect (16%) et à d’autres (13%). Le tableau 2 présente les différences entre les jugements des examinateurs selon le type d’erreur.

Variable Kappaa (95% CI) Mean agreementb Perfect agreementc
Heart rate 0.84 (0.79–0.89) 0.88 0.83
Systolic blood pressure 0.76 (0.68–0.84) 0.83 0.75
Temperature NA 1.0
Oxygenation 0.84 (0.80–0.88) 0.91 0.87
Urinary output 0.76 (0.72–0.80) 0.90 0.86
Urea 0.94 (0.91–0.97) 0.97 0.95
Leucocytes NA 0.96
Potassium NA 0.88
Sodium NA 0.98
Bicarbonate 0.84 (0.81–0.87) 0.93 0.89
Bilirubin NA 0.99
Glasgow Coma Scale 0.74 (0.69–0.79) 0,88 0,82
Âge 0,94 (0,92–0,96) 0,95 0,93
Maladies chroniques NA 0,94
Type d’admission NA 0,94
Kappa pondéré aMean (intervalle de confiance à 95%) des 3 examinateurs.
Proportions bMean d’accord entre les 3 évaluateurs par rapport à l’étalon-or.
Pourcentage d’accord total entre les 3 évaluateurs par rapport à l’étalon-or.
NA: sans objet; aucune statistique Kappa fiable (≤20% des résultats diffèrent de la norme).
Tableau 1
Fiabilité entre les évaluateurs pour les variables uniques du score SAPS II.

Variables Cases Mechanism of error
Overall Low SAPS (6–31 points) Medium SAPS (32–47 points) High SAPS (48–111 points) Overall
Differences=171/Scores=120
, % of differences, % of scores , (%/%) (%,%) (%,%) (%,%) Definitiona () Calculationb () Negligencec () Othersd ()
Heart rate 21 (12/17.5) 8 (20/20) 6 (12/15) 7 (9/17.5) 5 0 14 2
Systolic blood pressure 30 (18/20) 9 (22.5/22.5) 13 (25/32.5) 8 (10/20) 9 0 19 2
Temperature 0 0 0 0 0 0 0 0
Oxygenation 16 (9/13) 2 (5/5) 4 (8/10) 10 (13/25) 1 8 3 4
Urinary output 17 (10/14) 4 (10/10) 7 (13.5/17.5) 6 (7.5/15) 1 12 2 2
Urea 6 (4/5) 1 (2.5/2.5) 3 (6/7.5) 2 (2.5/5) 0 0 5 1
Leucocytes 5 (3/4) 0 1 (2/2.5) 4 (5/10) 0 0 5 0
Potassium 14 (8/12) 2 (5/5) 4 (10) 8 (10/20) 0 0 11 3
Sodium 3 (2/2.5) 0 0 3 (4/7.5) 0 0 3 0
Bicarbonate 13 (8/11) 2 (5/5) 4(8/10) 7 (9/17.5) 1 0 8 4
Bilirubin 1 (0.5/1) 1 (2.5/2.5) 0 0 0 0 1 0
Glasgow Coma Scale 22 (13/18) 7 (17.5/17.5) 3 (6/7.5) 12 (15/30) 8 0 11 3
Age 9 (5/7.5) 2 (5/5) 3 (6/7.5) 4 (5/10) 0 8 1 0
Chronic diseases 7 (4/6) 1 (2.5/2.5) 2 (4/5) 4 (5/10) 5 0 2 0
Type of admission 7 (4/6) 1 (2.5/2.5) 2 (4/5) 4 (5/10) 7 0 0 0
(%)
Total of differences 171 (100) 40 (100) 52 (100) 79 (100) 37 (22) 28 (16) 85 (49) 21 (13)
Total of scores with differences 94 (78) 29 (72.5) 30 (75) 35 (87.5)
Un problème lié à la définition des variables et à son application (par exemple, maladies chroniques, type d’admission, hémodynamique, GCS dans l’avc aphasique).
Problème pathologique (par exemple, rapport d’oxygénation, âge, débit urinaire quotidien).
Examen cinsuffisant des cartes (par exemple, exclusion erronée des résultats de laboratoire).
Mécanisme dOther (par exemple, données disponibles insuffisantes dans le graphique).
Tableau 2
Différences entre les jugements des examinateurs pour les différents éléments selon le tertile SAPS II et le mécanisme d’erreur.
3.2. Précision des scores SAPS II enregistrés par une infirmière

La somme moyenne (±SD) des scores SAPS II enregistrés par une infirmière était de points par rapport aux points de l’étalon-or (). Environ 90% des sum-scores SAPS II (112/120) étaient erronés dans au moins une variable (87,5% (35/40) dans le bas, 97,5% (39/40) dans le moyen et 95% (38/40) dans les tertiles SAPS II élevés). Le tableau 3 montre la précision de l’évaluation des variables individuelles par rapport à l’étalon-or. Dans l’ensemble, il y avait une bonne entente dans les variables sodium, température, âge, maladies chroniques, leucocytes, potassium et bilirubine (0,83–0,97); l’accord le plus bas a été trouvé dans la fréquence cardiaque et la pression systolique (0,45–0,51). Les kappas calculés étaient les meilleurs pour l’âge et les plus bas pour la fréquence cardiaque et la pression systolique (0,32–0,37). Généralement, l’accord et le Kappas étaient les pires dans le tertile de SAPS II élevé.

Variable Kappaa (95% CI) Agreementb
Overall Low SAPS II (6–31 points) Medium SAPS II (32–47 points) High SAPS II (48–111 points) Overall Low SAPS II (6–31 points) Medium SAPS II (32–47 points) High SAPS II (48–111 points)
Heart rate 0.32 (0.16–0.48) 0.28 (0.12–0.44) 0.32 (0.15–0.49) 0.22 (0.08–0.36) 0.45 0.55 0.47 0.35
Systolic blood 0.37 (0.24–0.50) NA 0.22 (0.06–0.38) 0.20 (0.08–0.32) 0.51 0.63 0.50 0.40
pressure
Temperature NA NA NA NA 0.95 1.00 0.97 0.87
Oxygenation 0.66 (0.56–0.76) 0.33 (0.16–0.50) 0.72 (0.60–0.84) 0.54 (0.40–0.68) 0.71 0.87 0.70 0.55
Urinary output 0.77 (0.70–0.84) 0.73 (0.63–0.83) 0.80 (0.70–0.90) 0.73 (0.64–0.82) 0.58 0.52 0.67 0.55
Urea 0.71 (0.64–0.78) 0.70 (0.62–0.78) 0.71 (0.62–0.80) 0.71 (0.63–0.79) 0.67 0.57 0.75 0.67
Leucocytes NA NA NA 0.40 (0.29–0.51) 0.83 0.92 0.85 0.72
Potassium NA NA 0.39 (0.24–0.54) 0.32 (0.19–0.45) 0.83 0.95 0.82 0.72
Sodium NA NA NA NA 0.97 0.97 0.97 0.95
Bicarbonate 0.81 (0.76–0.86) 0.77 (0.70–0.84) 0.77 (0.69–0.85) 0.76 (0.65–0.87) 0.68 0.62 0.85 0.55
Bilirubin NA NA NA NA 0.83 0.75 0.87 0.85
Glasgow Coma Scale 0.80 (0.71–0.89) 0.48 (0.19–0.77) 0.68 (0.43–0.92) 0.89 (0.80–0.98) 0.78 0.85 0.77 0.72
Age 0.98 (0.97–0.99) 0.98 (0.96–1.00) 0.99 (0.97–1.00) 0.97 (0.94–1.00) 0.93 0.92 0.95 0.92
Chronic diseases NA NA NA NA 0.93 0.97 0.92 0.87
Type of admission NA NA NA NA 0.78 0.85 0.77 0.70
aMean weighted Kappa of the 120 nurse-registered SAPS II scores versus the gold standard.
bMean proportions of agreement of the nurses versus the gold standard.
NA: not applicable; aucune statistique Kappa fiable (≤20% des résultats diffèrent de la norme).
Tableau 3
Fiabilité des infirmières par rapport aux éléments de référence du SAPS II dans les tertiles globaux du SAPS II et du SAPS II.

Bien que les scores de somme de SAPS II aient été soulignés dans toute la gamme, il y avait des différences considérables entre les tertiles de SAPS II, en ce qui concerne le biais et la dispersion de biais de la différence (ET de la différence) et les différences minimales et maximales (tableau 4). Les différences (différences absolues) ont également changé en fonction du tertile SAPS II. Le tableau 5 montre l’origine de la surestimation et de la sous-estimation des tertiles de score de somme SAPS II bas et élevé. La figure 1 confirme une tendance générale à surestimer les scores faibles (≤ 32 points) et à sous-estimer les scores de somme plus élevés, en mettant en évidence une régression significative entre la différence et le score de somme SAPS II de l’étalon-or (régression de l’analyse Fade et Altman: = -10.183 + 0.317*; = 0.34, ). Le point de coupure entre la surestimation et la sous-estimation était de 32 points d’étalon-or SAPS II.

ICC SAPS II (GS—nurses) Absolute SAPS II (GS—nurses)
Mean SD Minimum Maximum Mean SD Minimum Maximum
Overall 0.81 3.8 13.5 −33 43 10.4 9.3 0 43
Low SAPS II ( 6–31) 0.60 −5.9 10.1 −33 9 8.4 8.0 0 33
Medium SAPS II (32–47) 0.54 3.3 9.1 −24 18 8.0 5.4 0 24
High SAPS II (48–111) 0.77 14.0 13.0 −9 43 15.0 11.7 0 43
Center A 0.81 1.2 12.3 −28 31 8.5 8.9 0 31
Center B 0.77 5.3 16.9 −28 43 14.4 9.9 3 43
Center C 0.76 2.6 15.5 −33 41 11.4 10.6 0 41
Center D 0.89 6.0 8.9 −13 31 8.1 7.0 0 31
ICC: coefficient de corrélation interclassique entre l’étalon-or et les infirmières.
SAPS II: différence dans les scores SAPS II entre l’étalon-or et les infirmières.
SD : écart type.
Tableau 4
Accord des scores de somme des SAPS II évalués par l’infirmière en fonction des tertiles SAPS II et du site de soins intensifs.

Variable Mean difference (gold standard − nurse value)
Overall Low SAPS II (6–31 points) Medium SAPS II (32–47 points) High SAPS II (48–111 points)
Heart rate 2.0 0.6 1.5 4
Systolic blood pressure 2.8 0.6 2 5.8
Temperature 0.1 0 −0.1 0.2
Oxygenation −0.2 −0.7 −0.3 0.45
Urinary output −1.3 −1.5 −0.9 −1.5
Urea −0.1 −2.6 1.2 1.2
Leucocytes 0.1 0.1 −0.2 0.4
Potassium 0.4 0.0 0.5 0.5
Sodium 0.0 0.0 0.0 0
Bicarbonate 0 −0.8 0.2 0.5
Bilirubin −0.6 −1 −0.5 −0.3
Glasgow Coma Scale 1.2 0.0 0.2 3.6
Age 0.0 0.0 −0.1 0
Chronic diseases −0.1 −0.2 0.3 −0.4
Type of admission −0.4 −0.4 −0.4 −0.4
sum scores SAPS II 3,8 -5,9 3,3 14,0
Tableau 5
Différences moyennes entre les scores des étalons d’or et des scores SAPS II évalués par l’infirmière concernant les valeurs des différents éléments composant le score SAPS II, globalement et par tertiles.
Figure 1

Régression linéaire entre la différence (valeur étalon-or-infirmière) du score-somme SAPS II et du score-somme SAPS II étalon-or. Les tertiles SAPS II sont illustrés.

Le taux de mortalité moyen prédit par l’infirmière était de % par rapport à % de l’étalon-or (). La différence moyenne entre la mortalité prévue par l’étalon-or et la mortalité prévue par les infirmières était de 6,28% (IC -32,9 à 45,5%, plage de -50,7 à 56,9%) et une différence absolue moyenne de 13.8% (IC de 0,0 à 30,6%, plage de 0 à 56,9%). Les figures 2(a) (diagramme de dispersion) et 2(b) (modélisation provisoire) illustrent la surestimation et la sous-estimation de la mortalité prévue en fonction des valeurs de score-somme du SAPS II (étalon d’or). Des différences considérables ont été constatées dans le biais et la dispersion du biais de la différence (SD de différence) et les différences minimales et maximales entre les différents centres (tableau 4).

(a)
(a)
(b)
(b)
(a)
(a) (b)
(b)
Figure 2
(a): Diagramme de dispersion avec la différence de mortalité prédite, (b): Modélisation de la différence de mortalité prédite Dans les deux figures, les tertiles SAPS II sont illustrés.

Le tableau 5 illustre les variables qui induisent la surestimation des scores SAPS inférieurs (oxygénation, débit urinaire, urée, bicarbonate et bilirubine) et la sous-estimation des scores SAPS II les plus élevés (fréquence cardiaque, pression artérielle systolique, urée et échelle de coma de Glasgow).

Au total, 78 infirmières ont enregistré les 120 scores SAPS II. Aucune association n’a été trouvée par analyse univariée et multivariée entre les caractéristiques des infirmières (expérience, certification, sexe et centres) et la notation erronée du score total du SAPS II ou de ses variables.

4. Discussion

Notre étude montre que les scores de somme SAPS II enregistrés par une infirmière sont assez inexacts. Dans l’ensemble, il y a eu une nette surestimation des scores SAPS II inférieurs et une sous-estimation des scores SAPS II supérieurs avec une tendance à tendance centrale (tendance unique). Des erreurs absolues plus importantes ont été effectuées dans les scores les plus élevés. L’hémodynamique globale était la variable la plus sujette aux erreurs et l’évaluation erronée était indépendante des caractéristiques des infirmières. Cependant, dans les tertiles SAPS II supérieurs, l’hémodynamique ainsi que l’urée et l’échelle du coma de Glasgow ont contribué à la sous-estimation, tandis que dans les tertiles SAPS II inférieurs, les erreurs dans l’état d’oxygénation, le débit urinaire, l’urée, les bicarbonates et la concentration en bilirubine ont contribué à la surestimation des scores de somme du SAPS II.

Étonnamment, l’accord des variables hémodynamiques – bien qu’apparemment simple – était insuffisant. Nos résultats sont comparables à ceux de Strand et al. , qui a signalé des difficultés similaires pour les jeunes médecins norvégiens dans l’évaluation de la fréquence cardiaque et de la pression artérielle systolique. Une explication mathématique de ce problème pourrait être que cinq (quatre) choix sont donnés pour la notation de la pression artérielle systolique (fréquence cardiaque) alors que la notation des autres variables physiologiques est généralement moins exigeante. Une autre explication peut être qu’il ne s’agit pas seulement de choisir la quantité d’écart (par rapport à la valeur normale) mais aussi la direction de la pondération la plus élevée (valeur la plus basse par rapport à la valeur la plus élevée).

Avec cet audit rétrospectif, nous n’avons pas été en mesure de révéler par quels mécanismes les infirmières ont créé des erreurs dans l’évaluation des scores du SAPS II. Cependant, nous avons pu montrer que l’expérience professionnelle et la certification n’avaient aucune incidence sur la survenue d’erreurs, et qu’il n’y avait pas non plus d’effet de centre général. L’analyse des sources de problèmes les plus fréquentes des trois examinateurs dans la définition de l’étalon-or pourrait donner un aperçu (tableau 2). En ce sens, la négligence était la source la plus fréquente d’évaluation erronée. Les problèmes liés à la définition des variables et au calcul incorrect des données (taux d’oxygénation, débit urinaire, âge) ainsi que le manque d’intérêt pour la notation doivent également être pris en compte. Il est important de souligner que nos scores SAPS II enregistrés par une infirmière sont basés sur l’acquisition manuelle de données. Les infirmières se fient aux données physiologiques enregistrées précédemment dans les tableaux des enquêtes quotidiennes auprès des patients et aux données administratives des tableaux des médecins. Ils insèrent finalement manuellement les variables dans le système de dossier médical électronique qui calcule automatiquement le score final. Le SAPS II étant un score de gravité concernant les premières 24 heures après l’admission aux soins intensifs, plusieurs soignants sont impliqués dans la collecte des différentes variables et chacun d’eux est sujet à des erreurs.

Les évaluateurs et les infirmières ont globalement sous-estimé les scores du SAPS II. Plus intéressant encore, nous avons trouvé une relation négative entre la taille des scores de somme enregistrés par l’infirmière et leur fiabilité, par rapport à l’étalon-or: plus les scores de somme sont élevés, plus ils sont sous-estimés. Exclusion des données critiques pré-USI (p. ex., arrêt cardiaque) peuvent affecter sérieusement les scores SAPS II et la mortalité prévue, autant que certaines données pathologiques ne sont pas prises en compte (11 points pour la fréquence cardiaque; 13 et 26 points pour la pression artérielle systolique et l’échelle de coma de Glasgow, resp.). Il pourrait en être de même, bien que dans une moindre mesure, pour l’omission erronée de résultats de laboratoire pathologiques, obtenus immédiatement avant l’admission aux soins intensifs (par exemple, dans la salle d’urgence, dans le service).

L’analyse de la corrélation et des accords entre les scores SAPS II évalués par l’infirmière et les étalons d’or, calculés sans tenir compte des données pré-USI, n’a montré que des résultats légèrement meilleurs (non représentés). L’impact des différences de notation (surestimation et sous-estimation) peut être important. En effet, nous pouvons identifier au moins 3 domaines de préoccupation. Premièrement, la stratification ou les ajustements à des fins de recherche sur la base des scores SAPS II évalués régulièrement (par l’infirmière) (en particulier dans les études multicentriques avec le soutien de différents systèmes) pourraient être trompeurs. Deuxièmement, l’analyse comparative entre les unités de soins intensifs peut être fortement biaisée. Enfin, les remboursements basés principalement ou secondairement sur le score du SAPS II comme en Allemagne ou en Suisse peuvent sérieusement pâtir de l’inexactitude de l’évaluation du SAPS, en particulier de la sous-estimation des scores plus élevés du SAPS II. En effet, dans une étude européenne, 10% (12%) des répondants ont déclaré que leur remboursement reposait principalement (secondairement) sur les scores de gravité.

Il a été démontré que la récupération automatique des variables peut augmenter les scores grâce à un taux d’échantillonnage plus élevé. Une telle approche réduirait probablement également le nombre de composantes manquantes qui, autrement, pourraient conduire à une sous-estimation des scores de la somme et de la mortalité prévue. Une transmission correcte des données pertinentes, si elle est correctement validée, pourrait également accroître la fiabilité. En ce sens, nous adaptons notre système de dossier médical électronique afin de pré-remplir automatiquement les scores SAPS II avec les résultats de laboratoire et l’âge. De plus, grâce à un système de gestion des données, la réalisation des variables hémodynamiques et respiratoires pourrait être automatisée. Ce système, cependant, est également sujet à différents problèmes. Premièrement, l’importation de données incohérentes peut se produire si les informations ne sont pas vérifiées manuellement. Deuxièmement, comme les scores de gravité ont été élaborés et étalonnés avec des données acquises manuellement, l’extraction assistée par ordinateur des données peut modifier la prédiction des résultats. L’acquisition précise et la transmission correcte des données connexes sont absolument essentielles, mais sans une connaissance adéquate des définitions et de leur application exacte, les scores SAPS II ne deviendront guère très fiables. Ainsi, un programme de formation structuré sera mis en place dans notre département afin d’accroître la compréhension et la motivation. De plus, l’introduction d’un programme interactif demandant en détail la valeur la plus élevée et la plus basse d’une variable (nécessitant peut-être également les données exactes) peut optimiser l’évaluation SAPS II en réduisant certaines des erreurs appelées « négligence. »

Notre étude présente certaines forces et / ou limites: (1) la notation est une tâche difficile, même pour des examinateurs spécifiquement formés. Par conséquent, on pourrait remettre en question notre étalon-or. En fait, nous pensons que ce point représente une force. La façon dont nous avons effectué cet audit (voir la section 2) a en fait exclu tout biais concernant les antécédents professionnels, la formation spécifique pour le SAPS II et la pratique de l’évaluation. En fin de compte, il y avait un excellent accord entre les évaluateurs concernant les scores de la somme. L’analyse des différents sous-scores a révélé un accord presque parfait pour la plupart des variables et un accord encore substantiel pour la pression artérielle systolique, le débit urinaire et l’échelle du coma de Glasgow. De plus, la conception multicentrique de cette étude permet une certaine généralisation des résultats. (2) L’introduction de définitions adaptées concernant l’instabilité hémodynamique (voir section 2) pourrait avoir influencé nos résultats. Cependant, une analyse exacte de la pression artérielle systolique variable a révélé que seulement dans environ 30% des cas, il y avait un soulignement dû à la non-prise en compte du traitement vasopresseur continu. De plus, nous pensons que la définition de cette variable devrait être modifiée. Afin de détecter un risque accru de mortalité, il ne semble pas adéquat de noter les patients présentant une pression artérielle systolique normale sous d’énormes quantités de vasopresseurs comme « réguliers. »(3) On pourrait également critiquer notre situation réelle, où les infirmières évaluent les scores du SAPS II. Cependant, il n’y a pas de données sans équivoque dans la littérature capables de confondre notre méthode. Dans l’étude unique comparant directement les résidents avec les infirmières, il n’y avait pas de différence significative entre les scores moyens d’APACHE II ou les taux de mortalité moyens prévus. D’un autre côté, l’exactitude de la notation chez les médecins dépendrait plutôt de l’instruction que de l’expérience professionnelle. (4) Enfin, la généralisation de nos résultats pourrait être encore plus limitée dans la mesure où ils se réfèrent au SAPS II, alors que le score de gravité des soins intensifs le plus fréquemment utilisé dans le monde est le score APACHE (Acute Physiology and Chronic Health Evaluation) II. Cependant, nous tenons à souligner que les deux scores de gravité divergent principalement dans l’attribution de points pour différents degrés de dysfonctionnement des organes et beaucoup moins dans le choix des éléments demandés (par exemple, l’âge et la plupart des variables physiologiques sont superposables).

En conclusion, notre étude suggère que les infirmières en soins intensifs non formées évaluent de manière inadéquate les scores SAPS II dans la vie réelle et que la fiabilité n’a pas été influencée par les différents antécédents, niveaux de formation et sexe. Les scores de somme SAPS II plus élevés sont sous-estimés et les scores inférieurs surestimés. Ces différences peuvent avoir de graves répercussions sur l’analyse comparative, les résultats de la recherche et le remboursement des soins intensifs. Une intervention d’amélioration multiforme, basée sur la récupération automatique (par ordinateur) de la plupart des données physiologiques et la mise en œuvre d’un programme d’entraînement structuré, est justifiée. La question de savoir si ces observations peuvent s’appliquer également à d’autres scores de gravité ou à d’autres professionnels de la santé reste une question intéressante à laquelle il faut répondre.

Divulgation

Ce travail a été réalisé dans les quatre hôpitaux universitaires régionaux du sud de la Suisse : Bellinzone, Locarno, Lugano et Mendrisio.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.