DeepECG-SSL : Un modèle fondationnel d’ ECG exploitant l’apprentissage auto-supervisé pour améliorer la prédiction des maladies cardiovasculaires
Date de publication
Autrices et auteurs
Contributrices et contributeurs
Direction de recherche
Publié dans
Date de la Conférence
Lieu de la Conférence
Éditeur
Cycle d'études
Programme
Affiliation
Mots-clés
- Électrocardiogramme
- Interprétation des ECGs
- Deep learning
- Supervised learning
- Contrastive self supervised learning
- Fondation Model
- Fairness
- Privacy
- Apprentissage profond
- Apprentissage supervisé
- Apprentissage auto-supervisé contrastif
- Modèle fondationnel
- Équité
- Confidentialité
- Electrocardiogram
- ECG Interpretation
Organisme subventionnaire
Résumé
Chaque année, des millions d’ECGs sont effectués sur différents patients afin de diagnostiquer diverses pathologies cardiaques. Dans cette étude, nous proposons et évaluons un modèle fondationnel pour l’analyse des ECGs, DeepECG-SSL pré-entraîné selon une approche d’apprentissage auto-supervisée contrastive. Ce modèle a été adapté à plusieurs tâches notamment la détection de 77 diagnostics cardiaques regroupés en six catégories, et la prédiction de six biomarqueurs numériques incluant la régression et la classification de la fraction d’éjection du ventricule gauche (LVEF), la prédiction de la fibrillation auriculaire jusqu’à cinq ans avant son diagnostic, la détection et le typage du syndrome du QT long. DeepECG-SSL a été comparé à un autre modèle fondationnel, DeepECG-SL, suivant les critères de performances sur dix jeux de données de validation externe, d’équité, de confidentialité et d’efficacité énergétique. Pour l’interprétation des ECGs, les deux modèles obtiennent des performances de validation externe sur les centres hospitaliers similaires avec un AUROC de 0.9827 (95%CI 0.9826, 0.9827) pour DeepECG-SL contre un AUROC de 0.9826 (95%CI 0.9827, 0.9827) pour DeepECG-SSL. Pour les biomarqueurs numériques, comme la prédiction LVEF ≤ 40, DeepECG-SSL atteint un AUROC de 0.8925 (95%CI 0.8915, 0.8935) contre un AUROC de 0.8647 (95%CI, 0.8636, 0.8658) pour DeepECG-SL en validation externe sur les centres hospitaliers. Les deux modèles sont équitables, et DeepECG-SL nécessite moins de ressources énergétiques.
Every year, millions of ECGs are performed on different patients to diagnose various cardiac pathologies. In this study, we propose and evaluate a foundation model for ECG analysis, DeepECG-SSL, pre-trained using a contrastive self-supervised learning approach. This model is adapted to several tasks including the detection of 77 cardiac diagnoses grouped into six categories, and the prediction of six digital biomarkers including the regression and classification of left ventricular ejection fraction (LVEF), the prediction of atrial fibrillation up to five years before its diagnosis, and the detection and typing of long QT syndrome. DeepECG-SSL was compared to another foundation model, DeepECG-SL, according to criteria of performance on ten external validation datasets, fairness, privacy and energy efficiency. For ECG interpretation, both models achieved similar external validation performance on hospital centers, with an AUROC of 0.9827 (95%CI 0.9826, 0.9827) for DeepECG-SL versus an AUROC of 0.9826 (95%CI 0.9827, 0.9827) for DeepECG-SSL. For digital biomarkers, such as LVEF ≤ 40 classification, DeepECG-SSL achieves an AUROC of 0.8925(95%CI 0.8915, 0.8935) versus an AUROC of 0.8647 (95%CI, 0.8636, 0.8658) for DeepECG-SL in external validation on hospital centers. Both models are fair, and DeepECG-SL requires fewer energy resources.