Interprétation des résultats des modèles de survie¶
Nous avons comparé plusieurs modèles de survie selon plusieurs métriques calculées sur le jeu de test :
Le C-index : permettant d’évaluer la capacité de discrimination globale du modèle.
Le td-AUC moyen dépendant du temps permettant d’évaluer la discrimination à différents horizons temporels.
Le score de Brier intégré permettant d’évaluer la qualité de calibration des probabilités de survie.
Le score de Brier à l’horizon correspondant à la durée de survie médiane : permettant d’évaluer la calibration des probabilités de survie à un instant précis.
Résultats obtenus¶
| Modèle | C-index | Mean td-AUC | IBS | Brier at t*=1191 |
|---|---|---|---|---|
| Survival SVM | 0.73 | 0.79 | - | - |
| XGBoost AFT | 0.72 | 0.79 | - | - |
| Gradient Boosting Survival | 0.72 | 0.78 | 0.18 | 0.18 |
| Random Survival Forest | 0.72 | 0.79 | 0.17 | 0.18 |
| Cox (ElasticNet) | 0.70 | 0.76 | 0.18 | 0.20 |
Analyse globale¶
Discrimination (Capacité à classer les risques) : Les modèles non-linéaires dominent. Le Survival SVM offre la meilleure performance discriminante (C-index : 0.73, td-AUC : 0.79), suggérant que la relation entre les signatures et le risque est complexe et non linéaire.
Calibration (Justesse des probabilités) : Parmi les modèles évalués sur ce critère, le Gradient Boosting et la Random Forest offrent la meilleure calibration (IBS : 0.18), surpassant le modèle de Cox (IBS : 0.20). Cela signifie que leurs probabilités de survie prédites sont plus proches de la réalité observée.
Performance du Cox : Bien que robuste et interprétable, le Cox pénalisé arrive légèrement en retrait sur toutes les métriques. L’hypothèse de risques proportionnels ou la linéarité stricte semble limiter sa capacité prédictive sur ces données SigBERT.
Résumé des performances¶
Meilleur classeur : Survival SVM. Idéal pour ordonner les patients du plus au moins risqué.
Meilleur estimateur de probabilité : Gradient Boosting Survival. Il offre le meilleur compromis entre une bonne discrimination (0.72) et une excellente calibration (0.18).
Modèle de référence : Le Cox reste cohérent (C-index > 0.70) mais ne capture pas toute la complexité du signal.
Conclusion¶
Si l’objectif prioritaire est le ranking des patients (ex: priorisation clinique), le Survival SVM est le choix optimal. Cependant, si l’objectif est une estimation précise du risque individuel (ex: médecine de précision, prédiction conforme), le Gradient Boosting Survival est préférable car il garantit des probabilités mieux calibrées tout en maintenant un pouvoir discriminant très proche du SVM.