Phenotypic prediction of missense variants via deep contrastive learning
Outil / méthode
N/A (5,1 millions de variants missense couverts)
PheMART : contrastive learning profond intégrant modèles de langage protéiques (PLM), interactions protéine-protéine, domaines protéiques, graphes de connaissances médicales et données EHR → projection conjointe variants + phénotypes dans un espace métrique → associations variant-phénotype pour 4 179 phénotypes HPO
Résumé
PheMART est un modèle de contrastive learning profond qui prédit les conséquences phénotypiques des variants missense en associant chaque variant à un spectre de phénotypes HPO. Il intègre des modèles de langage protéiques (PLM), des données d'interactions protéine-protéine, et des données de dossiers électroniques de santé (EHR). En projetant conjointement variants et phénotypes dans un espace métrique partagé, PheMART surpasse AlphaMissense, CADD et REVEL sur les benchmarks de pathogénicité phénotype-spécifique (4 179 phénotypes). Une base de données de prédictions pour 5,1 millions de variants pathogènes est disponible en open-source (GitHub celehs/PheMART).
Synthèse rédigée par Geno'X. Pour l'abstract original complet, consulter la publication source.
Analyse
PheMART franchit le pas de la prédiction binaire patho/bénin vers une prédiction phénotype-spécifique — révolutionnaire pour l'interprétation des VUS en contexte clinique précis. L'intégration des EHR est particulièrement innovante pour adapter la prédiction au profil clinique du patient. La base de 5,1 M variants est directement intégrable dans les pipelines d'annotation tertiaire.
Pourquoi ce score ?
Nature Biomed Eng (top journal) +3 ; phénotype-spécifique (au-delà de la prédiction binaire) +2 ; 5,1 M variants + 4 179 phénotypes +2 ; intégration EHR innovante +1 ; open-source +1
Mots-clés
Chaque mercredi · Sélection commentée · Gratuit · Désabonnement en 1 clic