Decoding sequence determinants of gene expression in diverse cellular and disease states.
Outil / méthode
Prédiction d'expression spécifique du type cellulaire à partir de la séquence ADN
Résumé
Decima est un modèle de deep learning entraîné sur plus de 22 millions de cellules single-cell et single-nucleus RNA-seq pour prédire l'expression d'un gène en fonction du type cellulaire et de la condition pathologique à partir de sa séquence ADN environnante. Contrairement aux modèles antérieurs entraînés sur des données bulk de tissus sains, Decima capture la régulation spécifique des types cellulaires et des états de maladie. L'outil démontre sa capacité à interpréter les variants non-codants avec une résolution inédite au niveau du type cellulaire, ouvrant la voie à une meilleure annotation des variants régulateurs identifiés en WGS clinique.
Synthèse rédigée par Geno'X. Pour l'abstract original complet, consulter la publication source.
Analyse
L'interprétation des variants non-codants est l'un des défis majeurs de la génomique diagnostique moderne, où une proportion croissante des variants pathogènes réside dans les régions régulatrices (promoteurs, enhancers, sites d'épissage profonds). Decima, publié dans Nature Methods avec une base d'entraînement de 22 millions de cellules, représente une avancée significative pour les laboratoires de WGS clinique qui cherchent à reclassifier des VUS dans des régions non-codantes.
Pourquoi ce score ?
Impact clinique : 2/3 · Solidité de l'évidence : 2/3 · Nouveauté : 2/2 · Effectif : 1/1 · Qualité du journal : 1/1 → Total : 8/10
Mots-clés
Chaque mercredi · Sélection commentée · Gratuit · Désabonnement en 1 clic