Classifying Clinical Evidence Levels of Cancer Variants in Biomedical Literature Using Machine Learning.
Outil / méthode
LLMs (GPT-4.1-mini, Gemini 2.5 Flash) pour classification automatique des niveaux de preuve CIViC
Résumé
cette étude compare les performances de deux LLMs (GPT-4.1-mini, Gemini 2.5 Flash) et de deux algorithmes classiques (arbre de décision, XGBoost) pour classifier automatiquement les publications scientifiques selon les niveaux de preuve clinique du système CIViC (Clinical Interpretation of Variants in Cancer). Des stratégies de prompting zero-shot et few-shot ont été testées pour les LLMs, comparées à des représentations TF-IDF et word embedding pour les approches ML traditionnelles. L'objectif est d'automatiser la curation bibliographique pour accélérer l'interprétation des variants en oncologie de précision.
Synthèse rédigée par Geno'X. Pour l'abstract original complet, consulter la publication source.
Analyse
L'automatisation de la curation bibliographique pour l'interprétation de variants est un goulot d'étranglement majeur en oncologie moléculaire, et de plus en plus en génétique constitutionnelle. Ce travail démontre que les LLMs récents via few-shot prompting peuvent assister efficacement cette tâche. Un pas concret vers l'automatisation de la veille bibliographique pour la classification des variants — une problématique directement pertinente pour les bases de données comme ClinVar ou InSiGHT.
Pourquoi ce score ?
Impact clinique : 2/3 · Solidité de l'évidence : 2/3 · Nouveauté : 1/2 · Effectif : 0/1 · Qualité du journal : 0/1 → Total : 5/10
Mots-clés
Chaque mercredi · Sélection commentée · Gratuit · Désabonnement en 1 clic