Chimie-MSMission: Explications - Mission 20b

Mission 20b : Le Défi de la Découverte Rétrospective

Objectif :

Développer un workflow LC-MS pour quantifier des métabolites de contaminants connus et découvrir de nouveaux métabolites d'exposition rétrospectivement à partir des mêmes données, sans réanalyse des échantillons.

Contexte :

Dans une étude d'exposomique, vous analysez des échantillons biologiques (sérum, urine) pour caractériser les expositions environnementales. Vous ciblez certains métabolites de contaminants connus. Mais la science évolue : de nouveaux contaminants ou hypothèses émergeront. Réanalyser des échantillons rares est impossible ou coûteux. Les données brutes doivent être assez riches/exhaustives pour que les métabolites de contaminants inattendus soient caractérisés rétrospectivement, sans réanalyse des échantillons.

Stratégie d'analyse :

Cette mission présente un double objectif : quantifier des composés connus et permettre la découverte d'inconnus à l'avenir. La stratégie doit donc s'orienter vers la création d'un "jumeau numérique" ou d'une "archive digitale complète" de chaque échantillon. Pour cela, il faut une méthode qui acquiert l'information la plus exhaustive possible, de manière non biaisée. L'approche LC-MS à haute résolution utilisant le mode d'acquisition DIA (Data-Independent Acquisition) est la seule qui réponde à cette exigence.

Choix du mode d'introduction : Chromatographie Liquide (LC - Carte I2)

La LC est la technique de séparation standard pour l'analyse de fluides biologiques dans les études d'exposomique, capable de séparer la très grande diversité chimique des métabolites et contaminants.

Choix de la source d'ionisation : Sources pour LC (Cartes S4, S5, S6, S7)

Pour une exploration large et non ciblée, une couverture maximale des types de molécules est nécessaire. L'utilisation de sources polyvalentes comme l’ionisation électrospary (carte S6) pour les composés polaires, APCI (carte S4) pour les moins polaires, et une source multimode (carte S7) est une stratégie robuste pour capturer la plus grande partie possible de l'exposome.

Choix de l'analyseur : Haute Résolution (HRMS - Cartes A7, A9, A10)

La haute résolution est une condition sine qua non. Seul des analyseurs HRMS en tandem (Q-TOF, Q-Orbitrap), ou tri-hybride fournit la précision de masse nécessaire pour identifier sans ambiguïté un composé (connu ou inconnu) dans un mélange très complexe, et ce, même des années après l'acquisition.

Choix du mode de balayage : DIA (Data-Independent Acquisition - Carte B10)

C'est la pierre angulaire de la stratégie rétrospective.

Pourquoi pas d'autres modes ?

Une méthode ciblée (comme le PRM – carte B8) ne verrait que les composés que l'on connaît aujourd'hui. Toute information sur d'autres molécules serait perdue. Une méthode DDA (Data-Dépendant Acquisition (B9) ne fragmente que les ions les plus intenses à un instant T. Les métabolites de contaminants, souvent à l'état de traces, ne seraient probablement jamais sélectionnés pour la fragmentation, rendant leur caractérisation rétrospective impossible.

La puissance du DIA : Le mode DIA fragmente systématiquement et sans discrimination tous les ions qui entrent dans le spectromètre de masse. Il enregistre ainsi un spectre de fragmentation complet pour chaque molécule présente dans l'échantillon, qu'elle soit abondante ou non, connue ou inconnue. L'instrument crée une archive digitale complète et permanente. Ainsi, dans le futur, lorsqu'un nouveau contaminant est suspecté, on peut retourner dans ces fichiers de données, extraire l'ion précurseur et les ions fragments correspondants à ce nouveau composé, et le quantifier comme s'il avait été ciblé depuis le début.

Choix des paramètres expérimentaux (Cartes P3, P6, P8)

Ces paramètres supportent une acquisition de données large et générique, idéale pour une analyse non ciblée.

Ionisation alternée (Carte P3) : Pour capturer les composés s'ionisant en mode positif et négatif en une seule analyse.

Tension d'interface par défaut (Carte P6) : Assure une bonne sensibilité générale sans être optimisée pour une classe de composés en particulier, ce qui est souhaitable pour une analyse large.

Énergie de fragmentation étagée (Carte P8) : L'acquisition de fragments à différentes énergies enrichit l'archive digitale, facilitant l'identification structurale des nouveaux composés découverts rétrospectivement.

Le Traitement des Données (Cartes D11 à D17)

La richesse des données DIA ne peut être exploitée que par un pipeline de traitement bio-informatique structuré, où chaque carte représente une étape clé :

Filtrage du Bruit et Ligne de Base (D11) : C'est l'étape initiale de "nettoyage" des données brutes pour améliorer la qualité du signal et préparer une détection fiable des pics.

Peak picking et attribution des fragments (D12) : Le logiciel identifie tous les pics chromatographiques pertinents dans le signal et les transforme en une liste de "features" (caractéristiques définies par un m/z, un temps de rétention et une intensité). Pour le DIA, cette étape relie également les fragments à leurs précurseurs.

Alignement des données (D13) : Cette étape corrige les inévitables variations de temps de rétention entre les différentes analyses, garantissant que l'on compare bien la même molécule à travers tous les échantillons.

Normalisation (D14) : Elle corrige les variations d'intensité dues à des facteurs techniques (et non biologiques) pour permettre une comparaison quantitative juste et équitable entre les échantillons.

Feature Grouping/Clustering (D15) : Le logiciel regroupe intelligemment les différents signaux (isotopes, adduits) qui proviennent d'une seule et même molécule, ce qui affine la liste des composés uniques et évite les redondances.

Annotation et Identification des Composés (D16) : C'est ici que l'on donne un nom aux "features". En comparant leurs caractéristiques (masse exacte, spectre de fragmentation) à des banques de données, on identifie les molécules.

Analyse Statistique et Visualisation (D17) : L'étape finale, où l'on utilise des tests statistiques pour trouver les différences significatives entre les groupes d'échantillons et où l'on crée des graphiques pour visualiser et interpréter les résultats de manière intelligible.

Conclusion

Pour répondre au double défi de la quantification présente et de la découverte future, la stratégie LC-HRMS en mode DIA est la solution de référence. Elle transforme chaque analyse en une archive digitale riche et permanente. C'est ensuite un pipeline de traitement de données complet, de la filtration du bruit jusqu'à l'analyse statistique, qui permet d'extraire de ces données complexes des connaissances à forte valeur ajoutée, que ce soit pour des analyses planifiées ou pour de futures découvertes rétrospectives.

Ligne de solution

Cartes : I2, (S4 ou S5 ou S6 ou S7), (A7 ou A9 ou A10), B10, (P3 et P6 et P8), (D11 et D12 et D13 et D14 et D15 et D16 et D17)