Massenspektrometrie

Voll automatisierte Analyse für komplexe Daten

  • Abb. 1: Exemplarische Retentionszeitabweichungen in GC/MS Analysen von Krebszellextrakten. Jede Probe ist mit anderen Farbe gekennzeichnet.Abb. 1: Exemplarische Retentionszeitabweichungen in GC/MS Analysen von Krebszellextrakten. Jede Probe ist mit anderen Farbe gekennzeichnet.
  • Abb. 1: Exemplarische Retentionszeitabweichungen in GC/MS Analysen von Krebszellextrakten. Jede Probe ist mit anderen Farbe gekennzeichnet.
  • Abb. 2: Cloud-Plot der Signalunterschiede in Krebszellextrakten nach Behandlung der Zellen mit Pyruvat (0.44 g/L) oder Glucose (1 g/L).

Die Datenanalyse von komplexen Proben aus der Chromatographie-gekoppelten Massenspektrometrie erfordert häufig mühsame Vorbereitung und das Vorhandensein leistungsfähiger Datenverarbeitungsprogramme, um ein sinnvolles Ergebnis zu erhalten. Eine nützliche Hilfe ist XCMS [1], eine kostenlose Online-Plattform, die eine herstellerunabhängige, automatisierte Verarbeitung von Datensätzen mit Peakerkennung, -alignment und –integration ermöglicht.

Darüber hinaus erlaubt XCMS Datensharing und -visualisierung und statistische Auswertung mit Tools wie Hauptkomponentenanalyse und vieles mehr.

Automatisierte unselektive Peakerfassung
Moderne „omic“ Techniken befassen sich mit der Identifizierung und Quantifizierung eines breiten Spektrums von Analyten mit unterschiedlichen physikalischen und chemischen Eigenschaften in einem weiten Konzentrationsbereich in einer großen Anzahl komplexer Proben. Daher werden die „omics“ Methoden durch zwei sehr leistungsfähige Analysetechniken dominiert, nämlich der Kernspinresonanzspektroskopie (NMR) und der Massenspektrometrie (MS), die mit Hochleistungstrennverfahren wie z. B. Gas- (GC) oder Flüssigkeitschromatographie (LC) gekoppelt werden können [2], um Verbindungen eines Mehrstoffgemisches zu unterscheiden. Durch solche Kopplungen werden jedoch sehr große Datenmengen erzeugt.

Obwohl idealerweise alle, auch die unbekannten Komponenten einer großen Anzahl von Proben, nicht-selektiv erfasst werden sollten, wird allgemein eine bekannte Anzahl von Analyten in einer Probe unter Verwendung vorgefertigter Methoden analysiert. So werden meist Methoden mit Listen von Zielsignalen angelegt, die benutzt werden können, diese in den entsprechenden Chromatogrammen aufzufinden und mithilfe einer selektiven Massenspur (Masse-zu-Ladungsverhältnis, m/z) zu quantifizieren. Gewöhnlich ist dieser Ansatz zur Auswertung einer begrenzten Anzahl von Verbindungen geeignet, kann aber sehr mühsam werden, wenn die Anzahl von Analyten erheblich steigt oder viele unbekannte Verbindungen ausgewertet werden müssen.

Folglich möchten viele Anwender der gekoppelten Massenspektrometrie für die Analyse von Mehrkomponentengemischen den so genannten ungezielten Ansatz verwenden [3].

Hier führt die nicht-selektive Peakerkennung dazu, dass alle Signale, die unbekannten und bekannten Verbindungen, in einem Datensatz quantifiziert werden. Mehrere kommerzielle Programme verfolgen diesen Ansatz, der eine erhebliche Vereinfachung des Arbeitsaufwandes für solche Datensätze verspricht. Plattformen wie XCMS ermöglichen ein solches „globales Profiling“ der Komponenten eines Gemisches und stellen darüber hinaus nützliche Werkzeuge für eine Visualisierung der großen Menge an Daten zur Verfügung.

Peakerkennung, -alignment und -integration
Die Online-Version des Programms (Link im Crossmediabalken) ist eine frei verfügbare Plattform für die nicht-selektive Analyse von Daten aus der gekoppelten Massenspektrometrie; sie ist einfach anzuwenden und erfordert keine Programmier-Fachkenntnisse [5]. Obwohl sie ursprünglich für LC/MS Daten entwickelt wurde, wird die Software zunehmend auch für GC/MS-Analysen verwendet. Gängige Software ist oft auf bestimmte Datenformate limitiert, die sie bearbeiten kann. Im Gegensatz dazu bemühen sich automatisierte Auswertepakete darum, eine größtmögliche Anzahl an Datenformaten und geräteunabhängige Datenaustauschformate zu unterstützen, um eine einheitliche Handhabung im Hochdurchsatz zu ermöglichen.

Die Auswertung der Daten kann nach dem Hochladen der Daten auf den Online-Server in einem der folgenden allgemeinen Austauschformate gestartet werden: netCDF, mzXML, mzData und .d [5]. Die Analyse-Parameter können als Parametersätze aus dem Drop-Down-Menü des Parameter-Feldes angewählt oder wie benötigt verändert und als benutzerdefiniertes Set gespeichert werden. Auswahlparameter sind z. B. das Retentionszeit-Format für die Datenausgabe (s/min) und die erlaubte Retentionszeitabweichung, der Ionisations-Modus (Polarität), die Massenauflösung (FWHM) und Genauigkeit (ppm), statistische Tests (t-Test, Mann-Whitney, Wilcoxon Rang, Post-hoc-Analyse) und entsprechende Schwellenwerte. Nach der Datenverarbeitung wird eine E-Mail-Benachrichtigung an den Benutzer gesendet und die Ergebnisse können online eingesehen oder im ZIP-Format heruntergeladen werden (`View results‘ tab).

XCMS korrigiert zunächst Abweichungen in der Retentionszeit eines Peaks in den verschiedenen Chromatogrammen (= Peakalignment) durch Ausrichtung auf einen repräsentativen Wert (Abb. 1) [4].

Abweichungen der Retentionszeit in einem Probenset liegen gewöhnlich unter 6 s, jedoch kann es z. B. nach einer Säulenkürzung durchaus auch zu Abweichungen über 30 s, der meist maximal zugelassenen Abweichung, kommen. Abweichungen in dieser Größenordnung müssten manuell korrigiert werden [6], eine mühsame und zeitaufwendige Prozedur für eine große Anzahl an Retentionszeiten. Nach automatischer Prozessierung mit XCMS können stattdessen jedoch die ausgerichteten und integrierten Signale als Excel-Sheet von der Webseite heruntergeladen und weiter bearbeitet werden.

Obwohl die vollautomatische Datenauswertung meist eine schlechtere Peakerkennung und eine wesentlich höhere Signalvarianz und Rauschen aufweist [3], erreicht das Programm bei der Quantifizierung absolut kompetitive Ergebnisse. So waren die Signalverhältnisse in einer Analyse, die parallel mit der herstellereigenen Software Xcalibur und mit XCMS prozessiert wurde, innerhalb einer Toleranz von 10%. Leider waren jedoch nicht alle selektiven Massenspuren aus dem gezielten Ansatz in dem mit einem Standardparameterset produzierten Datensatz enthalten; hier ist vermutlich eine Optimierung der Parameter nötig.

Datenverteilung und verschiedene Signale in großen Datensätzen
Zusätzlich zu allgemeinen Funktionen von Auswertesoftware wie Peakidentifikation und –integration bietet die Software eine Reihe von Möglichkeiten zur Darstellung großer Datensets und dem Erfassen der Datenstruktur an. Als Beispiel der explorativen Datenanalyse sind Cloud-Plots [7] z. B. sehr nützlich, um die Unterschiede von Signalen in Chromatogrammen verschiedener Proben zu illustrieren (Abb. 2). Als Beispiel wurden 2335 sogenannte features (eindeutige Kombination von m/z und Retentionszeit) mit einem Signalverhältnis ≥ 1.5 zu einem Signifikanzniveau p ≤ 0.01 wurden in Krebszellproben nach verschiedener Behandlung detektiert. Der Totalionenstrom (TIC) des Chromatogramms wurde zum Vergleich grau hinterlegt. Die m/z der Analyten, die höher in der Glucose-behandelten Proben sind, sind in Grün dargestellt, diejenigen, deren Signalintensität in den Pyruvat-behandelten Zellen höher war, in Rot. Darüber hinaus korreliert die Intensität der Farbtöne mit dem p-Wert und die Größe der Punkte mit der Größe der Signalveränderung. Cloud-Plots sind damit sehr übersichtliche Präsentationen einer nicht selektiven Auswertung; sie ermöglichen einen ersten Blick auf die Unterschiede zwischen zwei Probensätzen.

Zusammenfassung
Die Onlineplattform XCMS bietet viele Vorteile im Vergleich zu traditioneller Software der Instrumentenhersteller. Neben der Retentionszeitkorrektur und einer Ergebnistabelle mit allen erfassten m/z und der entsprechenden Peakfläche werden sinnvolle Anwendungen für die explorative Analyse großer Datensätze aus der gekoppelten Massenspektrometrie wie interaktive Cloud-Plots, Heatmaps, Spiegel-Plots, Hauptkomponentenanalyse, multidimensionale Skalierung und andere zur Verfügung gestellt [4]. Es ist eine einfach zu erschließende, nützliche Toolbox, die für die nicht-selektive Datenauswertung und Visualisierung in der gekoppelten Massenspektrometrie genutzt werden kann. Die Details der Datenanalysealgorithmen wurden von Smith et al. veröffentlicht [8].

Autoren
Jeevan Sharma, Claudia Birkemeyer
Universität Leipzig, Institut für Analytische Chemie, Leipzig

Kontakt
Claudia Birkemeyer
Universität Leipzig
Institut für Analytische Chemie
Leipzig
birkemeyer@chemie.uni-leipzig.de

Referenzen:

[1] Benton, H.P., et al.: Analytical Chemistry 87 (2), 884–891 (2015). doi:10.1021/ac5025649

[2] Gowda, G.A. and Djukovic, D.: Molecular Biology 1198, 3–12 (2014). doi:10.1007/978-1-4939-1258-2_1

[3] Birkemeyer, C., et al.: Chemical Senses, 1-11 (2016). doi:10.1093/chemse/bjw056

[4] Gowda, H., et al.: Analytical Chemistry 86 (14), 6931-6939 (2014). doi:10.1021/ac500734c

[5] Tautenhahn, R., et al.: Analytical Chemistry 84(11), 5035–5039 (2012). doi:10.1021/ac300698c

[6] Skelton, D., Dissertation: Investigating mammalian cellular metabolism using 13C-glucose and GC-MS, The Florida State University (2011).

[7] Patti G.J., et al.: Analytical Chemistry 85(2), 798−804 (2013). doi:10.1021/ac3029745

[8] Smith C.A., et al.: Analytical Chemistry 78(3), 779-787 (2006). doi:10.1021/ac051437y

Weitere Beiträge zum Thema: http://www.git-labor.de/
Online Plattform XCMS: https://xcmsonline.scripps.edu/

Jetzt registrieren!

Die neusten Informationen direkt per Newsletter.

To prevent automated spam submissions leave this field empty.