Die Netzwerke hinter dem Mikrobiom

Phänomenologie der Mikrobiomvariabilität

  • Abb. 1: Illustration der ESABO-Methode unter der Verwendung eines zufällig erzeugten 15-Spezies Interaktionsnetzwerks mit jeweils 10 positiven und negativen Interaktionen. Das Beispiel (A) zweier binärer Häufigkeitsvektoren (für die Spezies B und G im Netzwerk (B)), kombiniert durch die  logische Operation AND zeigt das primäre statistische Signal von ESABO. In (C) ist die aus den  simulierten Abundanzvektoren gewonnene ESABO-Rekonstruktion des Netzwerks aus (B) gezeigt.Abb. 1: Illustration der ESABO-Methode unter der Verwendung eines zufällig erzeugten 15-Spezies Interaktionsnetzwerks mit jeweils 10 positiven und negativen Interaktionen. Das Beispiel (A) zweier binärer Häufigkeitsvektoren (für die Spezies B und G im Netzwerk (B)), kombiniert durch die logische Operation AND zeigt das primäre statistische Signal von ESABO. In (C) ist die aus den simulierten Abundanzvektoren gewonnene ESABO-Rekonstruktion des Netzwerks aus (B) gezeigt.
  • Abb. 1: Illustration der ESABO-Methode unter der Verwendung eines zufällig erzeugten 15-Spezies Interaktionsnetzwerks mit jeweils 10 positiven und negativen Interaktionen. Das Beispiel (A) zweier binärer Häufigkeitsvektoren (für die Spezies B und G im Netzwerk (B)), kombiniert durch die  logische Operation AND zeigt das primäre statistische Signal von ESABO. In (C) ist die aus den  simulierten Abundanzvektoren gewonnene ESABO-Rekonstruktion des Netzwerks aus (B) gezeigt.
  • Abb. 2: Resultat der ESABO Methode für den großen Datensatz der Häufigkeitsmuster aus [5].

Es gibt eine Reihe von Beispielen, in denen die Anzahl von Ereignissen in jeder einzelnen Kategorie und das Muster von Vorliegen und Fehlen von Kategorien uns sehr unterschiedliche Ebenen systemischer Information liefern. Nehmen wir an, wir befinden uns auf einem diplomatischen Verhandlungstreffen mit einer Vielzahl von Akteuren (Firmen, Regierungseinheiten, NGOs, etc.). Die Gesamtzahl an Teilnehmern aus diesen Gruppen wird sehr wahrscheinlich Informationen über die Größe und interne Diversität jeder dieser Akteure enthalten: Eine Regierungseinheit mit einer Vielzahl von Abteilungen wird wahrscheinlich eine größere Zahl von Delegierten entsenden als eine für ein konkretes Ziel gegründete Bürgerinitiative. Das Vorliegen und Fehlen, auf der anderen Seite, wird viel eher Einblick geben in strategische Entscheidungen. Dass ein bestimmter Akteur sich entschließt, teilzunehmen oder der Veranstaltung fernzubleiben, ist (unabhängig von der Größe ihrer Delegation) schon für sich genommen ein hoch informativer Datensatz.

In der Transkriptomik ist die Expressionsstärke eines Gens oft ein Indikator der biologischen Funktion der Genprodukte: Typischerweise sind die Expressionsstärken der (kodierenden Gene der) Transkriptionsfaktoren viel niedriger als die der metabolischen Enzyme, während die auf zwei Zuständen „an“ und „aus“ basierenden Muster der Genexpression in vielen Fällen eher Information über die zugrundeliegenden regulatorischen Netzwerke enthalten [1–4].
In der kürzlich erschienen Arbeit [5] wurde versucht, eine solche auf Vorliegen und Fehlen basierende Analyse auf die Phänomenologie der Mikrobiomvariabilität zu übertragen.

Ähnlich wie bei den bereits erwähnten Genexpressionsstärken war dabei die Frage: Welches Interaktionsnetzwerk ist am besten kompatibel mit den Mustern des Vorliegens und Fehlens mikrobieller Organismen in einer großen Zahl gemessener Mikrobiomzusammensetzungen?

Die Analyse bakterieller Häufigkeiten hat über das letzte Jahrzehnt weitreichende Aufmerksamkeit erhalten [6]. In verschiedensten Disziplinen, von der Mikrobiologie des Ozeanbodens bis zur menschlichen Mikrobiologie, ist die auf Sequenzierung basierende Häufigkeitsschätzung bakterieller Taxa ein weitverbreitetes Hilfsmittel geworden, an bisher nicht zugängliche systemische Information zu gelangen.

Das immense klinische Potential der Mikrobiomanalyse ist dabei möglicherweise noch in der vielversprechenden Anfangsphase [7,8]. 

Unter den vielen schwerwiegenden Krankheiten, bei denen noch Schwierigkeiten in Diagnose und Therapie bestehen, gehören chronische Entzündungskrankheiten sicherlich zu denen, die dringlich Fortschritte in Datenerzeugung, Datenanalyse und computergestützter Modellierung benötigen. Die hier vorgestellte Studie [5] ist dabei eingebunden in die interdisziplinäre Kollaboration sysINFLAME, die sich der systembiologischen Analyse chronischer Entzündungskrankheiten widmet. Die Datenanalyse-Pilotstudie [5] basiert auf einem Datensatz mit Akquise und Vorverarbeitung in den Forschungsgruppen unter der Leitung von Andre Franke, John Baines und Wolfgang Lieb. Durch sie sind die Christian-Albrechts-Universität Kiel, das Max-Planck Institut für Evolutionsbiologie Plön und das Universitätsklinikum Schleswig-Holstein (UKSH), welches die Daten in der Biobank PopGen bereithält, beteiligt. Die Auftretenshäufigkeiten (Abundanzen) wurden dabei durch Standardmethoden aus 16S rRNA Sequenzierdaten für Proben von 822 gesunden Probanden bestimmt.

Ergebnisse

Die in [5] eingeführte ESABO-Methode nutzt nun das oben dargestellte ‚binäre’ Paradigma, um mikrobielle Interaktionsnetzwerke aus mikrobiellen Abundanzen zu rekonstruieren. (ESABO steht für Entropy Shift of Abundance Vectors under Boolean Operations, also Entropieänderung von Abundanzvektoren unter Booleschen Operationen.) 

Die binäre Darstellung des Mikrobioms gibt Zugriff auf zwei neue Analyseebenen: 1. Für jedes Paar von mikrobiellen Organismen (Taxa) werden leichte mutualistische Präferenzen (beide Taxa präsent, (1, 1)) oder Verdrängung untereinander (ein Taxon anwesend, das andere abwesend, (1, 0) oder (0, 1)) aus den binären Häufigkeitsvektoren aus einer großen Zahl von Proben bestimmt. 2. Es können als Test und Kalibrierung der Methode solche binären Abundanzmuster künstlich erzeugt werden, indem man eine Variante eines zufällig gekoppelten Booleschen Netzwerkes (Random Boolean Network, RBN) [2,4] simuliert und darauf die Analysemethode anwendet.

Besonders klar erkennt man die statistischen Verschiebungen in der Zusammenstellung solcher binären Paare, wenn man betrachtet, wie sich Abundanzvektoren unter Booleschen Operationen ‚vereinfachen‘.

Abbildung 1A illustriert dieses Vorgehen: Der binären Vektor (senkrechte Spalten) zweier Taxa besteht jeweils aus vielen einzelnen Proben (Zeileneinträge). Die Taxa könnten beispielsweise die mikrobiellen Spezies B und G in dem kleinen fiktiven 15-Spezies Interaktionsnetzwerk (Abb. 1B) sein, die untereinander kompetitiv in Wechselwirkung treten. Als Konsequenz der negativen Interaktion tendiert in den binären Abundanzvektoren die Anwesenheit von B mit der Abwesenheit von G zusammenzutreffen, und umgekehrt. Wenn man diese zwei Vektoren elementweise mit einem logischen UND (AND) kombiniert, erhält man einen beinahe konstanten binären Vektor, was einer starken Vereinfachung entspricht und in einem starken statistischen Signal in der ESABO-Analyse resultiert.

Formal ist der ESABO-Score definiert als die Vereinfachung (gemessen als Entropie der erhaltenen Vektoren) verglichen (über einen z-Score) mit Entropien, die man aus zufällig gemischten Abundanzvektoren erhält. Ist der z-Score kleiner als  –1, wird ein negativer (kompetitiver) Link zwischen den beiden Taxa angenommen. Ist der z-Score größer als +1, wird ein positiver (synergistischer) Link angenommen.

Abbildung 1C zeigt die ESABO-Rekonstruktion des in Abbildung 1B gezeigten Netzwerks, wobei die binären Abundanzvektoren durch eine Variante des oben erwähnten RBN-Modells simuliert wurden.

Die Anwendung der gleichen Analysemethode auf die gemessenen Häufigkeitsmuster auf Phyla-Ebene ergibt das in Abbildung 2 gezeigte mikrobielle Interaktionsnetzwerk. Es ist allgemein bekannt, dass die stärksten Wechselwirkungen zwischen den besonders häufigen Phyla (wie Bacteriodetes und Firmicutes) in solchen Netzwerken dominant inhibitorisch sind. Erstaunlicherweise zeigt die ESABO Analyse zusätzlich ein dichtes systematisches Netzwerk  positiver Wechselwirkungen zwischen selten auftretenden bakteriellen Spezies.

Ausblick

Das Mikrobiom ist ein Thema mit hoher theoretischer Faszination und dramatischer praktischer Relevanz durch seine Verbindungen zu krankheitsbedingten Phänotypen und seine allgemeine Bedeutung für die menschliche Gesundheit [9,10].

Die Autoren sind der Überzeugung, dass die binäre Sichtweise auf Daten, die durch die ESABO-Methode [5] implementiert wird, helfen kann, die systematischen Eigenschaften des Mikrobioms sichtbar zu machen, und damit zu einem tieferen theoretischen Verständnis der Mikrobiom-Zusammensetzungen beizutragen. Aber selbst auf einem sehr praktischen Level kann die ESABO-Methode zur Interpretation klinischer Daten beitragen, indem sie die potentiellen Interaktionsnetzwerke hinter den Daten zur Verfügung stellt.

Auf der theoretischen Seite kann die ESABO-Methode angewendet werden, um die Kompatibilität der Netzwerke auf verschiedenen phylogenetischen Ebenen zu untersuchen. In Folgearbeiten soll die Methode auf die Interpretation individueller Mikrobiome erweitert werden, die im Kontext der über ESABO-Scores bestimmten potentiellen Interaktionsnetzwerke betrachten. Eines der überraschenden Ergebnisse in [5] war die hohe Zahl systematischer und positiver Wechselwirkungen, die den bereits aus der Literatur bekannten dominierenden negativen Interaktionen gegenüberstehen.

Dieser systematische Beitrag der selten vorkommenden Taxa (die rare biosphere, siehe [10]) zum Interaktionsmuster der Mikroorganismen im menschlichen Verdauungstrakt hebt ihre Relevanz zur metabolischen Funktion des Gesamtsystems hervor.

Danksagung
Die Autoren danken dem Bundesministerium für Bildung und Forschung (BMBF) für finanzielle Unterstützung im Rahmen des e:med-Programms (sysINFLAME Konsortium; Fördernummer 01ZX1306D).

Autoren
Jens Christian Claussen1, Marc-Thorsten Hütt1

Zugehörigkeit
1Department of Life Sciences & Chemistry, Jacobs University Bremen, Bremen, Deutschland

Kontakt 
Prof. Dr. Marc-Thorsten Hütt

Priv.-Doz. Dr. Jens Christian Claussen
Department of Life Sciences
& Chemistry
Jacobs University Bremen
Bremen, Deutschland
m.huett@jacobs-university.de
j.claussen@jacobs-university.de

Referenzen

[1] Liang, S., Fuhrman, S., & Somogyi, R.: Reveal, a general reverse engineering algorithm for inference of genetic network architectures. In Pacific Symposium on Biocomputing. Pacific Symposium on Biocomputing , Vol. 3, pp. 18-29 (1998) PMID: 9697168

[2] Kauffman, S. A.: Metabolic stability and epigenesis in randomly constructed genetic nets. Journal of theoretical biology, 22(3), 437-467 (1969) doi: 10.1016/0022-5193(69)90015-0

[3] Bornholdt, S.: Less is more in modeling large genetic networks. Science, 310(5747), 449-451 (2005) doi: 10.1126/science.1119959

[4] Li, F., Long, T., Lu, Y., Ouyang, Q., & Tang, C.: The yeast cell-cycle network is robustly designed. Proceedings of the National Academy of Sciences of the United States of America, 101(14), 4781-4786 (2004) doi: 10.1073/pnas.0305937101

[5] Claussen, J., Skiecevicene, J., Wang, J., Rausch, P., Karlsen, T., Lieb, W., Baines, J., Franke, A., and Hütt, M.: Boolean analysis reveals systematic interactions among low-abundance species in the human gut microbiome. PLOS Computational Biology 13.6 (2017): e1005361 (2016) doi: 10.1371/journal.pcbi.1005361

[6] Human Microbiome Project C: A framework for human microbiome research, Nature 486, 215-221 (2012) doi: 10.1038/nature11209

[7] Brown J., De Vos W.M., DiStefano P.S., Dore J., Huttenhower C., Knight R., Lawley T.D., Raes J., Turnbaugh P.: Translating the human microbiome. Nature Biotechnology 31(4), 304-308 (2013) doi: 10.1038/nbt.2543

[8] Clemente J.C., Ursell L.K., Parfrey L.W., Knight R.: The Impact of the Gut Microbiota on Human Health: An Integrative View, Cell 148, 1258-1270 (2012) doi: 10.1016/j.cell.2012.01.035

[9] Cho, I., & Blaser, M. J.: The human microbiome: at the interface of health and disease. Nature Reviews Genetics, 13(4), 260-270 (2012) doi: 10.1038/nrg3182

[10] Heinken, K., and Thiele, I.: Systematic prediction of health- relevant human microbial co-metabolism through a computational framework, Gut Microbes 6, 120–130 (2015)doi: 10.1080/19490976.2015.1023494

Mehr Artikel

Buch zum Thema Bioinformatik

Kontaktieren

Jacobs Universität
Campus Ring 1
28759 Bremen, Bremen
Deutschland

Jetzt registrieren!

Die neusten Informationen direkt per Newsletter.

To prevent automated spam submissions leave this field empty.