Analyse Biologischer Systeme

Von Datenmassen zum Modell

  • Abb. 1: Ein Nanoporen-basierter Sequenzierautomat.  (Photo: R. Leidenfrost)
  • Sequenzierung mit Nanoporen
  • Abb. 3: Modellierung der Biogasfermentation.

Im Jahr 2012 publizierten Wissenschaftler der Stanford University das erste Computermodell des Bakteriums Mykoplasma genitalium. Dies war in vielfacher Hinsicht ein Meilenstein bei dem Versuch, einen kompletten Organismus zu simulieren. Bemerkenswert war, dass zum ersten Mal erfolgreich ausgehend vom Genotyp der Phänotyp vorhergesagt wurde. Die Wahl fiel auf M. genitalium, da es mit 525 Genen ein kleines Genom besitzt und seit langem als Modellorganismus zur Erforschung eines minimal notwendigen Genoms dient. Zu allen 525 Genen wurden alle öffentlich zugänglichen Informationen gesammelt und in einer sogenannten Knowledge Base, also einer Wissensdatenbank, abgelegt. Diese vom Team um Jonathan Karr entwickelte Software kommt auch in der hier vorgestellten Forschung zum Einsatz und wird dabei intensiv weiterentwickelt (celldesign.de). Das langfristige Ziel ist, die Simulationsdaten zur Verbesserung biologischer Systeme, u.a. bei der Biogasfermentation, zu verwenden.

Dynamik der Biogasfermentation

Die Erzeugung des Biogases Methan ist ein komplexer biologischer Prozess, bei dem in der Regel makromolekulares Substrat durch eine Lebensgemeinschaft von Mikroorganismen zersetzt wird. Als Substrat kommen vorwiegend Mais- und Grassilage sowie Tiermist und -gülle zum Einsatz. Während der Anfahrphase der Fermentation etabliert sich selbständig eine Lebensgemeinschaft von Mikroorganismen. Wie die Dynamik des Auf- und Abtretens der Mikroorganismen in dieser Phase ist, wird derzeit intensiv beforscht. Es ist bereits bekannt, dass von rund 300 Mikroorganismen etwa 70 eine aktive Lebensgemeinschaft bilden. Nach Tagen, Wochen bis hin zu Monaten stabilisiert sich diese Gemeinschaft und damit der Methanertrag. Die Zersetzung der Biomasse teilt sich in mehrere, parallel ablaufende Prozesse ein. Während der Hydrolyse werden überwiegend durch Exoenzyme biogene Makromoleküle zerlegt und verfügbar gemacht. Diese dienen dann säurebildenden Bakterien der Versäuerungsphase als Substrat. Es entstehen überwiegend kurzkettige Karbon- und Fettsäuren, aber auch Ammoniak und unerwünschter Schwefelwasserstoff. Die niederen Säuren werden wiederum in der essigbildenden Phase von acetogenen Mikroorganismen zu Essigsäure umgesetzt.

In der finalen, vollständig anaeroben, methanbildenden Phase wird diese von methanogenen
Archaebakterien in Methan umgesetzt. Ein weiterer Methananteil wird von den Methanbildnern durch die Reduktion von Kohlendioxyd mit Wasserstoff erzeugt.

Ein wichtiges Ziel der gegenwärtigen Forschung befasst sich mit der Analyse der Dynamik der metabolischen Prozesse bei der Biogasfermentation. Vergleichsweise leicht zugänglich sind Nukleinsäuren. Nach deren Sequenzierung kann durch Vergleiche mit Datenbanken ribosomaler DNA-Sequenzen die Zusammensetzung der Lebensgemeinschaft analysiert werden. Während man dazu früher die relativ aufwendige Sangermethode verwendete, stehen heutzutage Hochdurchsatzgeräte bereit.

Sequenzierung mit Nanoporen

Zur Zeit etabliert sich eine neue Technologie: die Nanoporen-Sequenzierung mittels der MinION-Plattform (Oxford Nanopore Technologies). Dieses Gerät ist sehr klein (Abb. 1), es ist tragbar und kann an den USB-Port eines portablen Computers angeschlossen werden. Entsprechend kam das Gerät bereits auf der Internationalen SpaceStation zur Mikroben-Sequenzierung zum Einsatz.

Im Gerät befindet sich eine austauschbare Cardridge mit hunderten individuellen Proteinporen. An jeder einzelnen Pore wird der Ionen- und damit Stromfluss gemessen. Dieser ist, unter ansonsten konstanten Bedingungen, abhängig davon wie frei die Porenöffnung ist (Abb. 2).

Während der Vorbereitung der DNA-Proben für die Sequenzierung, werden die DNA-Moleküle an ein Motorprotein gekoppelt, welches sie durch die Proteinpore leitet. Anders als in der schematischen Darstellung in Abbildung 2 dargestellt, befinden sich immer 4-5 Nukleotide in der Nanopore. Durch diese „Verstopfung“ kommt es zu einem messbar reduzierten Stromfluss. Diese Änderungen werden aufgezeichnet und später mittels eines rekurrenten neuronalen Netzes algorithmisch ausgewertet. Wichtig ist dabei, dass das neuronale Netzwerk zuvor mit guten Daten trainiert wurde. Prinzipiell ist, ausgehend von entsprechenden Trainingsdaten, auch die Messung chemischer Modifikationen der Nukleotide möglich. Es konnten bereits Leselängen von über 100.000 Basenpaaren erreicht werden. Zum Vergleich: bei Sanger liegen die Leselängen bei 800, bei Hochdurchsatz-Sequenziertechnologien bei rund 250 Basenpaaren.

Vom Metatranskriptom zum Modell

Um die Stoffwechselvorgänge bei der Biogasfermentation aufzuklären, ist es notwendig unter anderem die beteiligten Organismen, ihre aktiven Enzyme, Metabolitkonzentrationen und -flüsse und Umweltfaktoren zu kennen. Je detaillierter diese Informationen, desto besser kann das Modell formuliert und eine Simulation parametrisiert werden. Allerdings gilt es ein ausgewogenes Maß zwischen Vollständigkeit auf der einen und Komplexität auf der anderen Seite zu finden. Die Kunst besteht in der Erkennung und Auswahl von Schlüsselprozessen, mit deren Hilfe sich der Gesamtprozess hinreichend beschreiben lässt. Des Weiteren müssen die Parameter der Schlüsselprozesse ökonomisch zugänglich sein. Daher wird oft die Dynamik des Metatrankriptoms, also die zeitlichen Änderungen der Gesamtheit aller Transkripte (mRNAs) aller Mikroorganismen untersucht. Auf Basis der Transkriptkonzentrationen und deren Zuordnung zu Organismen- und Enzymgruppen wird versucht, ein Modell der Aktivität der Stoffwechselprozesse zu erstellen (Abb. 3).

Von großer und oft unterschätzter Bedeutung ist die Probenahme, welche die Basis aller nachfolgenden Analysen ist. Wird eine im Betrieb befindliche Anlage beprobt, muss die Probenahme minimal-invasiv erfolgen. Des Weiteren darf in der Zeit zwischen Probenahme und Tieffrierung der Probe möglichst keine metabolische Veränderung erfolgen. Da signifikante Änderungen der Transkriptkonzentrationen in bakteriellen Zellen innerhalb von Minuten erfolgen können, ist hier also höchste Achtsamkeit gefordert. Es wurde festgestellt, dass die Methodik der Nukleinsäureextraktion einen großen Einfluss auf die nachfolgende Datenanalyse hat [1]. Noch wird für die Sequenzierung cDNA verwendet, die mittels der reversen Transkriptase aus den extrahierten Metatranskripten generiert wurde. Es ist jedoch abzusehen, dass die Nanoporen-basierte Sequenzierung bald die direkte Sequenzierung von RNA erlaubt. Damit ließe sich ein weiterer Prozessierungsschritt einsparen und folglich die Datenqualität erhöhen.

Datenmassen richtig fassen

Jeder Sequenzierlauf erzeugt rund 3 Gigabyte Rohdaten. Diese gilt es auf Qualität zu prüfen und weiter zu prozessieren. Dies stellt an experimentelle Biowissenschaftler neue Herausforderungen. Will man den neuesten Stand der bioinformatischen Analysetechniken nutzen, so kommt man kaum an dem Linux-Betriebssystem und dem Eingabeterminal vorbei. Das Wissen um die Möglichkeiten der Datenprozessierung mit einem Unix-basiertem Betriebssystem wie Linux ist bei der Arbeit ebenso wichtig wie die richtige Bedienung der Pipette oder des Thermocyclers [2]. In einem Fall wurde einmal von einer Wissenschaflerin berechnet, dass allein die von ihr generierten und genutzten Metatranskriptomdaten ausgedruckt einen Papierberg ergäben, der siebenmal dem Gewicht des Eifelturms entsprechen würde. Hinzu kommen die abiotischen Prozessdaten, die mit den biotischen Daten zum Modell und zur Parametrisierung der Simulation führen.

Vom Modell zum optimierten Prozess

Es ist noch ein weiter Weg, bevor valide Modelle der Biogasfermentation vorliegen, die zudem hinreichende Simulationen zulassen. Aber die Erreichbarkeit dieses Ziels steht im Zeitalter der Hochdurchsatzanalysen auf der einen und der Steigerung der Computerkapazitäten auf der anderen Seite außer Frage. Dann gilt es, die Simulationsergebnisse zu nutzen. Ein absehbarer Weg ist die gezielte Optimierung nicht nur von Prozessparametern, sondern auch von Mikroorganismen. Neue gentechnische Methoden wie die Genomeditierung mittels CRISPR/Cas9 werden dazu ihren Beitrag leisten. Der Arbeitsprozess von der systemischen Analyse biologischer Systeme bis hin zu deren Prozess-basierten und gentechnischen Veränderung wird heute unter dem Begriff „Synthetische Biologie“ zusammengefasst. Es handelt sich dabei um einen interdisziplinären Ansatz, bei dem neben Lebenswissenschaftlern auch zum Beispiel Mathematiker, Informatiker, Chemiker und Physiker zusammenarbeiten [3].

Danksagung
Ich danke meinen Doktoranden Lucy Stark, Nadine Wappler, Gabriel Kind und Robert Leidenfrost sowie meinen Kollegen Sandra Feik und René Kretschmer für die Unterstützung und geteilte Liebe zu den Biowissenschaften.

Autor
Röbbe Wünschiers

Kontakt 
Prof. Dr. Röbbe Wünschiers
Angewandte Computer- und Biowissenschaften
Biotechnologie und Chemie
Hochschule Mittweida
Mittweida, Deutschland
roebbe.wuenschiers@hs-mittweida.de

Referenzen

[1] Stark L, Giersch T, Wünschiers R (2014) Efficiency of RNA extraction from selected bacteria in the context of biogas production and metatranscriptomics. Anaerobe 29:85–90.

[2] Wünschiers R (2016a) Wiley-Schnellkurs Bioinformatik – Datenmassen richtig fassen. Wiley-VCH Weinheim, ISBN 978-3-527-53040-3

[3] Wünschiers R (2016b) Making-of Synthetic Biology: The European CyanoFactory Research Consortium. In: Hagen K, Engelhard M, Toepfer G (eds) Ambivalences of Creating Life. Springer-Verlag, Berlin, Heidelberg, pp 55–72

Mehr Artikel

Wiley-Schnellkurs Bioinformatik für Anwender

Kontaktieren

Hochschule Mittweida
Technikumplatz 17
09648 Mittweida, Sachsen
Deutschland
Telefon: +49 3727 581120

Jetzt registrieren!

Die neusten Informationen direkt per Newsletter.

To prevent automated spam submissions leave this field empty.