Interview: Präzise Berechnung von Kenngrößen in der Genomforschung

Zunächst eher zufällig stießen Prof. Dr. Martin Schlather und Dr. Nicholas Schreck darauf, dass eine aus mathematischer Sicht suboptimale Vorgehensweise für die Schätzung der genomischen Varianz benutzt worden ist. Wurde bisher der Einfluss der Ausprägung der Genotypen auf den phänotypischen Wert als fest angesehen, entwickelten die Forscher eine neue Methode, die auf einer zufälligen Betrachtungsweise basiert. Nicholas Schreck  erzählt im Interview über das neue Verfahren zur korrigierten Betrachtungsweise des genetischen Einflusses.

GIT: Wie sind Sie und Ihre Koautoren darauf gekommen, dass überhaupt eine ungenaue Betrachtungsweise vorliegt?

N. Schreck: Auf einer gemeinsam besuchten Tagung äußerte Prof. Dr. Martin Schlather die Vermutung, dass die in einigen Vorträgen benutze Methode zur Schätzung der genomischen Varianz aus mathematischer Sicht nicht optimal ist. Infolgedessen hat er mich ermuntert, dies zu überprüfen und so habe ich die Chance bekommen, in einem interessanten, packenden und zukunftsträchtigen Themengebiet zu forschen. Einer umfassenden Literaturrecherche folgte der Vergleich verschiedener bestehender Ansätze und die Entwicklung einer mathematisch rigorosen und mit der Theorie der Quantitativen Genetik konsistenten Methode, des „Best Prediction“-Ansatzes. Diese Entwicklung erfolgte in enger Abstimmung mit Prof. Dr. Hans-Peter Piepho, der seine Expertise auf diesem Anwendungsgebiet äußerst gewinnbringend eingebracht hat.

GIT: Worin liegen Ihren Erkenntnissen zufolge die Herausforderungen in der Berechnung der Kenngrößen der Genomforschung?

N. Schreck: In den Zeiten der Genomik, also der Sequenzierung und Analyse des vollständigen Genoms, ist man auf statistische Modelle für hochdimensionale Daten angewiesen. Ein bedeutendes Beispiel für die Anpassung solcher Modelle ist die sogenannte genomic best linear unbiased prediction (kurz GBLUP) Methode. Diese wird in der Genomik sehr oft verwendet, um Regressionsmodelle mit zufälligen Effekten anzupassen. Dadurch wird es ermöglicht, Kenngrößen, wie beispielsweise Zuchtwerte und genomische Varianzen, zu berechnen, wenn als Eingangsdaten eine (genomische) Verwandtschaftsmatrix oder oft hochdimensionale Daten eines sequenzierten Genoms vorliegen.

So können unter anderem Züchtungsentscheidungen getroffen werden, ohne dass zuerst die Ausprägung des Phänotyps eines Individuums festgestellt werden muss.

Die Modellannahmen zur GBLUP-Methode an die Genotypen und Effekte weichen allerdings von der Theorie der Quantitativen Genetik ab. Insbesondere werden die Effekte der Genorte auf den phänotypischen Wert klassischerweise als fest angesehen, in dieser Methode jedoch als zufällig betrachtet. Genau umgekehrt verhält es sich mit den Genotypen der einzelnen Genorte. Dadurch wird das Verknüpfungsungleichgewicht, also das nicht rein zufällige gemeinsame Auftreten von Allelen an unterschiedlichen Genorten, nur unvollständig bei der Formel zur Berechnung der additiven genomischen Varianz berücksichtigt. Dies führt zu Unstimmigkeiten, denn die so berechnete genomische Varianz ist inkonsistent mit der Quantitativen Genetik, und entspricht daher nicht dem genomweiten Analogon zur klassischen genetischen Varianz.

GIT: Welche Konsequenzen haben sich aus diesen Herausforderungen abgeleitet?

N. Schreck: Die additive genomische Varianz ist die Basis für die Berechnung der Heritabilität, die oft als die wichtigste Kenngröße der Quantitativen Genetik bezeichnet wird. Sie beschreibt den Anteil der beobachteten Variation in den Phänotypen, die durch einen genetischen Anteil erklärt werden kann, und ist beispielsweise für Selektions- und Züchtungsentscheidungen sowie Behandlungsmaßnahmen von Bedeutung. Die oben beschriebene Betrachtungsweise hat zu einer inkonsistenten Berechnung der Heritabilität im Rahmen der gemischten Modelle geführt. Dies ist eng verbunden mit der so genannten „missing heritability“, da die inkonsistente Schätzung meist zu kleineren geschätzten Heritabilitäten führt. Wir haben an einigen Beispielen festgestellt, dass die Abweichungen in der Schätzung der Heritabilität bis zu enormen 50 Prozentpunkten betragen können. Dies ist sehr stark von der Struktur des zugrundeliegenden Datensatzes abhängig. Das Ausmaß und die Auswirkungen auf Entscheidungen in der Pflanzen- und Tierzucht sowie die Humangenetik ist noch nicht absehbar und wird in Folgestudien weiter untersucht und quantifiziert werden.

GIT: Wie definiert sich Ihr neuer Ansatz? In welcher Form berücksichtigt Ihr Modell den Beitrag des Verknüpfungsungleichgewichts?

N. Schreck: Wir haben die klassische Definition der genomischen Varianz auf die gemischten Modelle, insbesondere auf die GBLUP-Methode, übertragen. Infolgedessen betrachten wir die genomische Varianz selbst als eine zufällige Größe im zugehörigen Modell. Diese Zufallsvariable wird auf der Grundlage der gegebenen Daten bestmöglich vorhergesagt (in der Mathematik entspricht dies dem Konzept des bedingten Erwartungswerts), und so erhalten wir eine neuartige Formel für die Berechnung der genomischen Varianz. Diese Formel besitzt dieselbe Struktur wie die klassische und geläufige genetische Varianz und beinhaltet entsprechend der gewichteten Kovarianzen der Genotypen verschiedener Genorte, also das gewichtete Verknüpfungsungleichgewicht.

GIT: Welche Vorteile bringt der „Best Prediction“-Ansatz mit sich und wo sind seine Limitationen?

N. Schreck: Wir benutzen die zusätzlichen Informationen, die durch die phänotypischen Daten gegeben werden, um einen neuen Schätzer für die genomische Varianz mit mathematisch optimalen Eigenschaften herzuleiten. Unser Schätzer führt automatisch zu einer vollständigen Aufteilung und Zuordnung der beobachteten Variation im Phänotyp auf die Modellvariablen, beispielsweise das Genom oder Umweltfaktoren. Außerdem ist es möglich, den Anteil, den das Verknüpfungsungleichgewicht an der genomischen Varianz ausmacht, zu ermitteln. Der Schätzer kann in dieser Klasse von Modellen nicht weiter verbessert werden und führt dazu, dass der modellbasierte Anteil an der „missing heritability“ eliminiert wird. Der „Best Prediction“-Ansatz wird durch die Wahl des Modells und der zugehörigen Variablen beeinflusst. Dementsprechend kann es weiterhin modellbedingte „missing heritability“ geben, und die Übertragbarkeit des „Best Prediction“-Ansatzes auf andere Modellklassen muss noch untersucht werden.
 

GIT: Welche Veränderungen in der Genforschung erhoffen Sie und Ihre Kollegen sich, durch diese Erkenntnisse zu initiieren?

N: Schreck: Unsere Arbeit bietet die Grundlage für eine präzisere Berechnung der additiven genomischen Varianz und damit auch der Heritabilität in gemischten Modellen. Wie bereits erwähnt, haben wir Abweichungen in den Schätzergebnissen von bis zu 50 % festgestellt. Der genetische Anteil an der beobachteten Variation verschiedener Merkmale könnte also viel höher oder auch viel niedriger sein als bislang angenommen. Entsprechend könnte dies große Auswirkungen auf zukünftige Selektions- und Zuchtentscheidungen sowie womöglich auch auf Therapieformen im Bereich der Humangenetik haben. Wir erhoffen uns, dass unser Ansatz auch eine genauere Zuteilung der beobachteten Variation der Phänotypen auf spezifische Regionen des Genoms ermöglicht, was im Optimalfall zu neuen Erkenntnissen über das Zusammenwirken von Genen führen kann. Dies ist aktueller Forschungsgegenstand, und die bislang gewonnenen Erkenntnisse stimmen mich hoffnungsvoll, für baldige Antworten hinsichtlich dieser Fragestellung sorgen zu können.

GIT: Würden Sie sich als ausgebildeter Mathematiker eine verstärkte interdisziplinäre Forschungsarbeit mit Genetikern wünschen?

N. Schreck: Nicht zuletzt aufgrund der immer größer werdenden Datenmengen und den damit verbundenen Herausforderungen hat die Bedeutung der Mathematik in der Genetik in den letzten Jahren enorm zugenommen. Diese Entwicklung wird sich meiner Meinung nach auch in naher Zukunft fortsetzen. Unsere Arbeit ist einem interdisziplinären Projekt mit der Pflanzenzüchtung der TU München entsprungen, die für viele kleine motivierende Anstöße gesorgt hat. Für die Weiterentwicklung und Veröffentlichung des „Best Prediction“-Ansatzes haben wir selbst eine intensivere Zusammenarbeit mit Prof. Dr. Hans-Peter Piepho von der Abteilung Biostatistik der Universität Hohenheim gesucht. Durch den gegenseitigen Austausch und gemeinsamen Dialog eröffnen sich neue Perspektiven, die immense Synergieeffekte erzeugen können. Eine interdisziplinäre Zusammenarbeit kann für alle Parteien äußert fruchtvoll sein, und insbesondere auch die einzelnen Forschungsgebiete gemeinsam nach vorne bringen. Ich freue mich darauf, ab April selbst in der Abteilung für Biostatistik am Deutschen Krebsforschungszentrum in Heidelberg zu arbeiten, und hoffe, dass viele Mathematiker einen ähnlichen Weg einschlagen werden.

Das Interview führte Martin Friedrich, freier Redakteur der GIT Labor-Fachzeitschrift.

 

Weitere Informationen zu Dr. Nicholas Schreck

Dr. Nicholas Schreck hat an der Universität Mannheim Wirtschaftsmathematik studiert. Direkt im Anschluss hat er am Lehrstuhl für Stochastik und ihre Anwendungen eine Stelle als Wissenschaftlicher Mitarbeiter bei dem Projekt „Optimale Nutzung von DNA-Sequenzdaten“ angetreten und im Juni 2018 seine Promotion abgeschlossen. Nach 18 Monaten als Postdoc wird er ab April 2020 als Biostatistiker im Deutschen Krebsforschungszentrum in Heidelberg arbeiten.

 

Kontakt
Dr. Nicholas Schreck

Universität Mannheim
Lehrstuhl für Angewandte Stochastik
Institut für Mathematik
Mannheim, Deutschland
nschreck@mail.uni-mannheim.de

Kontaktieren

Universität Mannheim


Jetzt registrieren!

Die neusten Informationen direkt per Newsletter.

To prevent automated spam submissions leave this field empty.