Kombination unterschiedlicher Sequenzier-, Assemblierungs- und Kartierungsansätze

Erstellung einer verlässlichen Genomkarte für eine neue aquatische Kulturpflanze

  • Abb.1: S. polyrhiza auf Nährmedium wachsend (links), und eine Metaphasezelle mit 40 Chromosomen (rechts).Abb.1: S. polyrhiza auf Nährmedium wachsend (links), und eine Metaphasezelle mit 40 Chromosomen (rechts).
  • Abb.1: S. polyrhiza auf Nährmedium wachsend (links), und eine Metaphasezelle mit 40 Chromosomen (rechts).
  • Abb.2: Lokalisierung der Pseudomoleküle 04 und 08 auf mitotischen Chromosomen von S. polyrhiza. Vereinigte BAC-Proben für die Pseudomoleküle 04 (Texas Red, rot) und 08 (Cy3, gelb) markieren zwei verschieden Chromosomenpaare (und nicht ein Paar, wie die optische Karte vorschlug [5]). Das Ergebnis ist gleich für die sieben untersuchten Klone verschiedener geographischer Herkunft. Die Chromosomen sind DAPI-gefärbt; Balken = 5 µm.
  • Abb.3:  Der vollständige Karyotyp des S. polyrhiza Klons 9509. Sequentielle Vielfarb-FISH mit 20 chromosomen-spezifischen BAC-Proben zeigt die vorhergesagten Pseudomolekül-Kopplungen für jedes Chromosom auf der gleichen Metaphasezelle. Das rechte Bild zeigt Signale für 18S und 26S ribosomale DNA auf Chromosom 1 (rot) und für 5S rDNA auf Chromosom 13 (gelb). Die Chromosomen sind DAPI-gefärbt; Balken = 5 µm.
Mit aktuell verbesserten Next Generation Sequencing Technologien können vollständige Genome innerhalb eines Tages sequenziert werden. Jedoch birgt jede der Sequenziertechniken auf Grund spezifischer Charakteristika besondere Herausforderungen bezüglich der de novo Sequenzassemblierung in eine hochwertige Genomkarte. Durch Kombination verschiedener Sequenzier-, Assemblierungs- und Kartierungsansätze ist eine ‚Goldstandard’-Genomkarte erreichbar, sogar wenn genetische Karten nicht verfügbar sind, z.B. für die vielwurzlige Teichlinse, Spirodela polyrhiza, eine potentielle aquatische Kulturpflanze mit nahezu ausschließlich asexueller Vermehrung.
Wasserlinsen sind kleine, an der Wasseroberfläche schwimmende Organismen, gekennzeichnet durch den schnellsten Biomassezuwachs unter den Blütenpflanzen und stark reduzierte und miniaturisierte Organe. Die Familie der Wasserlinsen (Lemnaceae) umfasst fünf Gattungen mit 37 Arten: Spirodela mit zwei, Landoltia mit einer, Lemna mit dreizehn, Wolffiella mit zehn und Wolffia mit elf Arten. Spirodela ist phylogenetisch die älteste, und Wolffia die jüngste Gattung [1]. Die evolutionär jüngeren Gattungen weisen eine reduzierte Organismengröße (von 1,5 cm auf <1 mm) und eine zunehmende Genomgröße (von 160 Mbp auf 2203 Mbp) auf [2].
 
Wasserlinse mit geringer Genomgröße
Als erste Wasserlinsenart wurde auf Grund ihrer basalen phylogenetischen Position, ihres ökonomischen Potentials und ihrer geringen Genomgröße (160 Mbp) die weitgehend asexuelle Art Spirodela polyrhiza (Abb. 1), ausgewählt. Die Genomassemblierung für den Klon 7498 wurde durch Integration von Roche 454- und Sanger ABI-3730XI- generierte Sequenzen, von BAC- und Fosmid ‚paired ends’, von 24 vollständigen Fosmiden sowie durch Fingerprinting der BAC-Bibliothek erreicht und resultierte in 32 Pseudomolekülen >1 Mbp, die mehr als 90% des Genoms einschließen [3].
Die 32 Pseudomoleküle wurden mittels sequentieller Vielfarb-Fluoreszenz-in situ Hybridisierung (mcFISH) mit 96 genomisch verankerten BACs als Proben validiert und in die 20 S.

polyrhiza Chromosomen integriert [4]. Drei Pseudomoleküle erwiesen sich auf Grund von Fehlassemblierung als chimärisch.

Das Genom eines weiteren S. polyrhiza Klons (9509) wurde über eine Kombination von Illumina Sequenzierung (95-fache Genomabdeckung durch 180 und 500 bp paired end reads, sowie 2, 5 und 20 kb mate pair Bibliotheken) und optischer Hochdurchsatz-Kartierung mittels des BioNano Genomics Systems Irys assembliert [5]. Nach Verdau hochmolekularer DNA mit geeigneten Restriktionsnickasen und Markierung der nicks durch Auffüllen mit markierten Nukleotiden werden die Moleküle in Nanokanälen gestreckt und mittels spezifischer Algorithmen zu einer optischen Genomkarte zusammengesetzt.
Auf Grund mehrerer Diskrepanzen zwischen der cytogenetischen Karte für Klon 74984 und der optischen Karte für Klon 9509 [5] differierte die chromosomale Zuordnung der Pseudomoleküle und in Folge die Chromosomennummerierung für 18 der 20 Chromosomen. Diese Diskrepanzen könnten durch Klon-spezifische Chromosomenumbauten, durch Mis-assembly eines der Genome und/oder durch zu geringe Markerdichte in der cytogenetischen Karte bedingt sein.
 
mcFISH-Experimente
Daraufhin wurden mcFISH-Experimente-Serien mit 108 genomisch zugeordneten BACs für die chromosomale Sequenz-Zuordnung in sieben S. polyrhiza-Klonen (einschließlich der Klone 7498 und 9509) eingesetzt. Alle Diskrepanzen zwischen den früheren Karten wurden aufgelöst und vier weitere Pseudomoleküle erwiesen sich als Chimären. Die Unterschiede in den früheren Karten basierten auf Fehlzuordnungen bzw. Unvollständigkeit, jedoch nicht auf Chromosomenumbauten zwischen den Klonen (als Beispiel s. Abb. 2). Die zusätzliche Integration von Oxford Nanopore-Sequenz-Zuordnungen, die auf längeren gelesenen Fragmenten beruhen als mit den früheren Sequenziertechniken erreicht wurde, bestätigte und erweiterte die mcFISH-Resultate. Die Kombination von fünf Ansätzen (454-, Illumina-, Oxford Nanopore-Sequenzzuordnung, optische Kartierung und FISH-Kartierung) ermöglichte Korrektur und Revision verschiedener Kopplungsgruppen, die in den vorangegangenen Einzelansätzen fehlerhaft zugeordnet oder interpretiert worden waren. Darüber hinaus bestätigte FISH mit Proben ribosomaler DNA zwei 5S rDNA-Loci mit unterschiedlichen Kopiezahlen (60 versus 12 Kopien) für S. polyrhiza, wie durch Oxford Nanopore Sequenzassemlierung postuliert worden war. Schließlich erlaubten sequentielle mcFISH-Experimente mit distinkten Kombinationen von 101 in den 38 Pseudomolekülen bzw. Pseudomolekülfragmenten verankerten BACs in einer einzigen Metaphasezelle alle 20 Chromosomenpaare spezifisch zu markieren (Abb. 3). Diese Resultate zusammen verbesserten und aktualisierten die Genomkarte von S. ployrhiza als Referenz für vergleichende Genomkartierungen anderer Wasserlinsenarten [6] und bewiesen die Nützlichkeit cytogenetischer und ‚long-read’ Sequenzieransätze für die Bewertung und Korrektur von genomischen Sequenzassemblierungen [7].
 
Zusammenfassung
Generell erzeugen Techniken, die kurze Lesesequenzen hervorbringen (z.B. Illumina) qualitative hochwertige Sequenzen, während Techniken die lange Lesesequenzen ergeben (PacBio oder Oxford Nanopore) weniger genau sind, dafür aber zu längeren ‚contigs’ und weniger Lücken führen. Der cytogenetische Ansatz (FISH) kann die längsten Distanzen überspannen und wird nicht durch repetitive Sequenzen gestört, die oft die contig-Verknüpfung unterbrechen. Vor allem ermöglicht einzig der cytogenetische Ansatz eine unabhängige direkte (mikroskopische) Kontrolle der Ergebnisse von anderen Assemblierungs- und optischen Kartierungsansätzen. Obwohl FISH arbeitsintensiv und zeitaufwendig ist und eine end-sequenzierte BAC-Bibliothek erfordert, ist dieser Ansatz für die Bewertung der Genomassemblierung von erheblicher Bedeutung, vor allen bei Arten für die genetische Karten kaum zu erhalten sind, da sie sich weitgehend oder ausschließlich asexuell vermehren wie die große Teichlinse und andere Wasserlinsenarten. In den meisten Fällen erfordert ein „Goldstandard“-Referenzgenom mit Auflösung auf chromosomaler Ebene mehr als zwei unabhängige Ansätze zu Erzeugung von zuverlässigen Genomsequenzkarten.
 
 

Autoren
Phuong Thi Nhu Hoang1 und Ingo Schubert1

Zugehörigkeit
1 Leibniz-Institut für Pflanzengenetik und Kulturpflanzenforschung (IPK), OT Gatersleben, Seeland, Deutschland

Kontakt
Prof. Dr. Ingo Schubert

Leibniz-Institut für Pflanzengenetik und Kulturpflanzenforschung (IPK)
OT Gatersleben
Seeland, Deutschland
schubert@ipk-gatersleben.de

Mehr Artikel!

Literatur

[1] Tippery, N. P., Les, D. H. & Crawford, D. J. Evaluation of phylogenetic relationships in Lemnaceae using nuclear ribosomal data. Plant biology 17 Suppl 1, 50-58, doi:10.1111/plb.12203 (2015).

[2] Hoang, P. T. N., Schubert, V., Meister, A., Fuchs, J. & Schubert, I. Variation in genome size, cell and nucleus volume, chromosome number and rDNA loci between duckweed genera.  (submitted).

[3] Wang, W. et al. The Spirodela polyrhiza genome reveals insights into its neotenous reduction fast growth and aquatic lifestyle. Nature communications 5, 3311, doi:10.1038/ncomms4311 (2014).

[4] Cao, H. X. et al. The map-based genome sequence of Spirodela polyrhiza aligned with its chromosomes, a reference for karyotype evolution. The New phytologist 209, 354-363, doi:10.1111/nph.13592 (2016).

[5] Michael, T. P. et al. Comprehensive Definition of Genome Features in Spirodela polyrhiza by High-Depth Physical Mapping and Short-Read DNA Sequencing Strategies. The Plant journal : for cell and molecular biology, doi:10.1111/tpj.13400 (2017).

[6] Hoang, P. T. N. & Schubert, I. Reconstruction of chromosome rearrangements between the two most ancestral duckweed species Spirodela polyrhiza and S. intermedia. Chromosoma 126, 729-739, doi:10.1007/s00412-017-0636-7 (2017).

[7] Hoang, P. N. T. et al. Generating a high-confidence reference genome map of the Greater Duckweed by integration of cytogenomic, optical mapping and Oxford Nanopore technologies. The Plant journal : for cell and molecular biology, doi:10.1111/tpj.14049 (2018).

 

Kontaktieren

Leibniz Institute of Plant Genetics and Crop Plant Research (IPK)


Jetzt registrieren!

Die neusten Informationen direkt per Newsletter.

To prevent automated spam submissions leave this field empty.