Dekodierung kryptischer Translation

Identifizierung immunogener Proteine mittels systembiologischer Verfahren

  • Abb. 1: Characterisierung ribosomaler Translationsereignisse mittels Ribosomen-Profiling.Abb. 1: Characterisierung ribosomaler Translationsereignisse mittels Ribosomen-Profiling.
  • Abb. 1: Characterisierung ribosomaler Translationsereignisse mittels Ribosomen-Profiling.
  • Abb. 2: Prinzip der Identifikation zellulärer Translationsereignisse mittels PRICE.
  • Abb. 3: MHC-I- Peptidom-Analysen validieren neue zelluläre sORFs.

Das humane Genom beinhaltet etwa 20.000 proteinkodierende Gene. Welche Proteine und Polypeptide davon gebildet werden, lässt sich mittels Ribosomen-Profiling (Ribo-seq) präzise bestimmen. Dabei wurden in den letzten Jahren tausende kleiner neuer Genprodukte beschrieben. Die allermeisten davon sind offensichtlich aber sehr instabil und scheinen überwiegend regulatorische Aufgaben auf die Translation auszuüben.

Die Entwicklung von Hochdurchsatz-Sequenziertechnologien hat in den letzten zehn Jahren die biomedizinische Forschung revolutioniert. Mittels eleganter Verfahren zur Prozessierung biologischer Proben bieten diese Technologien viel mehr als die bloße Sequenzierung von Genomen oder RNA-Profilen. Eines dieser Verfahren ist das sogenannte Ribosomen-Profiling, mit dem sich Translationsaktivität genomweit und quantitativ auf Einzelnukleotidebene messen lässt [1]. Es beruht auf der Aufreinigung und anschließenden Klonierung und Sequenzierung kleiner mRNA-Fragmente (28-30 Nukleotide), die zum Zeitpunkt der Zelllyse gerade translatiert und somit im Ribosom vor RNAse-Verdau geschützt wurden. Die Translation der Ribosomen von Codon zu Codon hinterlässt dabei eine spezifische Signatur – eine Periodizität von drei Nukleotiden. Dies ermöglicht die Bestimmung der translatierten Codone sowie die der zugrunde liegenden offenen Leserrahmen (open reading frames, ORFs). Ribosomen-Profiling führte in den letzten Jahren zur Identifikation tausender neuer kleiner ORFs (sORFs) von weniger als 100 Aminosäuren Länge [2]. Mehr als die Hälfte unserer Gene enthalten solche sORFs. Deren experimentelle Validierung mittels massenspektrometrischer Analysen stellte sich als äußerst schwierig heraus. Auch in großen Proteom-Datensätzen lag die Anzahl detektierter Peptide aus sORFs weit unterhalb des statistischen Detektionslimits. Daher geht man davon aus, dass sORF-kodierte Polypeptide unmittelbar nach ihrer Translation wieder abgebaut werden und wohl als Polypeptide keine funktionale Relevanz haben. Interessanterweise beeinflusst aber der Prozess ihrer Translation die Translation auf der gleichen RNA weiter am 3’-Ende gelegener ORFs [3]. Diese sORF-bedingte translationale Regulation stellt einen wichtigen zellulären Regulationsmechanismus insbesondere bei zellulären Stressreaktion dar [4].

Probabilistische Analyse von Ribosomen-Profiling

Basierend auf der spezifischen Länge der sequenzierten mRNA-Fragmente sowie deren periodischem Muster auf den mRNAs wurden eine Reihe von Algorithmen entwickelt, um neue ORFs in Ribosomen-Profiling-Daten zu identifizieren [5,6].

Alle bisherigen Methoden konzentrierten sich dabei auf das Zusammenfügen und Bewerten der als translatiert identifizierten Codone. Für den ersten und fundamentalen Schritt, nämlich der Zuweisung der sequenzierten mRNA-Fragmente zu bestimmten Codonen, wurden bisher nur sehr einfache Ansätze verwendet. Diese resultieren in hohem Hintergrundrauschen. Als Folge können bisherige Methoden viele ORFs nicht vom Hintergrundrauschen unterscheiden. Hiervon sind insbesondere sich gegenseitig überlappende ORFs und ORFs mit nicht-kanonischen (non-AUG) Startcodonen betroffen.

In Abbildung 1 dargestellt ist die Translation einer mRNA von mehreren Ribosomen mit den jeweils gerade translatierten Codonen. Beim Ribosomen-Profiling werden nach Lyse der Zelle alle RNA Moleküle mittels RNase vertraut. Übrig bleiben nur noch die in den Ribosomen geschützten RNA Fragmente. Diese werden aufgereinigt und mit Hilfe von Next-Generation-Sequencing identifiziert. Nach Kartierung dieser Fragmente im Genom werden die translatierten Codone bioinformatisch bestimmt.

Der in diesem Artikel vorgestellte Ansatz beruht auf der Idee, dass der am Anfang der Probenherstellung durchgeführte RNase-Verdau, der die Länge und Position der mRNA-Fragmente bestimmt, ein stochastisches und somit modellierbares Ereignis darstellt (Abb. 2). Jedes Ribosomen-Profiling-Experiment liefert ein Spektrum an unterschiedlich großen RNA-Fragmenten (A). Diese entstehen durch stochastisch verteilte Schnitte an beiden Seiten des Ribosoms durch die eingesetzten RNase (B). Diese Verteilung lässt sich bioinformatisch beschreiben und im Folgenden ausnutzen um das translatierte Codon (P Stelle) mit hoher statistischer Wahrscheinlichkeit zu bestimmen. Dies führt zu einer substantiellen Verbesserung der Datenqualität (C). Dieses Modell erlaubt, die Menge der Codone zu schätzen, deren Translation mit der größten Wahrscheinlichkeit zu den sequenzierten RNA-Fragmenten geführt hat. Somit lässt sich effizient das experimentelle Hintergrundrauschen herausrechnen. Man erhält ein viel schärferes Bild zellulärer Translation bei substantiell besserer Ausnutzung des Datensatzes [7]. In humanen Bindegewebszellen konnten auf diese Weise über 4000 zelluläre sORFs in zwei unabhängigen Datensätzen aus verschiedenen Laboren reproduzierbar identifiziert werden.

Validierung neuer sORFs mittels MHC-I Peptidom-Analysen

Eines der Grundprinzipien unseres erworbenen Immunsystems ist die Peptidpräsentation durch MHC-I (Major histocompatibility complex I). Ständig werden von unseren Körperzellen Peptide von proteasomal abgebauten Proteinen an der Zelloberfläche präsentiert [8]. Fremdpeptide, z. B. von viralen Proteinen, können so von CD8 T-Lymphozyten erkannt und die infizierten Zellen eliminiert werden. Die Menge an Peptidpräsentation über MHC-I wird von der Translationsrate und nicht von der Gesamtmenge eines jeweiligen Proteins in der Zelle bestimmt. Die über MHC-I-Moleküle präsentierten Peptide, das sogenannte MHC-I-Peptidome lassen sich nach Aufreinigung der MHC-I-Moleküle mittels Massenspektrometrie bestimmen [9]. Im Gegensatz zu zellulären Proteinen sind die von sORFs translatierten Polypeptide extrem instabil und werden umgehend nach ihrer Translation vom Proteasom wieder abgebaut (Abb. 3). Sie sind daher in Gesamtproteomanalysen massenspektrometrisch nicht nachweisbar. Mittels der substantiell verbesserten Annotierung zellulärer sORFs mittels PRICE (hier im Vergleich zu den zwei bisher besten Algorithmen ORF-RATER und Rp-Bp dargestellt) konnten wir jetzt erstmals Peptide von sORFs in aufgereinigten MHC-I Molekülen mittels Massenspektrometrie nachweisen. So konnten wir die Expression hunderter zellulärer sORFs validieren. Anhand von MHC-I-Peptidomdaten konnten so erstmals zahlreiche Peptide von sORFs nachgewiesen werden. Diese Daten beweisen die Existenz hunderter zellulärer sORFs sowie deren schnellen, post-translationalen Abbau. MHC-I-Peptidom-Analysen erlauben somit die Validierung kryptischer Translationsereignisse [7].

Reannotierung des humanen Zytomegalievirus-Genoms

In einer wegweisenden Arbeit führte Ribosom-Profiling 2012 zu einer umfassenden Neu-Annotierung des Genoms des humanen Zytomegalievirus (HCMV) [10]. Ähnlich wie das Herpes simplex-Virus 1, dem Erreger des gewöhnlichen Lippenherpes, handelt es sich bei HCMV um ein Herpesvirus, das insbesondere bei immunsuppremierten Patienten, aber auch in der Schwangerschaft beim ungeborenen Kind, zu schweren, z. T. lebensbedrohlichen Infektionen führen kann [11]. Bisher ging man davon aus, dass HCMV mit seinem etwa 236000 Basenpaare großen DNA-Genom für etwa 170 verschiedene virale Proteine kodiert. Ribosom-Profiling bestätigte knapp 95 % der vorhergesagten viralen Gene, identifizierte aber mehr als 500 neue virale Proteine und Polypeptide, darunter etwa 250 sORFs. Diese Arbeit stellt das Verständnis viraler Genexpression auf den Kopf. Die hier vorgestellte Methode wurde genutzt, um die damals publizierten Daten erneut zu analysieren. Aufgrund der verbesserten Sensitivität dieses Ansatzes konnten alle 170 bekannten viralen Proteine validiert werden. Von den ca. 500 neuen Proteinen erwiesen sich allerdings knapp die Hälfte aller Voraussicht nach als Artefakte und hielten einer stringenten statistischen Überprüfung nicht stand. Interessanterweise führte die verbesserte Sensitivität unserer Methode aber zur Identifikation von etwa 500 anderen viralen ORFs. Hiervon werden etwa 200 ähnlich stark exprimiert wie die bisher bekannten viralen ORFs. Vergleichbare Daten konnten wir inzwischen für andere humane und tierpathogene Herpesviren erheben. Es ist daher davon auszugehen, dass Herpesviren noch viel umfassender als bisher angenommen ihre Wirtszellen zu ihrem Vorteil umprogrammieren.

Autoren
Florian Erhard1, Ralf Zimmer2, Lars Dölken1

Zugehörigkeit
1Institut für Virologie und Immunologie, Julius-Maximilians-Universität Würzburg, Würzburg, Deutschland
2Lehrstuhl für Praktische Informatik und Bioinformatik, Department für Informatik, Ludwig-Maximilians-Universität München, Deutschland

Kontakt 
Prof. Lars Dölken

Institut für Virologie und Immunologie
Julius-Maximilians-Universität Würzburg
Würzburg, Deutschland
Lars-doelken@uni-würzburg.de

Referenzen

[1] N. T. Ingolia, S. Ghaemmaghami, J. R. Newman, J. S. Weissman: Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling, Science 324, 218-223 (2009); DOI: 10.1126/science.1168978.

[2] J. I. Pueyo, E. G. Magny, J. P. Couso: New Peptides Under the s(ORF)ace of the Genome, Trends Biochem Sci, (2016); DOI: 10.1016/j.tibs.2016.05.003.

[3] K. Wethmar: The regulatory potential of upstream open reading frames in eukaryotic gene expression, Wiley Interdiscip Rev RNA 5, 765-778 (2014); DOI: 10.1002/wrna.1245.

[4] Shelley R. Starck, Jordan C. Tsai, Keling Chen, Michael Shodiya, Lei Wang, Kinnosuke Yahiro, Manuela Martins-Green, Nilabh Shastri, Peter Walter: Translation from the 5' untranslated region shapes the integrated stress response, Science 351, aad3867 (2016); DOI: 10.1126/science.aad3867.

[5] J. G. Dunn, J. S. Weissman: Plastid: nucleotide-resolution analysis of next-generation sequencing and genomics data, BMC Genomics 17, 958 (2016); DOI: 10.1186/s12864-016-3278-x.

[6] Brandon Malone, Ilian Atanassov, Florian Aeschimann Xinping, Li Helge Großhans, Christoph Dieterich: Bayesian prediction of RNA translation from ribosome profiling, Nucleic acids research, (2017); DOI: 10.1093/nar/gkw1350.

[7] Florian Erhard, Anne Halenius, Cosima Zimmermann, Anne L'Hernault, Daniel J Kowalewski, Michael P Weekes, Stefan Stevanovic, Ralf Zimmer, Lars Dölken: Improved Ribo-seq enables identification of cryptic translation events, Nat Methods, (2018); DOI: 10.1038/nmeth.4631.

[8] A. van Hateren, A. Bailey, T. Elliott: Recent advances in Major Histocompatibility Complex (MHC) class I antigen presentation: Plastic MHC molecules and TAPBPR-mediated quality control, F1000Res 6, 158 (2017); DOI: 10.12688/f1000research.10474.1.

[9] M. Bassani-Sternberg, S. Pletscher-Frankild, L. J. Jensen, M. Mann: Mass spectrometry of human leukocyte antigen class I peptidomes reveals strong effects of protein abundance and turnover on antigen presentation, Mol Cell Proteomics 14, 658-673 (2015); DOI: 10.1074/mcp.M114.042812.

[10] Noam Stern-Ginossar, Ben Weisburd, Annette Michalski, Vu Thuy Khanh Le, Marco Y. Hein, Sheng-Xiong Huang, Ming Ma, Ben Shen, Shu-Bing Qian, Hartmut Hengel, Matthias Mann, Nicholas T. Ingolia, Jonathan S. Weissman: Decoding Human Cytomegalovirus, Science 338, 1088-1093 (2012); DOI: 10.1126/science.1227919.

[11] D. M. Knipe, P. M. Howley: Fields virology, Wolters Kluwer/Lippincott Williams & Wilkins Health, Philadelphia, PA, ed. 6th, 2013, pp. 2 volumes.

Virtuelle Konferenz zur Proteomik

Kontaktieren

Julius-Maximilians-Universität Würzburg
Versbacher Str. 7
97078 Würzburg
Deutschalnd

Jetzt registrieren!

Die neusten Informationen direkt per Newsletter.

To prevent automated spam submissions leave this field empty.