Ist das menschliche Virom ein potenzieller Faktor der Infektionsanfälligkeit?

Worum geht es in diesem Forschungsprojekt?

Bioinformatik-Workflow für die Entdeckung viraler Sequenzen in primären Sequenzierungsdaten unter Verwendung eines Hochleistungs-Computerclusters.

Worum geht es in diesem Forschungsprojekt?

Wir untersuchen die genetische Vielfalt der Virussphäre auf verschiedenen Ebenen, um die Vielfalt der Viren sowohl bei Eukaryonten als auch innerhalb des menschlichen Viroms besser zu verstehen. Mithilfe eines von uns entwickelten, auf Hochleistungscomputern basierenden Ansatzes zur Entdeckung von Viren suchen wir in Sequenzierungsdaten bekannte und unbekannte viraler Sequenzen, einschließlich hochgradig divergenter Viren ohne nahe Verwandte in Referenzdatenbanken. Wir wenden diesen Ansatz auf sehr große Mengen veröffentlichter Sequenzierungsdaten und auf unveröffentlichte Daten von Patientenkohorten an, um interindividuelle Unterschiede in der Zusammensetzung des Viroms zwischen kranken und gesunden Personen auszumachen.
Darüber hinaus versuchen wir, unseren Virusentdeckungsansatz auf Tierviren auszuweiten, um Primaten- und andere Wirbeltierarten zu identifizieren, die unbekannte Verwandte humanpathogener Viren beherbergen, was die Grundlage für die Entwicklung neuer Tierinfektionsmodelle bilden könnte.
Zudem sind wir am Projekt A1 beteiligt, in dem wir die genetischen Determinanten einer schweren Infektion mit dem humanen respiratorischen Synzytial-Virus (RSV) bei Säuglingen untersuchen.

Wie ist der Stand der Dinge?

Wir haben einen Hochleistungs-Computing-Workflow für die Entdeckung von viralen Sequenzen in unbearbeiteten Next Generation Sequencing (NGS)-Daten entwickelt. Diesen haben wir ursprünglich für die Suche nach neuartigen RNA-Viren in veröffentlichten NGS-Daten aus dem Sequence Read Archive (SRA)-Repository erarbeitet. Bislang konnten wir etwa 500.000 SRA-Datensätze screenen, die das gesamte Spektrum der verfügbaren eukaryotischen Transkriptome abdecken, dabei haben wir zahlreiche Sequenzen von bekannten und unbekannten RNA-Viren entdeckt.

Darüber hinaus haben wir etwa 76.000 menschliche SRA-Experimente mit verfügbaren Gewebe-/Organ-Annotationen analysiert, wodurch wir unter anderem zahlreiche bekannte und neuartige Anelloviren identifizieren konnten. Dabei war es uns möglich, häufig die Genome von Dutzenden von Viren in derselben Probe nachzuweisen. Das deutet darauf hin, dass innerhalb einer einzelnen Person virale Gemeinschaften existieren können. Diese Studien – und insbesondere die Analysen, die darauf abzielen, mögliche Zusammenhänge mit Gesundheit und Krankheit aufzudecken – sind noch nicht abgeschlossen.

Phylogenetischer Baum der menschlichen und tierischen Anellovirus ORF1-Proteine.

Was sind die Projektziele?

Unser Ziel ist es, das menschliche Virom als potenziellen Faktor für die Anfälligkeit für Infektionen sowie als mögliche Ursache für andere Krankheiten zu untersuchen, einschließlich primärer Immundefekte. Zu diesem Zweck wollen wir die Anzahl und Vielfalt der mit dem Menschen assoziierten Viren so umfassend und gewebespezifisch wie möglich bestimmen. Wir gehen davon aus, dass die Identifizierung interindividueller Unterschiede in der Zusammensetzung des Viroms neue Erkenntnisse über die Anfälligkeit für oder den Verlauf von Krankheiten liefern wird. Wir versuchen auch, tierische und andere eukaryotische Viren zu entdecken, die mit menschlichen Viren verwandt sind. So können wir untersuchen, wie sich Viren entwickeln, anpassen und auf neue Wirte überspringen.

Wie kommen wir da hin?

Wir werden unser Screening des SRA-Repository ausweiten, um viele weitere der Millionen von verfügbaren Humanexperimenten zu analysieren. Ergänzend dazu haben wir innerhalb von RESIST Kooperationen initiiert, um das Virom von Patientinnen und Patienten mit primären Immundefekten und von Frühgeborenen zu analysieren. Um die Empfindlichkeit unseres Ansatzes zur Entdeckung von Viren zu verbessern, haben wir mit der Entwicklung einer neuen Methode begonnen, die auf künstlichen neuronalen Netzen basiert. Wir beziehen Sequenzinformationen sowie Informationen über sekundäre und tertiäre Proteinstrukturen ein, die mit Methoden wie AlphaFold vorhergesagt werden. Wir erwarten, dadurch in der Lage zu sein, stark abweichende virale Sequenzen in NGS-Daten zu identifizieren, die in früheren ausschließlich auf Sequenzhomologie basierten Analysen unentdeckt blieben.

Proteinstruktur der viralen RNA-Polymerase von SARS-CoV-2 und des entfernt verwandten Ball-Python-Nidovirus.

Leitung des Projekts A6

Computergestützte Virologie

Prof. Dr. Chris Lauber

Project: A6

Publikationen des Projektes A6

Publikationen 2024

Deep mining of the Sequence Read Archive reveals major genetic innovations in coronaviruses and other nidoviruses of aquatic vertebrates. Lauber, C., X. Zhang, J. Vaas, F. Klingler, P. Mutz, A. Dubin, T. Pietschmann, O. Roth, B. W. Neuman, A. E. Gorbalenya, R. Bartenschlager, and S. Seitz. 2024. PLoS Pathog 20: e1012163.

Publikationen 2022

Opportunities and Challenges of Data-Driven Virus Discovery. Lauber C, Seitz S. Biomolecules. 2022 Aug 4;12(8):1073.

Publikationen 2021

HBV evolution and genetic variability: Impact on prevention, treatment and development of antivirals. Glebe D, Goldmann N, Lauber C, Seitz S. Antiviral Research

Conservation of the HBV RNA element epsilon in nackednaviruses reveals ancient origin of protein-primed reverse transcription. Beck J, Seitz S, Lauber C, Nassal M. Proceedings of the National Academy of Sciences 2021.

Initial HCV infection of adult hepatocytes triggers a temporally structured transcriptional program containing diverse pro- and anti-viral elements. Tegtmeyer B, Vieyres G, Todt D, Lauber C, Ginkel C, Engelmann M, Herrmann M, Pfaller CK, Vondran FWR, Broering R, Vafadarnejad E, Saliba AE, Puff C, Baumgärtner W, Miskey C, Ivics Z, Steinmann E, Pietschmann T, Brown RJP. Journal of Virology 2021.

Bioinformatics of virus taxonomy: foundations and tools for developing sequence-based hierarchical classifications. Gorbalenya AE and Lauber C. Current Opinion in Virology 2021.

Deep mining of the Sequence Read Archive reveals bipartite coronavirus genomes and inter-family Spike glycoprotein recombination. Lauber C, Vaas J, Klingler F, Mutz P, Gorbalenya AE, Bartenschlager AE, Seitz S. bioRxiv 2021.

Publikationen 2020

Liver-expressed Cd302 and Cr1l limit hepatitis C virus cross-species transmission to mice. Brown RJP, Tegtmeyer B, Sheldon J, Khera T, Anggakusuma, Todt D, Vieyres G, Weller R, Joecks S, Zhang Y, Sake S, Bankwitz D, Welsch K, Ginkel C, Engelmann M, Gerold G, Steinmann E, Yuan Q, Ott M, Vondran FWR, Krey T, Stroeh LJ, Miskey C, Ivics Z, Herder V, Baumgaertner W, Lauber C, Seifert M, Tarr AW, McClure CP, Randall G, Baktash Y, Ploss A, Loan Dao Thi V, Michailidis E, Saeed M, Verhoye L, Meuleman P, Goedecke N, Wirth D, Rice CM, Pietschmann T. Science Advances 2020.

Publikationen des Projektes A6