Computational Biology

Hajk-Georg Drost

Die jüngste Entwicklung der Molekularbiologie zu einer datengesteuerten Disziplin hat dazu geführt, dass statistisches (maschinelles) Lernen nutzbar gemacht wird: um auf Basis der so gewonnenen Informationen Experimente zu entwickeln sowie um die kausalen Genregulationsmechanismen zu verstehen, die dem komplexen Verhältnis von Genotyp und Phänotyp unterliegen.
Wir verwenden statistische Ansätze in Form von intelligenter Software, die wir für den effizienten Einsatz in hochleistungsfähigen Cloud-Architekturen implementieren. Damit können wir unsere Untersuchung der natürlichen Variation auf den gesamten Lebensbaum und unser mechanistisches Verständnis der Genexpressionsregulation auf alle Gene eines eukaryotischen Organismus skalieren.

Intelligente Software ist adaptiv, skalierbar und nutzungsfreundlich; und wir machen mit ihrer Hilfe die Vorhersagefähigkeit künstlicher Intelligenz in einem holistischen molekularbiologischen Rahmen nutzbar. Unser Ziel ist es, die regulatorische Entwicklung der Genexpression für alle Gene eines eukaryontischen Organismus vorherzusagen und die molekularen Mechanismen der Genregulation mit phänotypischen Veränderungen komplexer Merkmale kausal in Verbindung zu bringen.

Wir nähern uns diesem wichtigen Ziel, indem wir vergleichende und funktionelle Genomik (skaliert auf den gesamten Baum des Lebens) mit kausalen Rückschlüssen auf Genregulationsnetzwerke verbinden, um einen allgemein anwendbaren Vorhersagerahmen für die Evolvierbarkeit von Merkmalen zu schaffen.

Wir haben Aspekte dieser Forschungsstrategie erfolgreich auf ein breites Spektrum biologischer Fragestellungen angewandt und verfeinern diesen Prozess ständig in Anpassung auf weitere molekularbiologische Anwendungen. Einen ausführlicheren Überblick über unsere wissenschaftlichen Software und früheren Forschungsfragen finden Sie auf unserer Seite Biological Research Portfolio (auf Englisch).

  • Wissenschaftliche Softwareentwicklung und HPC-Cloud-Computing
  • Statistisches (maschinelles) Lernen und kausale Inferenz
  • Theorie der Rückschlüsse auf genregulatorische Netzwerke und Evolution der Genregulation

Kollaborationspartner*innen

 

Publikationen

B Buchfink, K Reuter, HG Drost*. Sensitive protein alignments at tree-of-life scale using DIAMOND. Nature Methods, 18, 366–368 (2021).

I Moutsopoulos, L Maischak, E Lauzikaite, SA Vasquez Urbina, Eleanor C Williams, HG Drost, II Mohorianu. noisyR: Enhancing biological signal in sequencing datasets by characterising random technical noise. Nucleic Acids Research, 49 (14), e83 (2021).

Josué Barrera-Redondo*, Jaruwatana Sodai Lotharukpong, Hajk-Georg Drost* and Susana M Coelho*. Uncovering gene-family founder events during major evolutionary transitions in animals, plants and fungi using GenEra. bioRxiv, 2022.07.07.498977 (2022).

M Quint, HG Drost et al. A transcriptomic hourglass in plant embryogenesis. Nature 490 (7418), 89-101 (2012). (journal cover).

Zur Redakteursansicht