Bioinformatik

Prof. Dr. Andreas Hildebrandt

Die Gruppe von Prof. Dr. Andreas Hildebrandt konzentriert sich auf die Entwicklung und Anwendung moderner Bioinformatik-Techniken für verschiedene Forschungsfragen in den Lebenswissenschaften. Aktuelle Projekte der Gruppe umfassen Studien zu unterschiedlichen menschlichen Erkrankungen und deren Therapien. Aus methodischer Sicht umfasst die Expertise der Gruppe ein breites Spektrum von Computational Proteomics, Transcriptomics, struktureller Bioinformatik, Visualisierung bis hin zu Bild- und Volumenanalyse.

 

Im Rahmen des DIASyM-Forschungskerns wird die Gruppe Werkzeuge für die Auswertung massenspektrometrischer Rohdaten entwickeln, einschließlich geeigneter Strategien zur Speicherung und Verarbeitung der enormen Rohdatenmengen durch Methoden wie "local sensitive hashing". Neben klassischen Signalverarbeitungsmethoden werden modernste Methoden des maschinellen Lernens auf der Basis von tiefen neuronalen Netzen zur Analyse von proteomischen, metabolomischen und lipidomischen Daten eingesetzt.

Data Mining

Prof. Dr. Stefan Kramer

Prof. Dr. Stefan Kramer leitet die Data Mining Gruppe am Institut für Informatik der Johannes Gutenberg-Universität. Seine Gruppe wird im Rahmenvon DIASyM moderne Methoden entwickeln, um die vorverarbeiteten Datensätze mit Hilfe maschinellen Lernens zu analysieren. Zusätzlich müssen Verzerrungen berücksichtigt und reduziert werden, um nachvollziehbare und prinzipiell interpretierbare Ergebnisse zu generieren.

 

Das Teilprojekt konzentriert sich auf die differenzielle Analyse von Multi-OMICs-Daten im Zeitverlauf in Bezug auf eine bestimmte Zielvariable (z.B. ein Ereignis wie HF). Der Ansatz basiert auf Multi-View-Learning, wobei Proteomik, Metabolomik und Lipidomik jeweils eine Sicht auf die Daten darstellen. Andere Ansichten umfassen demografische Variablen und weitere Daten aus der jeweiligen Krankenakte des Patienten. Im Rahmen der Arbeitsschritte soll ein flexibler Umgang mit den Sichten und zeitlichen Informationen realisiert werden, ohne dass im Vorfeld zu viele Annahmen über die Integrationstiefe und die Relevanz bestimmter Zeitpunkte oder Zeitintervalle getroffen werden.

Knowledge Mining

Prof. Dr. Miguel Andrade

Prof. Dr. Miguel Andrade leitet die Arbeitsgruppe "Computational Biology and Data Mining" am Fachbereich Biologie der Johannes Gutenberg-Universität in Mainz. Seine Gruppe untersucht die Funktion von Genen mit Hilfe von Computertechniken, einschließlich Algorithmen und Datenbanken, um die zugrunde liegenden Krankheitsmechanismen besser zu verstehen und neue Behandlungsmethoden zu entwickeln.

 

In den letzten Jahren hat sich gezeigt, dass Lipide unter pathophysiologischen Bedingungen verändert werden und somit als Biomarker verwendet werden könnten. Es gibt jedoch nur sehr wenige öffentlich zugängliche Quellen. Im Rahmen des DIASyM-Konsortiums arbeiten Miguel Andrade und Laura Bindila eng zusammen, um eine Ressource zur Identifizierung von Krankheitsassoziationen von Lipiden durch Text- und Data-Mining zu entwickeln. Um dieses Ziel zu erreichen, werden Wörterbücher von Lipidnamen auf der Grundlage einer Literatursuche in PubMed Central erstellt. Mithilfe der Analyse des gemeinsamen Auftretens in grammatikalisch geparstem Text werden signifikante Muster abgeleitet, die die Beziehungen von Lipiden zu anderen Metaboliten, ihre physikalischen Wechselwirkungen und ihre Assoziationen mit menschlichen Krankheiten aufzeigen. Diese kuratierten Listen von Proteinen und öffentlichen Ressourcen der Proteinexpression werden an Plasma und chronische Herz-Kreislauf-Erkrankungen angepasst. Anschließend werden Gene, die mit diesen Phänotypen assoziiert sind oder in der CVD-Literatur signifikant erwähnt werden, sowie Krankheitsbegriffe identifiziert und zur Entwicklung von Methoden verwendet, die die Gen- und Proteinexpression speziell bei Herzinsuffizienz untersuchen. Mit dieser Strategie wird ein Krankheitsmodul-Ansatz für die Untersuchung von Patientensignaturen entwickelt, der Netzwerke mit mehreren Schichten einschließlich Lipiden, Metaboliten und Gen-/Proteinexpression schafft. Die Ergebnisse der Assoziationen aus Deep-Learning-Methoden und aus anderen relevanten systemmedizinischen Analysen werden in eine webbasierte Datenbank integriert. Die Nutzer werden Daten von Markern und die Auswertung von Probendaten eingeben und Vorhersagen über pathologische Zustände erhalten. Während der Laufzeit von DIASyM werden Daten aus mehreren Folgestudien zur Verfügung stehen, die zur Optimierung einer Methode zur Vorhersage von Ergebnissen auf der Grundlage von Zeitreihenanalysen von Netzwerken interagierender Moleküle unter Berücksichtigung von mit Krankheiten assoziierten Modulen verwendet werden.ata Mining am Fachbereich Biologie der Johannes Gutenberg-Universität in Mainz. In enger Zusammenarbeit mit der Gruppe von Dr. Laura Bindila wird Text- und Data-Mining zu den Interaktionen, dem Stoffwechsel und den Krankheitsassoziationen von Lipiden durchgeführt, da es nur sehr wenige öffentliche Ressourcen gibt. Auf der Grundlage einer Literatursuche in PubMed Central werden Wörterbücher mit Lipidnamen erstellt. Mithilfe der Analyse des gemeinsamen Auftretens in grammatikalisch geparstem Text werden signifikante Muster abgeleitet, die die Beziehungen von Lipiden zu anderen Metaboliten, ihre physikalischen Wechselwirkungen und ihre Assoziationen mit menschlichen Krankheiten aufzeigen. Diese kuratierten Listen von Proteinen und öffentlichen Ressourcen der Proteinexpression werden an Plasma und chronische Herz-Kreislauf-Erkrankungen angepasst. Anschließend werden Gene, die mit diesen Phänotypen assoziiert sind oder in der CVD-Literatur signifikant erwähnt werden, sowie Krankheitsbegriffe identifiziert und zur Entwicklung von Methoden verwendet, die die Gen- und Proteinexpression speziell bei Herzinsuffizienz untersuchen. Mit dieser Strategie wird ein Krankheitsmodul-Ansatz für die Untersuchung von Patientensignaturen entwickelt, der Netzwerke mit mehreren Schichten einschließlich Lipiden, Metaboliten und Gen-/Proteinexpression schafft. Die Ergebnisse der Assoziationen aus Deep-Learning-Methoden und aus anderen relevanten systemmedizinischen Analysen werden in eine webbasierte Datenbank integriert. Die Nutzer werden Daten von Markern und die Auswertung von Probendaten eingeben und Vorhersagen über pathologische Zustände erhalten. Während der Laufzeit von DIASyM werden Daten aus mehreren Folgestudien zur Verfügung stehen, die zur Optimierung einer Methode zur Vorhersage von Ergebnissen auf der Grundlage von Zeitreihenanalysen von Netzwerken interagierender Moleküle unter Berücksichtigung von mit Krankheiten assoziierten Modulen verwendet werden.