Bioinformatik Core Facility

Leistungen

Unser Leistungsangebot schließt Analytik, SaaS (Serviceleistung Software) PaaS (Serviceleistung Plattform), IaaS (Serviceleistung Infrastruktur) ein. Von der Batch-Primer-Entwicklung bis zur Netzwerkassemblierung und Big Data-Analyse mit Hilfe unseres host-basierten institutsinternen Genom-Browsers bieten wir jede Art von Bioinformatik-Support an.

Analytik

Unsere Leistungen im Bereich Analytik beginnen mit dem Support der Versuchsentwicklung; hier helfen wir Forschern dabei, die richtigen Technologien und Methoden für ihre wissenschaftlichen Ansprüche zu finden. Wir ermutigen jeden Forscher, sich vor der Generierung von Versuchsdaten an die  Serviceeinheit Bioinformatik zu wenden.

Die Datenanalyse beginnt meist mit der Anwendung von Open-Source-Software (zum Beispiel Tuxedo Suite für die RNA-Sequenzanalyse). Die Wahl der Software erfolgt hauptsächlich unter Einbeziehung der biologischen Fragestellungen, denen der Forscher nachgeht, der Dokumentation früherer Publikationen und der entsprechenden Nutzergemeinschaft.

Bei Bedarf entwickelt die Serviceeinheit die notwendigen Tools für eine erfolgreiche Datenanalyse (siehe auch SaaS). Je nachdem, was der Wissenschaftler braucht, führen wir entweder eine End-to-End-Analyse durch oder überprüfen, während seine eigene Analyse läuft, diese auf Fehler.

Wir bieten Spezial-, aber auch Full-Discovery-Analytik an. Neben der Beantwortung konkreter Fragen von Wissenschaftlern zu einem bestimmten Thema (zum Beispiel wie microRNA-Veränderungen mit Veränderungen der Genexpression in Proteine kodierenden Genen korreliert sind) führen wir auch Langzeitanalysen durch, bei denen alle nur möglichen Daten aus bestehenden Datensätzen extrahiert werden.

Weil wir wie Entwickler denken, wenden wir für ähnliche Datensätze ähnliche Analysemethoden an, was außerordentlich kurze Umsatzzeiten zur Folge hat.

Wir liefern die Ergebnisse unserer Analyse fortlaufend, um sicherzustellen, dass die Wissenschaftler den Analyseweg jederzeit nachvollziehen bzw. ändern können.

Unser Analyse-Portfolio wächst mit jeder Woche entsprechend den Bedürfnissen der Forscher. Wir sind daher auf keine spezielle Technologie beschränkt oder fokussiert.

SaaS

Ein Großteil unserer Arbeit besteht darin, ausgehende Daten in für eine vollständige Datenanalyse erforderliche nachgeschaltete Software zu integrieren und Tools zur Ausweitung der Anwendung bereits existierender Software zu entwickeln. Dies führt naturgemäß zur Entwicklung neuer Bioinformatik-Tools.

Der für die angeforderte Analyse verwendete und entwickelte Code wird täglich aktualisiert und allen an dem jeweiligen Projekt beteiligten Wissenschaftlern über institutsinterne host-basierte GitLab-Server zur Verfügung gestellt (siehe auch PaaS).

Unter der Voraussetzung, dass die ausgehenden Daten der Rechner bekannte Formate aufweisen, wird On-demand-Software für Routineanalysen und/oder -prozesse (zum Beispiel Hochdurchsatzsysteme) entwickelt.

Auf Anfrage werden Wrapper Tools für Galaxy entwickelt (siehe auch PaaS).

Unsere Serviceeinheit Bioinformatik steht Wissenschaftlern, die bei der Entwicklung ihres eigenen Codes Unterstützung benötigen, stets mit Rat und Tat zur Seite.

Wir verfügen über zwei Endgeräte, die Software-Entwickler und Systemanalytiker für definierte Projekte und Zeiträume bzw. Wissenschaftler, die Unterstützung benötigen oder ihre rechnergestützte Arbeit in einer Bioinformatikumgebung laufen lassen möchten, nutzen können.

PaaS

Diese Serviceeinheit bietet und verwaltet eine Vielzahl von Plattformen, Datenbanken und Ausführungsumgebungen, darunter folgende:

  • Galaxy, eine ohne Code nutzbare Programmierplattform zur Entwicklung und gemeinsamen Nutzung biologischer Analyse-Pipelines

  • RStudio Server, eine interaktive, web-basierte Version der gängigen Statistik-Programmiersprache R

  • GitLab, eine Plattform zur Code-Versionierung und gemeinsamen Code-Nutzung

  • High-Performance-Computing-Cluster, ein von dem gängigen Aufgabenverteilungssystem SLURM verwalteter HPC-Cluster, bei dem mittels eines Environment-Modul-Systems auf die gesamte Software zugegriffen werden kann, wodurch wir Probleme zentral erkennen und lösen sowie den Nutzern ausgetestete Software zur Verfügung stellen können

  • Datenbanken (zum Beispiel Nukleotide, Proteine, Motive, Genome und die entsprechenden Indizes

IaaS

In enger Zusammenarbeit mit der IT-Abteilung und unterstützt vom Systemadministrator unserer Serviceeinheit stellen wir sicher, dass kein Projekt durch die Rechnerleistung oder eine andere Art von IT-Infrastruktur eingeschränkt wird.

Unsere HPC-Clusterknoten werden von einem verteilten parallelen Dateisystem (BeeGFS), das in einem InfiniBand-Netzwerk läuft, unterstützt. Die Knoten besitzen mindestens 40 Prozessoren und 512 GB Speicherkapazität.

Wir stellen sicher, dass wir bei 80 % der Jobs innerhalb von 20 Minuten und bei 98 % der Jobs innerhalb von 3 Stunden nach Beauftragung mit der Bearbeitung beginnen und ihre Erledigung mit maximaler Leistung erfolgt.