Nachrichten, Gerüchte, Meldungen und Berichte aus der IT-Szene

Redaktion: Heinz Schmitz


Auf Schatzsuche im Datenchaos

Gemeinsam mit Kollegen aus Belgien und Norwegen haben Wissenschaftler des Leibniz-Instituts für Analytische Wissenschaften (ISAS) in Dortmund womöglich ein großes Problem der modernen Lebenswissenschaften gelöst: die automatisierte Analyse großer Mengen von Proteom-Rohdaten, die oft ungenutzt in öffentlichen Datenbanken schlummern. Solche Daten genauer zu untersuchen, war bislang extrem kompliziert: zu viele Dateiformate, zu große Datenmengen. Eine neue Software kann die Daten automatisch in ein einheitliches Format umwandeln und auch gleich auswerten.

 

Gerade die so genannten Omics-Forschungsfelder produzieren mittels Hochdurchsatz-Techniken riesige Datenberge. Eine der wichtigsten Analysemethoden, vor allem im Bereich Proteomics, ist die Massenspektrometrie (MS): Sie wird genutzt, um aus großen Ansammlungen von Biomolekülen, etwa Zellen oder Geweben, die einzelnen Komponenten sowie deren Menge und Veränderungen zu ermitteln. Mittels Massenspektrometrie lassen sich die unterschiedlichen Bestandteile eines Gemisches nach ihrer Masse trennen, und das erlaubt wiederum eine Aussage über deren Konzentration und Zusammensetzung.

 

Dabei kommt es allerdings zu der paradoxen Situation, dass Wissenschaftler zwar unzählige Proben gleichzeitig analysieren, die entstehenden Daten aber oft nicht vollständig auswerten können. Um anderen Kollegen die Möglichkeit zu erneuten und weitergehenden Analysen (so genannten Re-Analysen) zu geben, werden die experimentellen Ergebnisse solcher Studien in der Regel auf Datenbanken wie „PRIDE“ (PRoteomics IDEntificationsdatabase) hochgeladen. Diese öffentlich zugänglichen „Repositories“ machen die Forschung transparent und vereinfachen den wissenschaftlichen Selbstregelungsprozess, bei dem Forschungsergebnisse und Studien von außenstehenden Wissenschaftlern geprüft und beurteilt werden – zumindest theoretisch. In der Praxis bleiben die Daten oft ungenutzt, und ihr Potenzial wird nicht erkannt.

 

Marc Vaudel, der am ISAS und am VIB Gent promoviert hat, glaubt, diese Lücke nun schließen zu können. Gemeinsam mit seinen Kollegen vom ISAS, dem VIB sowie der Universitäten in Gent und Bergen (weitere Projektpartner: siehe Hintergrundinfos) hat er das Programm „PeptideShaker“ entwickelt. Ursprünglich sollte die Software nur dazu dienen, die eigenen riesigen Datenmengen in den Griff zu bekommen, erklärt Dr. René Zahedi, der am ISAS die Arbeitsgruppe Systemanalyse leitet: „Als wir etwa im Jahr 2009 angefangen haben, „Peptide Shaker“ zu entwickeln, gab es nämlich noch keine andere Software zur qualitativ hochwertigen Analyse unserer vergleichsweise großen Datenmengen.“ Bald jedoch wurde den Wissenschaftlern bewusst, dass sie mit „Peptide Shaker“ eine Möglichkeit geschaffen hatten, auch Daten aus den öffentlichen Proteom-Datenbanken automatisch zu verwerten. Damit wird erstmals der gesamte Datenzyklus der Proteomanalyse abgedeckt.

 

Die Software nutzt nicht wie andere Programme nur einen Algorithmus, sondern gleich mehrere, so dass die von ihr erstellten Interpretationen und grafischen Auswertungen genauer und zuverlässiger werden. Im Gegensatz zu vielen anderen frei verfügbaren Programmen in diesem Bereich, so Zahedi, sei „PeptideShaker“ außerdem „wesentlich nutzerfreundlicher und leichter zu bedienen.“

 

Originalveröffentlichung:

„PeptideShaker enables reanalysis of MS-derived proteomics data sets“ ist in der Januar-Ausgabe von „Nature Biotechnology“ (Print: 12. Januar 2015; Online: 09. Januar 2015) DOI: 10.1038/nbt.3109

http://www.nature.com/nbt/journal/v33/n1/full/nbt.3109.html

 

 

Weitere Informationen unter:

http://de.wikipedia.org/wiki/Proteomik

http://www.isas.de

http://www.leibniz-gemeinschaft.de

Zurück