Ein Haufen Daten und doch kein Müll: Das ENCODE-Projekt

Traditionell werden wissenschaftliche Ergebnisse zu einem Projekt aus einem Labor zu einem Manuskript zusammengefasst, an ein Magazin zum Begutachten geschickt, und eines schönen Tages publiziert. Was passsiert aber, wenn 442 Autoren aus über 100 verschiedenen Instituten und Universitäten 147 verschiedene Zelltypen untersuchen? Es entsteht die Enzyklopädie der DNA-Elemente (ENCODE), deren zweite Phase jetzt auf einen Schlag in 30 Papers publiziert wurde.
Im ENCODE Projekt wurde systematisch untersucht, welche Teile der DNA tatsächlich in RNA transkribiert werden, wie dies mit bekannten Transkriptionsfaktoren zusammenhängt, also Proteine, die an DNA binden und so die Transkription beeinflussen, wie sich das Chromatin, zwischen den Zelllinien unterscheiden und  wie spezifisch die Histone modifiziert sind (Histone sind Proteinkomplexe, um die die DNA gewickelt ist). Schon dieser Satz mit sechs Kommas macht Mühe zu lesen. Wie soll man dann verstehen was bei dem ENCODE Projekt rauskam?
Die Autoren fassen es in dem Hauptpaper in Nature so zusammen:  “These data enabled us to assign biochemical functions for 80% of the genome, in particular outside of the well-studied protein-coding regions.” Anders ausgedrückt: Die DNA, die zwischen den Genen liegt (rund 98% der Gesamt-DNA, im Jargon “Junk-DNA”) hat regulatorische Funktion. Sie beeinflusst direkt und indirekt wann und wie stark Gene abgelesen werden, und ermöglicht dadurch einerseits die große Diversität von Zelltypen und andererseits auch spezifische Antworten von Zellen auf externe Reize.
Die Ergebnisse einer dermaßen umfangreiche Studie können unmöglich in Textform einem einzelnen Artikel akkurat zusammengefasst werden. Nature hat das auch erkannt, und bietet ein nettes Visualisierungstool zu den jetzt publizierten ENCODE Ergebnissen an. Man kann dort in 13 verschiedenen Handlungssträngen die Ergebnisse der Studie nachvollziehen. Das ganze gibts auch als iPad/iPhone App. Und wer eine etwas skeptischere Analyse der Ergebnisse direkt vom Koordinator des Projects und gleichzeitig verantwortlicher Autor des Nature Papers lesen will, ist mit dem Blogartikel von Ewan Birney gut bedient.

Die etwas andere graphische Darstellung der Ergebnisse kommt von Luisa Lente. Sie hat das Cover der Ausgabe von Genome Research im Miró-Stil designt (hier links). In dieser Ausgabe sind glaube ich 16 der 30 Papers veröffentlicht. Luisa und Hagen (Erstautor des Tilgner et al. Papers) haben lange hier in Barcelona gewohnt und auch sonst sind die Papers mit Autoren aus meinem persönlichen Umfeld gespickt. Glückwunsch an dieser Stelle, ich werde mich jetzt gleich zur ENCODE Beer Session in Richtung Strand aufmachen, vielleicht kann ich später noch ein paar Fotos von Autoren nachreichen :-).

 

Edit 20:30.
Hier ein paar Fotos von der Feier.

Autoren: Paolo vor Poster, Sara mit Kind und Tom Gingeras, Colin mit Tom Gingeras

Roderic Guigó und Tom Gingeras vor Luisas Poster

Im Innenhof

Beteilige dich an der Unterhaltung

29 Kommentare

  1. “f1-medium” scheint ein schöner Name für ein Verzeichnis, jedoch keiner für ein einzelnes Bild zu sein. Zumindest ist mir nicht bekannt, daß der Miró-Stil sich dadurch auszeichne, daß weiß auf weiß gemalt wird 😉
    Bei blogs.discovermagazine.com/notrocketscience/2012/09/05/encode-the-rough-guide-to-the-human-genome/ kam heute eine hübsche Übersicht.

  2. @Tobias ebenfalls kei Bild. Ich denke es ist vielleicht ein gif.
    PS mit dem Müll kommt nicht sehr deutlich raus. Nur hier “Die DNA, die zwischen den Genen liegt (rund 98% der Gesamt-DNA) hat regulatorische Funktion.” Wenn man mitdenkt, aber das sollte man ja sowieso.

  3. @Tobias
    Ich seh auch kein Bild (Firefox 15.0) und dein Screenshot link bringt mich zu einer Seite die mir dann “404 – file not found” meldet.
    Hatte ich in ein zwei anderen Blog artikel auch schon. Ich schiebs mal auf die Umstellung (oder die Firewall in meinem Institut).
    Schönen Tag noch,
    nastes

  4. roel,
    ja, ich habs aber als .jpg exportiert.
    Gerade habe ich es noch mal anders eingebaut. Wenns jetzt nicht geht, weiss ich auch nicht weiter und wir müssen warten, bis WP normal läuft.
    Im Blogticker erscheint mein Post auch nicht….

  5. roel, “PS mit dem Müll kommt nicht sehr deutlich raus.”
    Habe noch einen Halbsatz einefügt, danke.

  6. @Tobias Noch 5 Fotos von der Party. Nur im Blocktiicker funktioniert es noch nicht.
    Noch mal zu der Junk-DNA, die wird dann doch bestimmt umgetauft, wenn sie regulierende Funktionen hat.

  7. Der Begriff “Junk-DNA” ist sicher eher zu einem Begriff der Medien geworden. Korrekter wäre: Intergenische DNA, Introns und Telomere. ENCODE spricht jetzt davon das 80% davon “functional” sind, also irgendeine Rolle bei der Genregulation spielen. Das DNA Abschnitte außerhalb der eigentlichen Gene bei deren Regulation eine Rolle spielen ist aber nichts neues. Neu ist der globale Ansatz.
    (Kommentar editiert 23:25)

  8. Aus SIcht eines Informatikers könnte sich die Sache so darstellen, dass diejenige Datenbasis, die den Mensch (vs. Bär) zu bestimmen scheint, dahingehend ausgearbeitet, erfasst und gar verstanden worden ist, …, …, dass sich derartige Treffen lohnen.
    MFG
    Dr. Webbbaer

  9. Der Begriff “Junk-DNA” ist sicher eher zu einem Begriff der Medien geworden. Korrekter wäre: Intergenische DNA, Introns und Telomere. ENCODE spricht jetzt davon das 80% davon “functional” sind, also irgendeine Rolle bei der Genregulation spielen. Das DNA Abschnitte außerhalb der eigentlichen Gene bei deren Regulation eine Rolle spielen ist aber nichts neues. Neu ist der globale Ansatz.

    Neu ist vor allem die Definition, die ENCODE für “funktional” verwendet. Das tatsächlich wohl eher 10 bis 20% des menschlichen Genoms tatsächlich funktional sind, 80% sich aber besser verkaufen lassen, gibt Ewan Birney auf seinem blog sogar unumwunden zu. Junk DNA ist ein auf der gemessenen Mutatinsrate basierendesm vor Jahrzehnten aufgrund der populationsbiologischer Überlegungen entwickeltes Konzept, das mit allen seitdem gemachten Entdeckungen (z.B. Transposons, prozessierte Pseudogene) in Einklang steht. Selbst einige ENCODE-Mitglieder distanzieren sich inzwischen von den 80%. Das soll nicht heißen, dass die eigentlichen Daten, die im Rahmen von ENCODE erzeugt wurden, nichts wert wären. Aber der als Hauptergebnis gehypte Schluss, dass die Mehrheit desmenschlichen Genoms kein Junk sei, richtet leider nicht unerhebliche Schäden an.
    PS: Die DNA im Kopf dieser Seite ist im Gegensatz zu der natürlich überwiegend vorkommenden B-DNA linksdrehend und qualifiziert sich damit für die Left Handed DNA Hall of Fame

  10. Danke für deine Einordnung von ENCODE, sparc. Ergänzend: Larry Moran hat die Debatte um die Relevanz der nicht codierenden Sequenzen in seinem Blog dokumentiert: http://sandwalk.blogspot.fi/search?q=encode
    Die Frage ist, ob ENCODE so geflogen wäre, wenn sie nicht eine solche Aussage hätten konstruieren können. Ich denke nicht.
    Du bist übrigens der erste (eingeschlossen mir) der in fast fünf Jahren WeiterGen gemerkt hat, dass die DNA im Logo linksdrehend ist

Schreib einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.