Die Open-Access Annotierung des EHEC-Genoms

i-7a2b84c51b73baff7162676f8a70418c-marina_manrique-thumb-200x266.jpg

Marina Manrique ist Bioinformatikerin. Sie beschäftigt sich mit der Analyse (der Annotierung) bakterieller Genomsequenzen und sie ist aktiv an einem Crowdsourcing-Projekt beteiligt, das mit der Auswertung der EHEC-Sequenzen beschäftigt ist. Das meiste was man bislang über den pathogenen E. coli Stamm weiß, entstammt diesem Projekt. Hier ein Interview mit Marina.

WeiterGen: Marina, kannst du dich kurz vorstellen, was ist dein wissenschaftlicher Hintergrund, wo arbeitest du und womit beschäftigst du dich im Zusammenhang mit EHEC und HUS?
Marina Manrique: Ich bin Bioinformatikerin, mein Hintergrund ist die Biochemie. Ich arbeite seit etwa vier Jahren bei Era7, eine Biotechfirma in Granada, und speziell bei OhNoSequences!, der Forschungs- und Entwicklungsgruppe von Era7. Ich interessiere mich dafür, wie wir “Next-Generation” Sequenzierungsmethoden verwenden können um biologisch relevante Fragestellungen zu erforschen mit Fokus auf bakterielle Genomics.
Die erste von uns veröffentlichte Annotierung eines aktuellen E. coli HUS Stamms (Stamm TY-2482) wurde von Raquel Tobes gemacht, der Leiterin der OhNoSequences!-Gruppe. Die folgenden Annotierungen wurden von Raquel und mir durchgeführt und online veröffentlicht. Alle Genomannotierungen wurden mit unserer BG7-Plattform durchgeführt, ein System, das speziell für die Auswertung von Next-Generation Sequenzdaten von Bakterien entwickelt wurde.
WG: Der EHEC-Erreger wurde unabhängig an mehreren Orten sequenziert. Welche unterschiedlichen Analysetechniken habt ihr verwendet, mit wie vielen unterschiedlichen Sequenzdatensätzen arbeitet ihr?

Unterschiedliche Quellen der Sequenzdaten und unter-schiedliche Analysemethoden

MM: Wir haben die drei sequenzierten E. coli Isolate insgesamt fünf Mal komplett annotiert, drei Mal den Stamm TY-2482, und je ein Mal LB226692 und H112180280. Jede dieser Annotierungen wurde mit unterschiedlichen Werkzeugen durchgeführt, passend zur jeweiligen Sequenzierungtechnik (weitere Informationen über die Genom-Annotierungen hier). Die bislang eingesetzten Technologien sind: Ion Torrent 314 Chips, Illumina single-reads, Illumina Paired-End reads mit 500 Basenpaaren Insertgröße und 454 Paired-End-reads.
WG: Was sind die größten Herausforderungen bei der Annotierunge bakterieller Genome?
MM: Definitiv die größte Herausforderung sind die Sequenzierungsfehler. Wir müssen im Hinterkopf behalten, dass die Next-Generation-Sequenzierungsmethoden zwar sehr schnell und mit hohem Durchsatz DNA lesen können, allerdings auch viele Fehler machen. Das Kombinieren der unterschiedlichen Technologien, Hybrid-Assemblies und die möglichst komplette und mehrfache Sequenzierung der Genome kann helfen diese Fehler zu minimieren, aber es ist wirklich wichtig, sich der möglichen Fehlerquellen und der Stärken und Schwächen der jeweiligen Technologie bewusst zu sein. Weiter ist das Handling riesiger Datenmengen wichtig, die diese Technologien erzeugen.
Im Fall der aktuellen Epidemie war es essentiell, das Genom so schnell wie möglich zuverlässig zu annotieren. Eine wichtige Herausforderung besteht darin, einer Genom-Annotierung möglichst viele biologisch relevante Erkenntnisse zu entnehmen, beispielsweise darüber, wie das sequenzierte Bakterium funktioniert uns wie es mit dem Menschen oder der direkten Umwelt interagiert. Durch unsere Erkenntnisse können möglicherweise vorbeugenden Maßnahmen ergriffen werden, die Expansion des Erregers bekämpft werden, und therapeutische Maßnahmen angepasst werden.
WG: Ihr teilt eure Daten öffentlich in einer Online-Community. Die ganze Analyse des Genoms ist ein international vernetztes Crowdsourcing-Projekt. Ihr kommuniziert über Twitter, die Forschungsrgebnisse werden in Wikis und Blogs veröffentlicht. Wie funktioniert das, wie viele Leute sind derzeit an der Analyse der Sequenzen beteiligt?
MM: Es ist fantastisch zu sehen, wie weltweit Wissenschaftler angefangen haben, zusammen diese Daten zu analysieren. Wir haben Leute aus Spanien, Australien, Großbritannien, Polen, Deutschland, China, und so weiter. Die Freigabe der Rohdaten durch BGI, Lifetech und der Health Protection Agency Großbritannien (die Zentren, in denen die Stämme sequenziert wurden, WG) war entscheidend für dieses Crowdsourcing-Bewegung, genauso wie die Nutzung von Twitter, GitHub und die privaten Blogs.

Es ist fantastisch zu sehen, wie weltweit Wissenschaftler zusammen die Daten analysieren.

Bisher gibt es 13 mitwirkende Gruppen am Github-Wiki, wo wir unsere Analysen gesammelt zur Verfügung stellen. Wir sind aber ziemlich sicher, dass die tatsächliche Zahl der Forscher, die an der Sequenzanalyse arbeiten viel höher ist. Wir haben einige Mails von Leuten erhalten, die angekündigt haben, die Daten ebenfalls auszuwerten und ihre Ergebnisse in naher Zukunft zu veröffentlichen. Wahrscheinlich gibt es auch Forscher die an der Datenanalyse arbeiten, ihre Ergebnisse aber nicht so offen kommunizieren.
WG: Was ist euer Nutzen an dem Projekt?
MM: Am wichtigsten ist, dass dadurch dass wir unsere Ergebnisse Open-Access publizieren, vor allem unter CC0 Lizenz, wir allen Menschen die Möglichkeit geben kostenlos auf die komplett öffentlich zugänglichen Daten zu zu greifen. Weiter ist das öffentliche Teilen der Ergebnisse auch eine tolle Möglichkeit zu zeigen, woran man selbst arbeitet und wo wie eigenen Stärken liegen
Das Teilen der Daten und der Informationen online war auch sehr wichtig, um das E. coli Genom schnell und komplett zu annotieren. Hier beschreiben wir, wie wir in weniger als 24 Stunden die Rohsequenzen bekamen, das Genom daraus assembliert, und funktional annotiert haben. Besonders im Zusammenhang mit akuten Epidemien ist es wichtig, Sequenzdaten so schnell analysieren zu können.
WG: Wie unterscheiden sich eure Annotierungen von anderen, offiziellen?
MM: Der einzige Unterschied ist, dass unsere Community-basierte Analyse als vorläufige Analyse gilt, da Sie nicht extern begutachtet, also peer-reviewt ist. Und natürlich auch, dass sie kostenlos und offen zugänglich ist. Unser Ziel ist, möglichst schnell ein möglichst genau annotiertes Bakteriengenom online zur Verfügung zu stellen. Alle unsere Ergebnisse werden mit wissenschaftlichen Methoden erarbeitet. Es sind die gleichen Methoden die wir verwenden, wenn wir an einer “offiziellen” Veröffentlichung arbeiten. Weil unsere Ergebnisse vorläufig und nicht peer reviewt sind, müssen die Leser natürlich kritisch sein. Aber kritisch sollte man bei der Analyse von wissenschaftlichen Daten immer sein, egal ob es eine “offizielle” Analyse ist oder nicht.
WG: Kann anhand eurer Daten der Ursprung der Epidemie rekonstruiert werden?

Der E. coli Stamm is Ergebnis eines normalen Evolutionsprozesses

MM: Leider können wir das mit unserer vorläufigen Analyse nicht. Das Genom dieses E. coli-Stamms scheint sehr ähnlich zu bekannten, eng verwandten E. coli-Bakterien zu sein. Der Stamm ist wahrscheinlich das Ergebnis eines normalen Evolutionsprozess von E. coli in irgendeiner spezifischen Mikroumgebung. Dieser Stamm scheint weniger neue Gene im Genom tragen, als vielmehr eine Kombination von bekannten Genen, die ihn insgesamt pathogener machen.
WG: Was sind bislang die wichtigsten Ergebnisse euer Analyse?
MM: Unsere Genomannotation ist letztendlich das Bezugssystem für weitere, detailliertere Analysen. Wir identifizieren die Gene und leiten deren Funktionen ab. Wahrscheinlich sind es zwei Plasmide (zusätzliche, ringförmige DNA-Moleküle, WG), die diesen E. coli Stamm so pathogen machen. Eines enthält viele Gene, die bei der Anhaftung der Zellen an die Darmwand und der Pathogenität eine Rolle spielen. Ein zweites Plasmid mit wichtigen Resistenzgenen gegen Antibiotika könnte eine weitere wichtige Besonderheit dieses E. coli Stamms sein.
Es ist wichtig, dass die Forscher das Genom weiter analysieren, speziell im Hinblick auf Pathogenität und Virulenz für den Menschen. Die unterschiedlichen Antibiotika-Resistenzen, die Vielfalt der Gene, die bei der Adhäsion und Kolonisation beteiligt sind, sowie die Toxine und Hämolysine sind aktuell einige wichtige Schwerpunkte der Analyse.
WG: Marina, vielen Dank für das Interview.

Beteilige dich an der Unterhaltung

19 Kommentare

  1. Sebastian,
    wahrscheinlich hängen die von dir beschriebenen Sequenzunterschiede sowohl von den Sequenziertechniken als auch von dem verwendeten Referenzstamm ab. Ich habe deine Fragen an Marina weiter geleitet, vielleicht meldet sie sich ja hier.

  2. Danke für das Interview! Echt genial, wozu Wissenschaftler im Stande sind…dieses Crowdsurfing-Projekt ist echt der Wahnsinn und hilft sehr, wenn es schnell gehen muss! Eine Frage habe ich allerdings noch: Mir sind bisher die Daten der Sequenzierung aus Darmstadt bekannt mit denen Prof. Karch in Münster arbeitet und die Sequenzierungsdaten aus Göttingen, die sich u.a. darin unterscheiden, dass die einen sagen, das Genom bestehe aus 93% EAEC, während die anderen von 97% sprechen. Liegt dieser Unterschied vielleicht an unterschiedlich verwendeten Sequenzierungstechnologien und daraus resultierenden unterschiedlichen Interpretation? Bin leider zu wenig Bioninformatiker, um das einschätzen zu können. Hier lese ich ja auch von insgesamt drei E. coli Isolaten, die aber alle die gleichen sind und nur an verschiedenen Orten isoliert wurden oder?

  3. WG: Kann anhand eurer Daten der Ursprung der Epidemie rekonstruiert werden?
    MM: Leider können wir das mit unserer vorläufigen Analyse nicht. Das Genom dieses E. coli-Stamms scheint sehr ähnlich zu bekannten, eng verwandten E. coli-Bakterien zu sein. Der Stamm ist wahrscheinlich das Ergebnis eines normalen Evolutionsprozess von E. coli in irgendeiner spezifischen Mikroumgebung.

    Dazu meint Mike Adams von NaturalNews (www.naturalnews.com) in seinem Verschwörrungslastigen aber durchaus interessanten Artikel..

    – …Dieser besondere E.-coli-Typ gehört zum Stamm 0104, und 0104-Stämme sind (normalerweise) so gut wie nie Antibiotika-resistent. Um resistent zu werden, müssen sie wiederholt Antibiotika ausgesetzt worden sein, sodass der erforderliche »Mutationsdruck« erzeugt wird, der sie dazu veranlasst, eine völlige Unempfindlichkeit gegenüber Medikamenten zu entwickeln.
    Wenn man also herausfinden will, wo ein solcher Stamm eigentlich seinen Ursprung nimmt, dann kann man grundsätzlich den genetischen Code des E. coli in umgekehrter Richtung zurückentwickeln und dadurch mit ziemlicher Genauigkeit bestimmen, welchen Antibiotika es im Laufe seiner Entwicklung ausgesetzt war. Diesen Schritt hat man nun unternommen (siehe unten), und wenn man die genetische Decodierung dieses 0104-Stamms, der jetzt bei Lebensmittelverbrauchern in der EU zu Erkrankungen führt, verfolgt, so entsteht ein faszinierendes Bild über seinen möglichen Entwicklungsgang.
    Der genetische Code offenbart die Geschichte
    Als Wissenschaftler des Robert Koch Instituts in Deutschland den genetischen Aufbau des 0104-Stamms entschlüsselten, erwies er sich als resistent gegen die folgenden Klassen und Kombinationen von Antibiotika:
    * Penizilline
    * Tetrazykline
    * Nalidicinsäure
    * Trimethropim-Sulfamethoxazol
    * Cephalosporine
    * Amoxizillin/Clavulcansäure
    * Piperacillin-Sulbactam
    * Piperacillin-Tazobactam
    Darüber hinaus vermag dieser Stamm 0104 besondere Enzyme zu bilden, die ihm Fähigkeiten verleihen, die man als »bakterielle Superkräfte« bezeichnen könnte, technisch gesehen sind sie als ESBL bekannt.
    »Extended spectrum Beta-Laktamasen (ESBL) sind Enzyme, die von Bakterien gebildet werden können, durch die diese gegen Cephalosporine, beispielweise Cefuroxim, Cefotaxim und Ceftazidim – die in vielen Krankenhäusern am häufigsten verabreichten Antibiotika – resistent werden«, erklärt die britische Gesundheitsschutzbehörde Health Protection Agency.


    Tatsächlich gibt es dafür nur einen (einzigen) Weg – dieser E.-coli-Stamm muss allen acht Antibiotika-Klassen ausgesetzt werden. Das geschieht natürlich normalerweise nicht auf einmal: Man setzt ihn zuerst Penizillin aus und sondert die überlebenden Kolonien aus, die nun penizillinresistent sind. Dann nimmt man diese überlebenden Kolonien und setzt sie Tetrazyklinen aus. Die überlebenden Kolonien sind jetzt resistent gegen Penizillin und Tetrazykline. Dann kommen die Sulfonamide an die Reihe, wieder werden die überlebenden Kolonien ausgesondert, und so weiter. Es ist ein genetisches Selektionsverfahren, das in einem Labor durchgeführt wird und zu einem gewünschten Resultat führen soll.

    weiter hier http://info.kopp-verlag.de/hintergruende/deutschland/mike-adams/forensische-hinweise-darauf-dass-e-coli-supererreger-moeglicherweise-biotechnisch-hergestellt-wurd.html

  4. @the cloked:

    Um resistent zu werden, müssen sie wiederholt Antibiotika ausgesetzt worden sein, sodass der erforderliche »Mutationsdruck« erzeugt wird, der sie dazu veranlasst, eine völlige Unempfindlichkeit gegenüber Medikamenten zu entwickeln.
    Wenn man also herausfinden will, wo ein solcher Stamm eigentlich seinen Ursprung nimmt, dann kann man grundsätzlich den genetischen Code des E. coli in umgekehrter Richtung zurückentwickeln und dadurch mit ziemlicher Genauigkeit bestimmen, welchen Antibiotika es im Laufe seiner Entwicklung ausgesetzt war.
    Tatsächlich gibt es dafür nur einen (einzigen) Weg – dieser E.-coli-Stamm muss allen acht Antibiotika-Klassen ausgesetzt werden. Das geschieht natürlich normalerweise nicht auf einmal: Man setzt ihn zuerst Penizillin aus und sondert die überlebenden Kolonien aus, die nun penizillinresistent sind. Dann nimmt man diese überlebenden Kolonien und setzt sie Tetrazyklinen aus. Die überlebenden Kolonien sind jetzt resistent gegen Penizillin und Tetrazykline. Dann kommen die Sulfonamide an die Reihe, wieder werden die überlebenden Kolonien ausgesondert, und so weiter. Es ist ein genetisches Selektionsverfahren, das in einem Labor durchgeführt wird und zu einem gewünschten Resultat führen soll.

    Das ist mal absoluter Schwachsinn! Weder müssen Bakterien unbedingt Antibiotika ausgesetzt sein, um resistent zu werden, noch kann man Zurückverfolgen, wie und wann sie zu diesen Resistenzen gelangt sind. Dass sie zudem jedem Antibiotikum ausgesetzt sein müssen, um nacheinander darauf resistent zu werden, ist auch falsch, da mehrere Resistenzen auf einem Plasmid vorhanden sein können und es ausreicht, wenn das Bakterium es durch horizontalen Gentransfer bekommt. Meistens reicht auch schon ein Gen aus, etwa das für die ESBL, um gleich auf einen Schlag gegen mehere Antibiotika resistent zu werden. Das angesprochene Selektionsverfahren ist somit falsch gedacht und steuert schnurstracks auf eine Verschwörungstheorie hin, die derzeit so populär ist.
    Aber es ist ja der Kopp-Verlag, was kann man da schon an richtigen Informationen erwarten…
    Den Link zum PDF von Impfkritik könnte man gleich löschen. Selber Schwachsinn, anderes Format.

  5. Sebastian,
    hier die Antworten von Marina auf deine ersten Fragen. Sie hat mir den Text schon am Freitag Nachmittag geschickt, ich war aber übers Wochenende verreist.

    Sequencing and assembly errors definitely play an important role in this kind of projects since different technologies and different assembly strategies were done to get the final assembled sequences of all the strains and, except the last assembly published by BGI of the TY-2482 strain (), the assemblies are still drafts (with lot’s of contigs and gaps). I think it’s better to wait to have a high quality genome assembly (not a draft) to start to do this kind of comparative analysis based on similarity at the nucleotide level. At this moment and not having reviewed such studies I could not conclude if the differences they’ve found are due to sequencing errors or not.
    As far as I’m concerned all the isolates we’ve analyzed so far belong to the same strain, the E. coli O104:H4 strain.

  6. Sebastian R.:
    Grundsätzlich einmal Zustimmung.
    Ein Plasmid bedeutet allerdings ja auch immer eine Mehrbelastung für die Zelle, vor allem bei der Replikation. Daher werden Plasmide oft sehr schnell wieder rausgeschmissen, wenn sie keinen Vorteil für die Zelle bieten. Warum also sollten Bakterien multiresistent sein und vor allem bleiben, wenn sie nie darauf selektiert werden?

  7. @CCS:

    Ein Plasmid bedeutet allerdings ja auch immer eine Mehrbelastung für die Zelle, vor allem bei der Replikation. Daher werden Plasmide oft sehr schnell wieder rausgeschmissen, wenn sie keinen Vorteil für die Zelle bieten

    Das stimmt nicht, kannst du mir dazu evtl. Literatur vorweisen? Wird ein Bakterium mit einem neuen Plasmid ausgestattet, behält es dies und repliziert es natürlich bei jeder Zellteilung auch weiter. Das ist keine Mehrbelastung, da der Großteil der Plasmide nur einige Tausend Basenpaare groß ist, im Gegensatz zum bakteriellen Chromosom, dass bei E.coli z.B. aus ca. 5 Mio. Basenpaaren besteht. Zudem kann sich ein Plasmid ja komplett in das bakterielle Chromosom integrieren und somit zu einem “festen” Bestandteil werden.
    Wie sollen zudem Plasmide rausgeschmissen werden? Über die Membran kann es nicht erfolgen, da ein Plasmid zu groß ist, um mal eben rausgeschleusst zu werden. Solche Mechanismen sind mir nicht bekannt. Von selektiver Replikation weiss ich auch nichts, da immer der komplette Satz an Erbgut bei einer Zellteilung repliziert und weitergegeben wird. Es gibt zudem bakterielle Mechanismen, die ein möglichen Verlust von Plasmiden bei einer Zellteilung verhindern.
    Es ist zudem ein Mythos, dass neu erlangtes genetisches Material Vorteile für eine Zelle/Organismus bringen muss. Ich frage mich, wieso man das immer denkt. Es birgt immer Ansätze für die Selektion und das allein rechtfertigt schon das Dasein von neu erlangtem genetischem Material. Es ist nicht so, dass ein Bakterium guckt, welche Gene gut und welche schlecht sind.

    Warum also sollten Bakterien multiresistent sein und vor allem bleiben, wenn sie nie darauf selektiert werden?

    Wie gesagt, bekommt ein Bakterium erstmal ein Plasmid, dann behält es dies auch. Auf diesem können dann mehrere Resistenzgene liegen. Es muss also nicht immer nacheinander darauf selektiert werden. Es braucht aber auch nicht immer Plasmide, um Resistenzen auszubilden. Ein paar spezifische Mutationen im bakteriellen Chromosom könnten auch ausreichen, um das Bakterium gegenüber seiner Umwelt resistenter zu machen.

  8. Danke, Theres. Die Autorin des bacpathgenomics-Blogs, Kat Holt aus Neuseeland, ist ja auch aktiv an dem Crowdsourcing Projekt beteiligt.

  9. @Sebastian R.
    Danke für die ausführliche Antwort.
    Dass nur auf irgendeine Weise auf das Plasmid an sich selektiert werden muss und nicht jedes einzelne Gen, war mir klar. Sonst würden Klonierungen ja noch weniger funktionieren g
    Ich kann zumindest aus der biotechnologischen Richtung sagen, dass Plasmidstabilität ein extrem wichtiger Faktor ist. Wenn man da in seiner 10-ml- bis 1.000.000-l-Kultur keinen Selektionsdruck ausübt, gehen Plasmide verloren wie nichts. Den genauen Mechanismus kenne ich aber nicht, ich nehme mal an, dass die Zellen einen Wachstumsvorteil haben, die bei der Replikation ohne Selektionsdruck das Plasmid eben nicht abbekommen. Eine Mehrbelastung besteht aber auf jeden Fall, immerhin ist so ein Plasmid ja nicht nur einmal in der Zelle vorhanden, sondern auch sehr oft in hundertfachen Kopien.
    Ich kann als Literatur die Beschreibung von plasmidstablisierenden Systemen anbieten:
    http://www.ncbi.nlm.nih.gov/pubmed/21041110
    http://www.ncbi.nlm.nih.gov/pubmed/21255361
    Generell stimme ich dir aber darin zu, dass ein paar Gene mehr meistens keinen Nachteil für Zellen bedeuten; wenn sie später dann mal durch Zufall einen Vorteil bieten, umso besser.

  10. @ WG
    Du zitierst Marina mit den Worten

    Der E. coli Stamm is Ergebnis eines normalen Evolutionsprozesses

    Dies hat sie so aber zumindest in dem von Dir wiedergegebenen Interview nicht gesagt.
    Tatsächlich steht dort

    Der Stamm ist wahrscheinlich das Ergebnis eines normalen Evolutionsprozess von E. coli in irgendeiner spezifischen Mikroumgebung.

    Dies ist in seiner Bedeutung völlig unterschiedlich zu der von Dir nochmals zitierten Version, und auch so stellt ihre Aussage lediglich ihre persönlich Vermutung dar.
    Sympathisch fand ich auch ihre, ihrer Berufung gerecht werdende Professionalität die sie mit der folgenden Aussage zum Ausdruck brachte

    Weil unsere Ergebnisse vorläufig und nicht peer reviewt sind, müssen die Leser natürlich kritisch sein. Aber kritisch sollte man bei der Analyse von wissenschaftlichen Daten immer sein, egal ob es eine “offizielle” Analyse ist oder nicht.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert