Celera prescht im Wettlauf um die Sequenzierung des menschlichen Genoms voran
Über 90 Prozent des Genoms seien bereits erfasst, bis Sommer will man die Sequenzierung abgeschlossen haben
Das Unternehmen Celera, das erst letztes Jahr mit 300 hochmodernen Sequenzierungsmaschinen und mit den leistungstärksten Supercomputern zur Analyse der Daten in Konkurrenz zu dem mit öffentlichen Geldern geförderten internationalen Human Genome Project getreten ist (Wer gewinnt den Wettlauf?), scheint nach eigenen Angaben den Wettlauf zu gewinnen. In einer Pressemitteilung gab das Unternehmen, das zum weltweit führenden Anbieter von genetischen Informationen werden will, gestern bekannt, dass man bereits mehr als 90 Prozent des menschlichen Genoms sequenziert habe und bis zum Sommer das gesamte Genom analysiert haben werde.
Das Unternehmen sagt, man habe erst ab 8. September mit der Sequenzierung begonnen, während das Human Genome Project bereits 1990 gestartet wurde. Bei dem Wettlauf geht es auch darum, ob die Informationen allen Wissenschaftlern zugänglich bleiben. Celera stellt auf einer Subskriptionsbasis die Daten akademischen und kommerziellen Forschungsinstitutionen zur Verfügung, hat aber schon verlautbaren lassen, dass man neu entdeckte Gene zum Patent angemeldet habe und weiterhin medizinisch bedeutsame Funde patentieren wolle, während das Human Genome Project die Sequenzierungsdaten allgemein und kostenlos zugänglich erhält. Bislang hat Celera bereits Patente für 6500 Gene beantragt. Allerdings will auch Celera nach Abschluss der Sequenzierung die genetischen Rohdaten in einer wissenschaftlichen Zeitung veröffentlichen, die den Wissenschaftlern auf der ganzen Erde kostenlos unter der Vereinbarung, die Daten nicht weiter zu veröffentlichen, zur Verfügung stehen sollen.
Die schnelle Sequenzierung von Celera beruht auf einem Verfahren, das J. Craig Venter, Präsident der Firma und Leiter des ebenfalls zum Unternehmen gehörenden Institute for Genomic Research (TIGR), entwickelt hat. Während die am Human Genome Project beteiligten Institute das Genom Stück für Stück analysieren, basiert das Verfahren von Venter darauf, die DNA einer Reihe von menschlichen Zellen zu nehmen und sie in zufällige, sich überschneidende Fragmente in einer Länge zwischen 2000 und 10000 Basenpaaren zu zerlegen ("random shotgun"-Methode). Dann werden sie in einen Plasmidvektor eingebaut, in E. coli Bakterien millionenfach vermehrt und schließlich von beiden Seiten aus jeweils nur bis zu 500 Basenbuchstaben sequenziert. Die Schwierigkeit besteht darin, den sequenzierten Code wieder richtig durch einen Algorithmus zur Musteranalyse den größeren Einheiten zuzuordnen und an der richtigen Stelle im Genom einzuordnen, um dann die lineare Abfolge der Basenpaare in den 23 Chromosomenpaare zu erhalten. Da man jeweils das sequenzierte Paar der Fragmentenden habe und die Gesamtlänge kenne, wäre das kein Problem, sagt Venter. Dazu benutzt Celera übrigens wieder die öffentlich zugänglichen Informationen des Human Genome Project.
Celera selbst habe 5,3 Milliarden Basenpaare des menschlichen Genoms mit einer Genauigkeit von mehr als 99 Prozent sequenziert. Diese würden 2,5 Milliarden Basenpaare einer einzigen Sequenz darstellen, so dass man 81 Prozent des menschlichen Genoms erfasst habe, das man 3,18 Milliarden Basenpaare schätzt: "Mit diesen Daten deckt Celera, kombiniert mit den "fertiggestellten" und "vorläufigen" Sequenzierungsdaten des Human Genome Project, 90 Prozent des menschlichen Genoms ab." In den nächsten Monaten will man pro Monat zwei weitere Milliarden Basenpaare der Sequenz hinzufügen. Die zusätzliche Zahl von Informationen sollen die Genauigkeit erhöhen.
Celera bezeichnet sich schon jetzt als die "weltweit größte DNA-Datenfabrik". Craig Venter betont, dass die frühe Phase der Sequenzierung besonders wichtig für die Entdeckung der menschlichen Gene sei, die den neuen Rohstoff im biotechnologischen Zeitalter bilden: "Wir kommen schnell zu einem Ende dieser Phase. Unsere statistischen Analysen und Vergleiche mit bekannten Genen lassen vermuten, dass wir in unserer Datenbank bereits mehr als 97 Prozent der menschlichen Gene dargestellt haben."
Nach der Sequenzierung des menschlichen Genoms hat Celera bereits weitere Ziele: die Sequenzierung des Genoms der Maus und die Fertigstellung der Sequenzierung des Genoms von Drosophila. Auch hier habe man bereits 14000 Gene entdeckt, die "kommerziell wichtige Proteinfamilien" zur Herstellung von Medikamenten oder Pestiziden enthalten. Nebenbei verfolgt man im TIGR noch das Minimal Genome Project. Hier wird das Genom von Mycoplasma genitalium, des einfachsten bekannten Mikroorganismus, benutzt, wobei man nacheinander einzelne Gene entfernt und beobachtet, ob das Bakterium weiterhin lebensfähig ist. Aus den unbedingt zum Leben notwendigen Genen könnte man dann neue Mikroorganismen mit gewünschten Eigenschaften entwerfen.