Wissenschaftler schließen Wetten ab auf die Zahl der menschlichen Gene

Obgleich 90 Prozent des menschlichen Genoms noch im Juni sequenziert sein sollen, weichen die Schätzungen über die Zahl der Gene weit voneinander ab; vermutlich aber dürften sie weitaus weniger sein, als man bislang glaubte

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

Möglicherweise ist das menschliche Genom weitaus kleiner, als man bislang angenommen hat. Man hätte ja meinen sollen, dass kurz vor Abschluss der (mehr oder weniger vollständigen) Sequenzierung bereits mehr bekannt ist, aber offenbar unterscheidet sich die Kenntnis über die Abfolge der drei Milliarden Buchstabenpaare des genetischen Codes doch erheblich vom Wissen, wie diese Geheimschrift zu interpretieren ist, die zudem gewaltige Mengen an möglicherweise bedeutungslosem "Müll" enthält.

Noch ist der Wettlauf zwischen dem Human Genome Projekt, einem mit öffentlichen Gelder geförderten internationalen Konsortium von Forschungsinstitutionen, und Celera unter der Leitung von Craig Venter nicht endgültig entschieden. Nachdem vor kurzem Celera gemeldet hatte, die Sequenzierung des Genoms bald abgeschlossen zu haben, will jetzt offenbar auch das HPG mindestens so schnell sein und bis 15. Juni eine vorläufige Version veröffentlichen: "Das öffentliche Projekt hat letztes Jahr beschlossen, "so Ewan Birney vom European Bio-informatics Institute gegenüber BBC, "die Geschwindigkeit der Entschlüsselung zu beschleunigen, und wir werden am 15. Juni verkünden, dass wir 90 Prozent der interessanten Teile fertiggestellt haben." Am 8. Mai hatte man offiziell verkündet, 85 Prozent des Genoms sequenziert zu haben und eben bis zum 15. Juni 90 Prozent erreichen zu wollen. In der abschließenden zweiten Phase würden jetzt jede Minute 10000 Buchstaben des Gencodes in die Datenbanken fließen. Bislang soll die erste Phase des HGP, an dem 16 Forschungsistitutionen beteiligt sind, 300 Millionen Dollar gekostet haben, wobei die Hälfte der Gelder von den amerikanischen National Institutes of Health stammte.

Was es allerdings heißt, die Sequenzierung fertiggestellt zu haben ist bereits Gegenstand einer Diskussion und wechselseitiger Vorwürfe, denn weite Bereiche des Genoms können mit den herkömmlichen Verfahren nicht analysiert werden. Vermutlich wird es noch einmal zwei Jahre dauern, bis dann eine vollständigere Version mit einer hohen Genauigkeit von 99,9 Prozent vorliegt. Auf der anderen Seite wird im Laufe der Fertigstellung erst so richtig deutlich, wie wenig man mit dem mehr oder weniger sequenzierten Genom erst in Händen hält.

Als Forscher des HGP, vornehmlich aus Deutschland und Japan, kürzlich die vollständige Sequenzierung der Chromosome 21 und 22 veröffentlicht haben, stellte sich auch heraus, dass auf ihnen wesentlich weniger Gene als vermutet identifiziert werden konnten. Auf dieser Grundlage schlossen die Forscher, dass das gesamte Genom nicht mehr als 40000 Gene haben könnte. Bislang allerdings ging man davon aus, dass dem Menschen zwischen 60000 und 140000 Gene zugrunde liegen, die ihn mit seinen Eigenschaften definieren. 40000 Gene wären gerade einmal das Doppelte der Zahl der Gene auf dem unlängst sequenzierten Genom des Wurms C. elegans oder drei Mal so viel, wie die Fruchtfliege besitzt.

Brent Ewing and Philip Green von der University of Washington schätzen die Zahl der menschlichen Gene auf etwa 35000, Jean Weissenbach von Genoscope meint, der Mensch habe gar nur zwischen 28000 und 34000 Gene. Die Frage ist natürlich, ob die Komplexität des Menschen, die er sich zumindest einbildet, tatsächlich eine Frage der Quantität der Gene ist, wie man bislang geglaubt hat. Die Ansicht, dass ein Orgnaismus desto komplexer ist, je mehr Gene er besitzt, könnte mit den neuen Schätzungen jedoch ins Wanken geraten, wenn Menschen gerade einmal doppelt soviele Gene wie ein winziger Wurm aufweisen können. Möglicherweise verdankt sich, wie Philip Green überlegt, die Komplexität des menschlichen Organismus auch eher der "komplexen Interaktion der Komponenten", was allerdings auch hieße, dass die Wirkung der Gene auch weitaus komplizierter sein würde, als man bislang dachte, was wiederum gezielte gentechnische Eingriffe sehr viel schwieriger machen würde. Möglicherweise produziert ein Gen zu verschiedenen Zeiten auch Verschiedenes, und möglicherweise könnte die "Junk-DNA" auch nicht ganz so bedeutungslos sein, sondern nur deswegen als Müll gelten, weil man noch nicht weiß, wofür sie verantwortlich sind.

Es wird angesichts der weit auseinander liegenden Schätzungen vermutlich noch lange dauern, bis die tatsächliche Zahl der Gene ermittelt wird. Gene sind zwischen 1000 und 100000 Basenpaare lang, aber sie sind oft deswegen schwierig zu identifizieren, weil auch die Gene aus vielen Stücken bestehen können, die wiederum durch wahrscheinlich bedeutungslose Codestücke voneinander getrennt sind. Viele der Gene werden daher von den dafür entwickelten Computerprogramme noch gar nicht erkannt. Und selbst wenn ein Gen isoliert und identifiziert wurde, ist noch lange nicht bekannt, wie es arbeitet, was es erzeugt und welche kleinen Abweichungen für was verantwortlich sein könnten. Um die Funktion eines Gens zu erkennen, wird es oft mit entsprechenden Sequenzen eines tierischen Gens verglichen, dessen Funktion man bereits herausbekommen hat, z.B. indem man das Gen ausgeschaltet und beobachtet hat, was dann geschieht. Doch das Genom der Tiere, die dafür am wichtigsten sind, wurden noch nicht ganz sequenziert.

Angesichts der noch immer großen Unkenntnis und der weit auseinander liegenden Schätzungen haben Wissenschaftler des HGP begonnen, eine Wette über die Zahl der menschlichen Gene einzurichten. Bislang haben bei Genesweep mehr als 200 Wissenschaftler ihre Schätzung eingereicht, die sich während der Konferenz in Cold Spring Harbor mit Namen und Email in das Wettbuch eingetragen haben und sich dort noch eintragen können. Die Vermutungen reichen von 27462 bis zu 200000 Gene, der Median liegt bei 53700 und der Durchschnitt bei 62600, also noch über den letzten Schätzungen. Die Wette wird voraussichtlich bis 2002 oder 2003 laufen. Man geht davon aus, dass man bis 2002 zu einer Einigung kommen wird, wie man Gene zweifelsfrei identifiziert, und dass bis 2003 die Zahl der Gene feststeht. Wer jetzt bei aller Ungewissheit seinen Einsatz macht, muss erst einen Dollar einsetzen, 2002 sind dann schon 20 Dollar fällig.

Zu den für die Wette gültigen Genen zählen nur die Gene in den Chromosomen, die Proteine codieren, nicht aber RNA-Gene oder gar Gene etwa der Mitochondrien. Ansonsten klingt die vorläufige Definition eines Gens schon schwierig genug für Laien: "Ein Gen ist eine Menge an miteinander verbundenen Transkriptionen. Eine Transkription ist eine Menge von Exons, die sich aus einer Transkription ergeben und auf die (optional) das Spleißen von prä-mRNA folgt. Zwei Transkriptionen sind miteinander verbunden, wenn sie in den genomischen Koordinaten mindestens ein Exon gemeinsam haben. Mindestens eine Transkription muss außerhalb des Zellkerns exprimiert und eine Transkription muss ein Protein codieren."