Gendatenbanken versinken in der Datenflut

Die EU-Kommission investiert in die Bioinformatik, aber vielleicht zu wenig

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

Die bislang größte Förderung der Bioinformatik auf europäischer Ebene hat jetzt Philippe Busquin, der EU-Kommissar für Forschung, dem European Molecular Biology Laboratory (EMBL), zugesagt. Fast 20 Millionen Euro wird das Forschungskonsortium im Rahmen der Initiative "Genomes for Human Health" erhalten, um neue bioinformatische Programme zu entwickeln, mit denen einen besserer Zugriff auf Datenbanken und eine effektivere Verarbeitung der Daten aus unterschiedlichen Quellen möglich werden soll.

Als ein Problem stellt sich offenbar der Erfolg der Genforschung heraus. Mit den besseren Maschinen und mehr Labors können mehr und mehr Daten erhoben werden. Vor allem Sequenzierungsdaten des genetischen Codes von immer mehr Organismen füllen die Datenbanken auf. So sind in den Datenbanken des European Bioinformatics Institute (EBI), das für die Koordination der geförderten Projekte zuständig ist, bereits über 12,5 Milliarden Basenpaare von 50.000 Arten abgespeichert. Alle paar Sekunden wird eine neue Sequenz hinzugefügt. Alle acht Monate verdoppelt sich der Umfang der Datenbanken, wobei die Geschwindigkeit des Datensammelns noch zunehmen wird.

Schwierig wird es, wenn die Geschwindigkeit, mit der die Daten eintreffen, größer wird als die Geschwindigkeit, mit der Rechenkapazität für einen konstanten Preis zunimmt, weil dann zwischen den archivierten und den verarbeiteten Daten sich eine immer größere Kluft auftut: "Daher erfordert das Schritthalten mit der Datenflut eine kontinuierliche Injektion von technischen, finanziellen und menschlichen Ressourcen." Überdies werden im postgenomischen Zeitalter neue Datentypen ebenfalls "mit astronomischer Geschwindigkeit" verfügbar, die von Proteinsequenzen über Mutationsinformationen bis hin zu dreidimensionalen Strukturen von Biomolekülen reichen.

Das EBI wird mit den Geldern der Europäischen Kommission in einem Drei-Jahres-Projekt einerseits die öffentlich zugänglichen Datenbankenbestände erweitern. Die von DNA- oder Biochips, mit denen die Aktivität von Tausenden von Genen gleichzeitig gemessen werden können, erfassten Daten sollen in einer Datenbank standardisiert und zugänglich gemacht, aber auch Programme entwickelt werden, um sie zu interpretieren. In einer anderen Datenbank sollen Informationen über die dreidimensionalen Strukturen von Biomolekülen zugänglich gemacht werden, deren Kenntnis entscheidend für die Funktionsweise der Proteine ist.

Neben dem Aufbau von neuen Datenbanken geht es aber vor allem um die Standardisierung der Daten und die Interoperabilität der Datenbanken für Genome und Proteome, beispielsweise zwischen den genetischen Sequenzen von EMBL, den Proteinsequenzen von SWISS-PROT oder den Genomannotationen von EnsEMBL. Und als viertes gefördertes Projekt soll eine Datenbank für die Interaktionen zwischen Proteinen mit einer standardisierten Darstellung aufgebaut werden, um die Daten aus verschieden Quellen besser kombinieren und auswerten zu können.

"Die Bioinformatik ist der Schlüssel, mit dem sich die immensen möglichen Chancen für die Bürger und die Gesellschaft aufschließen lassen, die in den Genomdaten eingeschlossen sind", erklärt der Forschungskommissar Busquin. Die Förderung soll Europa diesen "Reichtum" schneller und besser fördern lassen. Deutlich macht Peter Kind, zuständig für medizinische Forschung bei der EU-Kommission, um was es geht: "Für Europa ist es zwingend notwendig, seine Wettbewerbsfähigkeit in diesem Bereich sicher zu stellen, wenn wir nicht zu eine 'Kunden' für Technologien werden wollen, die woanders entwickelt wurden, und zu einem 'Konsumenten' von Produkten und Diensten, die von unseren Konkurrenten stammen."

Fraglich ist natürlich, ob für diese hoch gesteckten Ziele die Förderung mit 20 Millionen Euros ausreichen wird. Um was es geht, macht die Generaldirektion selbst deutlich. Allein die National Institutes of Health (NIH) haben im letzten Jahr 300 Millionen Euro in die Bioinformatik investiert. Das mit dem EBI vergleichbare National Center for Biotechnology Information (NCBI) hat 2000 ein Budget von 38 Millionen Euro gehabt und soll dieses Jahr über 48 Millionen betragen. In Europa hingegen würden die Investitionen aus öffentlicher Hand in die Bioinformatik im Jahr 2000 höchstens 100 Millionen Euro betragen. Während das Budget des NCBI sich in den letzten Jahren vervierfacht habe, hat sich das des EBI nur verdoppelt.

Nach den Berechnungen der Kommission wurden nach dem Start der Initiative "Genomes for Human Health" im November 2000 bereits 25 Millionen Euros für Projekte bewilligt, die mit postgenomischen Datenbanken und Tiermodellen zu tun haben. Die jetzt bewilligten 19,4 Millionen werden von EBI an 25 Labors in 11 Ländern vergeben. Auch das EMBL mit Hauptsitz in Heidelberg partizipiert an den Projekten. Weitere 40 Millionen Euros sollen bis zum Ende dieses Jahres an integrierte Projekte der postgenomischen Forschung gehen. Insgesamt fördert die EU die Genomforschung 2001 dann mit 100 Millionen Euros, also einem Drittel dessen, was die NIH im letzten Jahr investiert haben.