Wissenschaftler fordern eine zentrale Datenbank für alle Veröffentlichungen

Sechs Monate nach Erscheinen sollen alle wissenschaftliche Artikel uneingeschränkt und kostenlos aus dem Internet abzurufen sein

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

Bislang haben fast 12000 Wissenschaftler aus 120 Ländern vornehmlich aus dem Bereich der Biowissenschaften einen offenen Brief an die Verleger von wissenschaftlichen Zeitungen unterschrieben. Gefordert wird, dass die in den oft teuren Zeitungen veröffentlichten Artikel nach einem halben Jahr zentral auf einer Datenbank für alle kostenlos über das Internet zugänglich sein müssen. Das konkrete Vorbild stammt aus der Genforschung, denn verlangt wird eine "GenBank" der veröffentlichten Forschungsliteratur, die Vision wird auf die erste umfassende Bibliothek zurückgeführt, die Bibliothek in Alexandrien.

Der Streit, der bereits zwischen dem mit öffentlichen Geldern finanzieren Humangenomprojekt und dem privatwirtschaftlich arbeitenden, von Craig Venter geleiteten Unternehmen Celera immer wieder aufgekocht wurde, greift damit über die Frage, wie genomische Daten veröffentlicht werden, auf die Biowissenschaft und die gesamte Wissenschaft überhaupt über. Dabei stehen vielfältige Interessen auf dem Spiel, aber die Diskussion zeigt vor allem, dass die Ankunft des Internet, die Möglichkeit also, von jedem Ort der Erde auf Inhalte zugreifen und Inhalte schnell und billig weltweit veröffentlichen zu können, die Wissenschaft ebenso ereilt hat wie die übrige Medienindustrie. Was die Wissenschaftler fordern, ist schlicht eine Art Napster, eine offene Datenbank, in die alles eingespeist werden soll, was Wissenschaftler zunächst in Fachzeitschriften veröffentlicht haben. Erst die Möglichkeit, alle Texte an einem "Ort" mit Suchmaschinen finden und sie untereinander verlinken zu können, lässt aus der Gesamtheit der Wissenschaftsliteratur eine große Bibliothek entstehen. Auch bei dem Verlangen der Wissenschaftler zeigt sich, dass die herkömmlichen Vermittlungsinstanzen durch das Internet in Nöten geraten oder neue Modelle auftreten, die bessere Möglichkeiten des Austausches und Vertriebs anbieten.

Printmedien sind zu langsam und fallen hinter den Möglichkeiten von Online-Publikationen zurück

Letztes Jahr haben nach langen Diskussionen die National Institutes of Health, die oberste Gesundheitsbehörde in den USA, unter dem Namen PubMed Central eine neue Datenbank für wissenschaftliche Publikationen eröffnet. Das Ziel ist es, sämtliche biomedizinische Forschungsergebnisse ungekürzt, kostenlos und für alle zugänglich in einer einzigen Datenbank zu vereinigen. Getragen wird das Projekt vom National Center for Biotechnology Information (NCBI), das auch die GenBank betreibt, also die kostenlos zugängliche Datenbank, in die alle öffentlich geförderten Forschungsinstitutionen die Sequenzierungsdaten eingeben. Initiiert wurde dieses Projekt vom Medizin-Nobelpreisträger Harold Varmus, dem ehemaligen Präsidenten der NIH, der nun auch wieder hinter dem offenen Brief steht.

Seit langer Zeit ist in der Wissenschaft das Problem gewachsen, dass nicht nur die Zahl der Wissenschaftler und daher auch die der Forschungsergebnisse explodiert ist, sondern auch die Zahl der Publikationen. Die Preise der Zeitschriften, entstanden im 17. Jahrhundert, sind besonders in den letzten Jahrzehnten übermäßig angestiegen, die Bibliotheken können es sich oft nicht mehr leisten, viele dieser Zeitschriften zu abonnieren. Zudem sind die Printmedien mit ihren beschränkten Formaten und dem langwierigen Prozess des Peer Review in der Zeit des Internet, in der man die Ergebnisse schneller publizieren und rezipieren kann und will, einfach für viele zu langsam geworden. Die Institution des Peer Review sollte für die sonst übliche Selektion der Artikel durch die Redaktion sorgen, aber eine unabhängige und objektive Beurteilung ermöglichen, was natürlich oft genug nur illusorisch ist und zudem den Veröffentlichungsprozess sehr verlangsamt. Oft publizieren Wissenschaftler ihre Artikel auch auf ihren Webseiten oder auf einem der Preprint-Server wie dem xxx.lanl.gov/ für Vorabdrucke aus der Physik, da es in der Wissenschaft neben dem Aufmerksamkeits- und Renommeewert, den eine angesehen Zeitschrift vermittelt, auch auf die Schnelligkeit und Verbreitung ankommt. Überdies hat sich mittlerweile eine Praxis eingebürgert, zumindest für die Medien und die Öffentlichkeit populärwissenschaftliche Darstellungen zeitgleich mit der Veröffentlichung in der Fachzeitschrift ins Internet zu stellen.

Viele Publikationen veröffentlichen überdies gegen Bezahlung Artikel oder ganze Ausgaben im Internet, was auch die Möglichkeit anbietet, mehr Daten in vielen Formaten zum Artikel mit anbieten zu können. Seit 1999 bietet etwa der Springer-Verlag, der über 400 wissenschaftliche Fachzeitschriften herausgibt, über LINK Online-Veröffentlichungen von Artikeln lange vor der Printausgabe für eine Fachöffentlichkeit an. Innerhalb weniger Tage nach ihrer Imprimatur können sie bereits online publiziert werden. Diese "Online First"-Artikel gelten als endgültige Publikationen und dürfen nicht mehr zurückgezogen oder verändert werden. Überdies werden sie mit dem Digital Object Identifier (DOI), einem Standard für die Identifizierung digitaler Inhalte, der vergleichbar ist mit dem ISBN, registriert und zitierbar, auch wenn die Zeitung beispielsweise den Besitzer wechselt. Diese Registrierung wird von der International DOI-Foundation in Washington für die Fachverlage vorgenommen. Die Datenbank wird überdies mit Metadaten verbunden, so dass die Artikel miteinander verknüpft und aktualisiert werden können.

Offene Datenbank: Katalysator für die wissenschaftliche Produktivität

Die Wissenschaftler, die hinter dem Offenen Brief stehen, haben nun auch einen Artikel in der neuesten Ausgabe der Zeitschrift Science publiziert ("Building A "GenBank" of the Published Literature", Science Mar 23 2001: 2318-2319), in dem sie ihren Standpunkt vortragen. Dazu haben die Herausgeber der Zeitschrift eine Antwort veröffentlicht: "Is a Government Archive the Best Option?" Die Diskussion muss, wenn es nach den Wissenschaftlern geht, schnell geführt werden, denn ab September 2001 drohen die Unterzeichner damit, nicht mehr in Publikationen als Autor, Herausgeber oder Gutachter aufzutreten, die für alle Artikel 6 Monate nach ihrem Erscheinen keine unbeschränkten und kostenlosen Distributionsrechte für PubMed Central oder vergleichbare Online-Publikationen gewähren. Die Herausgeber von Science kritisieren natürlich den Boykottaufruf, der für eine sachliche Diskussion nicht gut sei, geben allerdings vor, das Ziel der Wissenschaftler zu "bewundern", und räumen ein, dass "die evolutionären Kräfte uns auf das Ziel zutreiben könnten". Die Forderung nach einem unbeschränkten Zugriff auf Forschungsergebnisse hat auch schon Früchte getragen: Science kündigt an, gegen Ende des Jahrs Artikel 12 Monate nach ihrem Erscheinen kostenlos auf die Webseite zu stellen.

Für die Wissenschaftler steht im Vordergrund, dass erst durch eine zentrale Datenbank ein umfassender Überblick über die Forschungsliteratur, eine effektive Suche und eine enge Verknüpfung der Artikel möglich werde: "Die Gründung einer solchen öffentlichen Bibliothek würde in hohem Ausmaß die Zugriffsmöglichkeiten auf und die Nützlichkeit der Wissenschaftsliteratur erhöhen, die wissenschaftliche Produktivität stärken und für die Integration unterschiedlicher Gemeinschaften, was das Wissen und die Ideen in den biomedizinischen Wissenschaften betrifft, als Katalysator dienen." Auch wenn einzelne Zeitschriften wie jetzt Science den Zugang zu Artikeln nach einer gewissen Zeit auf ihren Webseiten kostenlos ermöglichen, sei dies nicht ausreichend. Erst eine einzige Datenbank könne auf effektive Weise gewährleisten, dass alle Inhalte ein einheitliches Format besitzen und indexiert, gesucht sowie verlinkt werden können: "Überlegen Sie sich, wie weniger zweckmäßig genetische Sequenzen zu gebrauchen wären, wenn wir anstatt der GenBank oder anderen globalen Datenbanken Dutzende von kleineren Datenbanken mit den Sequenzen hätten, auf die man nur nacheinander über die Website eines Genomzentrums zugreifen könnte."

Für die Wissenschaftler ist ihr Vorschlag ein Kompromiss zwischen den Interessen der Verleger, der Wissenschaftler und der Öffentlichkeit. "Zum Ausgleich für ihre Rolle beim Herausgeben, Veröffentlichen und Peer Review erhalten die Verleger keinen Besitz an den originalen Forschungsberichten, die sie veröffentlichen, sondern ein sechsmonatiges Leasingrecht. Die Verleger erhalten diese Zeit von sechs Monaten, um ihre Kosten wieder einzuspielen und etwas zu verdienen, aber sie können nicht den permanenten Besitz an der einzig permanenten Aufzeichnung des wissenschaftlichen Fortschritts beanspruchen, der jährlich mit Milliarden von Dollar aus meist öffentlichen Geldmitteln finanziert wird und die ursprünglichen Ideen und Millionen von Stunden harter Arbeit von Hunderttausenden von Wissenschaftlern sowie die freiwillige Mitwirkung von Hunderttausenden von Patienten repräsentieren."

Verlust der Qualität?

Wie immer man die Frist einschätzt, die ein Verlag benötigt, um entstandene Kosten wieder einzuspielen, so dürfte der Vorschlag, dass alle wissenschaftlichen Artikel aus der Biomedizin und schließlich aus allen Wissenschaften nach einer gewissen Zeit ungehindert zugänglich, insgesamt indexiert und verlinkt sein sollen, schlicht vernünftig sein. Streiten kann man aber, ob dafür tatsächlich eine zentrale Datenbank notwendig sein müsste - und natürlich ob diese dann PubMed Central sein soll, wodurch die globale Datenbank unter den Fittichen einer amerikanischen Behörde stünde und von dieser abhängig wäre. Andere Initiativen aus der Wissenschaft, die ebenfalls den Bedarf nach einem ungehinderten Zugriff auf und einer engen Verknüpfung von großen Datenmengen äußern, denken hier eher wie beim Grid Physics Network (GriPhyNan) an verteilte globale Systeme (Vom World Wide Web zum World Wide Grid).

Insgesamt entsteht der Eindruck, dass dieser Aufruf eigentlich der Stärkung von PubMed Central dienen soll. Die Herausgeber von Science nutzen selbstverständlich diese offene Flanke und fragen, warum ausgerechnet PubMed Central und nicht etwa HighWire Press favorisiert wird, das nicht nur Science online publiziert, sondern weitaus mehr Publikationen (ca. 230) mit weit mehr kostenlosen Artikeln (bislang fast 240000) als PubMed Central online veröffentlicht. Zudem sei auch fraglich, ob eine Datenbank der Regierung wirklich eine gute Lösung sei, da die Regierung einerseits eben einen Großteil der biomedizinischen Forschung finanziert und dadurch auch steuert. Was passiert, wenn die Regierung Forschungsprogramme einstellt oder verbietet?

Kritisch sehen die Science-Herausgeber - natürlich - auch die ökonomische Seite. Verdient wird beispielsweise auch an Werbung, so dass hier Einkünfte entfallen würden, wenn die Artikel dann auf einer anderen Website sich befinden. Überdies würde zwar nach dem Erscheinen von Heften die Nachfrage nach aktuellen Artikeln innerhalb von 4 bis 5 Monaten auf ein Zehntel zurückgehen, aber auf niedrigerem Niveau noch lange Jahre anhalten. Man befürchtet einen Rückgang der Einnahmen aus Werbung und Abonnements, da viele möglicherweise nicht mehr auf die kostenpflichtigen Angebote zugreifen werden, sondern warten, bis ein kostenloser Zugang möglich ist.

Und dann führen die Science-Herausgeber an, was alle sagen, die traditionelle Strukturen verteidigen wollen, nämlich dass die Qualität durch mangelnde Selektion oder schlicht durch das Neue gefährdet wird: "Eine unbegrenzte Wiederveröffentlichung der Inhalte könnten zu einem Missbrauch von diesen und zu einem Verlust der Qualitätskontrolle führen."