Internet Babylon

Online-Wörterbücher und das dict-Protokoll

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

"Im Anfang war das Wort" beginnt Faust und stockt auch schon im Bemühen, die Bibel in sein "geliebtes Deutsch zu übertragen". Müsste das griechische "logos" aber nicht als Sinn übersetzt werden? Als Kraft? Als Tat?

Einen Blick ins Fremdwörterbuch gestattete Goethe seinem Universalgelehrten nicht. Theoretisch ließe sich heutzutage bei derartigen Skrupeln das Netz befragen. Praktisch bedeutet es wie üblich: Gewusst wo, denn Altavistas Babel-Fisch wird seinem Namensgeber aus "Per Anhalter durch die Galaxis" in keiner Weise gerecht. Allein für Übersetzungen vom Deutschen ins Englische und vice versa listet das Web of Online Dictionaries zehn Möglichkeiten auf. Die Angebote für Französisch und Spanisch fallen dagegen deutlich zurück, und zweisprachige Wörterbücher für Deutsch-Italienisch scheinen eine Angelegenheit für Spezialisten zu sein, vom Altgriechischen ganz zu schweigen.

Seltsamerweise trifft diese Beobachtung auch für Wörterbücher der deutschen Sprache zu. Einsam auf weiter Flur bietet das Projekt Deutscher Wortschatz an der Universität Leipzig einen Ansatz in diese Richtung. Es erklärt zwar nicht das abgefragte Wort, und eine Rechtschreibprüfung (z.B. lizensieren oder lizenzieren) findet auch nicht statt, aber die Antwort führt immerhin Sätze auf, in denen das gesuchte Wort im Zusammenhang verwendet wird.

Im englischsprachigen Raum ist die Situation deutlich besser. Seit diesem Monat hat das altehrwürdige "Oxford English Dictionary" (OED) seinen Weg ins Netz gefunden. Bislang war das Wörterbuch als 20-bändiger Regalfüller oder auf einer CD-Rom erhältlich. Jetzt versuchen die Herausgeber sich an dem Abenteuer, an dem schon die "Encyclopaedia Britannica" gescheitert ist: Den Online-Zugang wollen sie sich von Einzelpersonen mit 350£ im Jahr bezahlen lassen. Beim OED rechnet man jedoch mit universitären Institutionen, die ihre Druckausgabe mit einer Netzwerk-Lizenz durch das Online-Angebot ersetzen könnten. "Die meisten Leute werden in ihrer Bibliothek freien Zugang haben, so wie sie es gewöhnt sind", meint Juliet New, Sprecherin für das Online-Projekt.

Während das Angebot des OED vor allem von akademischem Interesse ist, steht mit dem amerikanischen Webster immerhin ein frei zugängliches kommerzielles Wörterbuch für den Hausgebrauch zur Verfügung. Daneben existiert mit Wordnet ein freies Wörterbuch, das aus einem Forschungsprojekt an der Universität Princeton hervorging. Es bietet Definitionen von etwas mehr als 120000 Wörtern. Noch etwas umfangreicher gibt sich die Ausgabe des Webster von 1913, die sich in der Public Domain befindet.

Die alten wie die neuen Angebote haben zwei Aspekte gemeinsam. Zum einen werden die Einträge zu ihren Stichwörtern von einer zentralen Redaktion abgesegnet. So arbeiten seit 1993 320 ausgewählte Spezialisten an der Revision des OED, die in zehn Jahren abgeschlossen sein soll. Zum anderen verlassen sich die Angebote auf ein Web-Interface. Das Nachschlagen wird damit zu einer umständlichen Angelegenheit: Browser starten, Adresse hervorkramen, Wort eingeben und warten. Beim Lesen von Online-Dokumenten mag das noch angehen, beim Schreiben eigener Texte wird es quälend. Der Griff zum herkömmlichen Buch erweist sich da in den meisten Fällen als deutlich schneller und effektiver.

Es könnte auch ganz anders sein. Bereits seit 1997 beschreibt der RFC 2229 ein Internet-Protokoll, das Abfragen an einen Wörterbuch-Server standardisiert. Mit "dictd" als Server und "dict" als Abfrageprogramm existiert eine stabil laufende Referenz-Implementation des Protokolls als Open Source. Der Server kann je nach Konfiguration die Anfragen mit Einträgen aus verschiedenen Wörterbüchern beantworten. Momentan aufbereitet für den Gebrauch mit dem dict-Protokoll sind unter anderem der Webster von 1913, die Definitionen aus Wordnet, kurioserweise zwei Bibel-Wörterbücher, aber auch das CIA World Factbook sowie das Jargon File. Die Voreinstellung für "dict" lautet, die Server unter dict.org abzufragen. "dictd" kann jedoch auch auf dem lokalen Rechner laufen.

Der Vorteil der Lösung offenbart sich an einem sonst schwer zu behaltenden Beispiel. Auf die Anfrage:

dict pcmcia
antwortet der Server:
1 definition found
From The Free On-line Dictionary of Computing (15Feb98) [foldoc]:
PCMCIA
{Personal Computer Memory Card International Association}. (Or People Can't Memorise Computer Industry Acronyms).

Genauso gut kann der Server Fragen nach "Daniel", "Barbados" "witch" oder "Nickel" beantworten. Für die Software spielt es keine Rolle, ob ein Stichwort in einer Sammlung chemischer Elemente, einem telefonischen Vorwahlverzeichnis oder einer Übersetzungswortliste auftaucht. Es kommt hinzu, dass dict auch MIME-fähig ist, die Einbindung von Bildern oder Tönen also möglich wäre. Die herkömmliche Trennung in spezialisierte Nachschlagewerke, die mit Akronym-Listen, Wörterbüchern oder Übersetzungsseiten auch ins Netz transportiert wurde, lässt sich damit von der Anwenderseite elegant umgehen. Da es sich um ein schlichtes Protokoll handelt, stünde auch einer Einbindung in existierende Email- oder Office-Programme nichts im Weg.

Oder doch? Der von Rik Faith entworfene Standard sieht vor, dass sowohl der Client als auch der Server Unicode-fähig sein müssen. Unicode soll in den nächsten Jahren die gängigen ASCII- oder ISO-Latin-Zeichensätze ablösen. Für englische Texte besteht hier kein Problem, da die Codierung der ASCII-Zeichen in Unicode übernommen wurde. Im Fall anderer Sprachen muss die Software jedoch erst angepasst werden. Trotzdem erscheint das Verlangen nach Unicode sinnvoll: Eine Übersetzung vom Deutschen ins Russische kann mittels Unicode samt phonetischer Schreibweise dargestellt werden.

Was der Server unter dict.org zentralisiert demonstriert, den Zugriff auf verschiedene Wörterbücher, ließe sich auch dezentral nutzen. Das Programm "dict" könnte eine beliebige Liste von Rechnern abklappern. Für die spezialisierten Anbieter bestünde keine Notwendigkeit, sich zusammen zu raufen. Die eingangs angeführten zehn Deutsch-Englisch-Wörterbücher ließen sich vom Anwender miteinander verknüpfen. Leider bietet jedoch kaum eines die Abfrage über das dict-Protokoll an.

Die Gründe dafür sind unterschiedlich. Frank Richter, der in Chemnitz mit DING ein deutsch-englisches Wörterbuch sowohl über das Web als auch für den lokalen Gebrauch anbietet, hat es auf seiner To Do-Liste stehen. Wolfram Schneider, der seinen Service über das Web anbietet, meint dagegen: "Eine Umstellung auf das dict-Protokoll würde den etwa 800 Benutzern und mir nichts bringen - außer viel Arbeit." Auch bei LEO.org wird an eine Umstellung nicht gedacht. Marc Sihling erzählt: "Bisher ist die Nachfrage nach einer Unterstützung dieses Protokolls sehr gering." Beim Internet Dictionary Project kamen seit 1995 unter Mithilfe von vielleicht 15-20000 Leuten, so schätzt Tyler Chambers, Initiator der Seiten, Übersetzungstabellen zu verschiedenen Sprachen zustande. Gehört hatte er von dem dict-Protokoll bislang jedoch nicht. So bleibt als einziger Heinrich Langos übrig, der in Dresden verschiedene Wortlisten, die allerdings noch der Überarbeitung bedürfen, im Dict-Format zusammengeführt hat.

Merkwürdigerweise handelt es sich bei den Bemühungen vorwiegend um vereinzelte Projekte. Eine offene Zusammenarbeit, wie sie im Bereich von Open Source demonstriert wird, findet nicht statt. Das ist um so erstaunlicher, als das Internet vorwiegend der Kommunikation dient, und das Reservoir derjenigen, die über ausreichende Sprachkenntnisse verfügen, deutlich größer ausfallen dürfte, als das der programmiertechnisch Versierten.

Einen Service etwas anderer Art bietet seit Anfang des Jahres Horst Eyermann an. Er stellt gleich eine ganze Reihe von bilingualen Wörterbüchern für den lokalen Gebrauch mit dict zur Verfügung und arbeitet daran, das dict-Programm auch unter Windows zum Laufen zu bringen. Zu kämpfen hat er bislang mit einer eher geringen Beteiligung an dem Projekt, das er als Open Source verstanden wissen möchte.

Rik Faith ist skeptisch, was den Open Source-Ansatz im Bereich von Wörterbüchern angeht: "Wenn man ein Wochenende damit verbringt, einige tausend Zeilen Code zu schreiben, steht am Ende der Prototyp eines Programms, das tatsächlich etwas tut." Im Gegensatz dazu entstünden im gleichen Zeitraum 200-1000 Definitionen für ein Wörterbuch, die von anderen Beteiligten mühselig überprüft werden müssten. "Damit weckt die Arbeit an einem Wörterbuch zu wenig Enthusiasmus."

Wer weiß? Vielleicht reizt die simple Idee, verschiedene Quellen auf einen Schlag zu erschließen, ja doch zur Tätigkeit. Solange Faust heutzutage für die Übersetzung des "logos" den Umweg über das Englische nehmen müsste, besteht allemal Bedarf.

Für Übersetzungen vom Englischen ins Deutsche und zurück existieren bereits diverse Sammlungen. Sie sind, wie beschrieben, zum Teil auch schon für den Gebrauch mit dict aufbereitet. Vorher sollten diese Listen jedoch zusammengeführt und durchgesehen werden. Wer sich dabei engagieren möchte, schreibe bitte an diese dict@minerva.hanse.de.