Das Rätsel der Handschrift
Ein neues Programm aus Israel soll der Durchbruch sein
Das Werk von Franz Kafka muss man sich vorstellen wie einen unendlichen Schreibstrom. Eng beschriebene Oktavhefte, in denen ein Text in den anderen übergeht, Das Urteil zum Beispiel, findet sich inmitten von Tagebucheintragungen und Einkaufszetteln, ebenso Der Heizer, das erste Kapitel von Kafkas Amerika-Roman. Bis heute mühen sich Kafka-Forscher an den so genannten Knäueln im Text ab, an jenen Passagen, die kaum mehr zu lesen sind vor lauter Korrekturen, Streichungen und Umstellungen. Neuere Editionen sind deshalb dazu übergegangen, die Manuskripte im Faksimile zu veröffentlichen, der Leser bekommt also nicht die aufbereitete Version zu lesen, sondern kann selbst entscheiden, wo's lang geht.
Nun ist die Welt zwar nicht voller Kafkas, aber voller Notizzettel, einige von ihnen mindestens so schwer zu entwirren wie ein kafkaeskes Knäuel. Mal angenommen, man wollte den Prozess des Entzifferns automatisieren. Dann gäbe es im Grunde gibt es nur eine Möglichkeit: ein leistungsfähiges Schrifterkennungsprogramm, das selbst Hieroglyphen in die Gegenwartssprache übersetzen kann. (Faksimiles, also Bilder, kommen deshalb nicht in Frage, weil man die nicht nach Stichworten durchsuchen kann.) Schaut man sich allerdings um auf dem Gebiet der Zeichenerkennung - auch ICR (Intelligent Character Recognition) genannt - ist auf absehbare Zeit nichts dergleichen in Sicht. Um auch nur halbwegs akzeptable Ergebnisse zu erzielen, muss der Anwender seine handschriftlichen Notizen entweder fein säuberlich in Druckbuchstaben oder aber - falls er zu den Palm-Benutzern gehört - gleich in einem eigens erlernten Code á là Grafiti abliefern. Andernfalls ist die Fehlerquote zu hoch.
85 Prozent heißt nämlich je nach Definition: Von einhundert Wörtern sind fünfzehn fehlerhaft, beziehungsweise werden von einhundert Zeichen fünfzehn falsch oder gar nicht erkannt. Anders ausgedrückt: fast jedes 7. Wort bzw. Zeichen ist fehlerhaft.
Tatsächlich werben diverse Programme mit Erkennungsraten von 85 Prozent und mehr. Aus Untersuchungen weiß man allerdings, dass Anwender erst ab einer Erkennungsrate von mindestens 97 Prozent das Gefühl haben, ihre Zeit nicht zu vergeuden. 85 Prozent heißt nämlich je nach Definition: Von einhundert Wörtern sind fünfzehn fehlerhaft, beziehungsweise werden von einhundert Zeichen fünfzehn falsch oder gar nicht erkannt. Anders ausgedrückt: fast jedes 7. Wort bzw. Zeichen ist fehlerhaft. Bei so viel Korrekturbedarf ist so mancher Text schneller von Hand abgetippt.
Sicher gab und gibt es zahlreiche Ansätze, den Zeichenaustausch zwischen Mensch und Maschine zu vereinfachen, indem man die Tastatur überflüssig macht, doch nur selten hatten sie kommerziellen Erfolg: Bereits 1968 bastelte der Informatiker Alan Kay an seinem Dynabook, aber es kam nie auf den Markt, stattdessen erfand Kay das graphische Interface. Als dann 1993 der Apple Newton auf den Markt kam, interessierte sich kaum jemand dafür, die angebliche Wundermaschine wurde zum Flop. Auch IBM Transnote, seit kurzem erhältlich, wird heftig attackiert: zu schwer, zu teuer, zu umständlich, zu lahm.
Selbst Programme wie SoftWriting von der israelischen Firma CharacTell, die von sich behauptet, auf dem Gebiet der Handschrifterkennung endlich den Durchbruch geschafft zu haben, müssen kapitulieren, sobald sie mit so genannter gebundener Schrift konfrontiert werden, bei der die einzelnen Buchstaben nicht für sich stehen, sondern durch diverse Bögen und Linien miteinander verbunden sind. Das Problem ist der Schreibfluss, beziehungsweise die Segmentierung der einzelnen Buchstaben. Es gibt zu viele mögliche Antworten auf die Frage, wo der eine Buchstabe aufhört und wo der andere anfängt, weil es zu viele Kombinationsmöglichkeiten gibt - schließlich hat man es mit dem gesamten Wortschatz zu tun und nicht, wie bei den Sortieranlagen der Post, mit einer endlichen Anzahl von Städte- und Straßennamen, die man zudem mit der Postleitzahl abgleichen kann.
Andererseits ließe sich durchaus was lernen von der Deutschen Post, wo man mit Schriften aller Art, also auch mit gebundener Schrift, zurechtkommen muss - und zwar seit 15 Jahren. So lange nämlich arbeitet die Post bereits mit Sortieranlagen, die von der Firma Siemens Dematic in Konstanz ständig weiterentwickelt werden. Um die Anlagen, die in alle Welt verkauft werden, auf ihre Aufgabe vorzubereiten, werden sie zunächst mit so genannten Test-Decks gefüttert: Tausenden von Briefen, die auf jede erdenkliche Weise adressiert sind. Damit das Ganze der Realität entspricht, werden Kopien von echten Briefen angefertigt. In dieser Anfangsphase dominiert die Handarbeit, denn jede Adresse muss manuell bestätigt werden - schließlich sollen sich keine Fehler einschleichen.
Die aktuelle Version des Post-Programms heißt 'RC1000', wobei das 'R' für Reading (Lesen) steht und das ‚C' für Coding (Eingabe). Das Lesen besorgt die Maschine, der Mensch das Übrige: Sollte das Programm bei einem Brief oder Päckchen ins Stolpern kommen, wird das fragliche Adressfeld an einem so genannten Codierplatz auf dem Bildschirm eingeblendet. Über die Tastatur oder auch per Spracheingabe können die Mitarbeiter das Problem lösen - und das Programm merkt sich, was es dazugelernt hat. Auf diese Weise bewältigen die Anlagen inzwischen bis zu 40.000 Briefe in der Stunde, die mit einer Geschwindigkeit von 4m/sek. an den Scannern vorbei flitzen.
Ganz ähnlich sieht auch die Anlernphase bei SoftWriting aus: Um eine vernünftige Basis zu schaffen, sollte der User mindestens 5 Seiten à 300 Wörter einscannen, wobei die einzelnen Buchstaben untereinander möglichst nicht verbunden und die Abstände zwischen den Wörtern ausreichend groß sein sollten. Dann muss man die erste Seite per Internet an den Server in Israel schicken, um das Handschriftliche in ein .rtf-Dokument übersetzen zu lassen. Klingt umständlich und bringt User mit Hang zur Paranoia unweigerlich in die Bredouille: eine offene Serververbindung nach Israel! Ab nächster Woche jedoch kann man eine Version runterladen, die ohne die Serververbindung funktioniert.
Da das Programm ständig dazulernt, wird der Lesevorgang mit jeder Anwendung schneller. Der Aspekt der Geschwindigkeit ist nicht ganz unerheblich, schließlich soll das Programm eine Arbeitserleichterung sein. Stellt sich nur die Frage, ob die User bereit sind, ihre Schrift auf Druckbuchstaben umzustellen - schließlich gehen gebundene Schrift und erhöhte Schreibgeschwindigkeit Hand in Hand. Ofer Comay, CEO und Präsident von CharacTell, ist zuversichtlich, schließlich sei Palm mit seiner gewöhnungsbedürftigen Sonderschrift Grafiti auch zum Marktführer geworden.
Um den neuartigen Ansatz von SoftWriting zu erläutern, macht Comay gerne Anleihen bei der Medizin, genauer gesagt bei der Genetik. Und zwar zerlegt SoftWriting jeden Buchstaben in einzelne Merkmale, die man sich laut Comay wie DNA-Sequenzen vorzustellen hat. Um zum Beispiel herauszufinden, ob der Kringel am Ende von die dasselbe bedeutet wie der Kringel in ‚wie', muss das Programm sich nicht mit Äußerlichkeiten aufhalten, sondern nur die unverwechselbare Sequenz vergleichen. Wie der Algorithmus, also die Umwandlung von graphischen Merkmalen in Sequenzen aus Buchstaben und Zahlen, im Einzelnen funktioniert, ist das Betriebsgeheimnis von CharacTell. Erhältlich ist das Ganze in einer Handvoll west-europäischer Sprachen.
Vorerst gibt es SoftWriting nur als Software für den Scanner, in Sachen Bundling ist man mit einem großen Scannerhersteller im Gespräch. Bereits zum Jahresende soll SoftWriting in so genannten digital pens und digital pads zur Anwendung kommen. Die Verbindung von manueller Schreibbewegung und digitalem Schreibwerkzeug bzw. digitaler Schreibunterlage hätte den Vorteil, dass man anders als auf dem Papier nicht nur den fertigen Buchstaben, sondern auch seine Entstehung in die Zeichenerkennung miteinbeziehen kann - was zu besseren Ergebnissen führen wird. Mit den Palm-Machern hat Comay zwar noch nicht gesprochen, aber was nicht ist, könne ja noch werden.
Die Kafka-Forschung muss sich also noch gedulden, und auch passionierte Kursivschreiber sollten sich nach Alternativen umsehen. Zum Beispiel könnten sie ihren auf Papier gebändigten Schreibstrom in einen Redeschwall verwandeln: Es gibt nämlich durchaus Spracheingabe-Programme, die mit etwas Geduld und Training bis zu 99 Prozent korrekte Ergebnisse liefern.