NSA-Patent für Echelon?
Verfahren zur automatischen thematischen Durchsuchung von Texten
Noch immer schweigt sich der amerikanische Geheimdienst über die Existenz von Echelon aus, auch wenn der Direktor des australischen Geheimdienstes dessen Existenz bereits eingeräumt hat und nun der amerikanische Kongress einen Bericht über Echelon fordert. Ein Patent, das im August der NSA gewährt wurde, kann jetzt überdies ein Indiz auf die Eigenschaften des globalen Lauschsystems liefern.
Obgleich schon im Jahr 1997 eingereicht, wurde das Patent mit der Nummer 5,937,422 erst am 10. August 1999 veröffentlicht. Das amerikanische Patentamt hält alle Patentanträge solange unter Verschluss, bis das Patent bewilligt wird. Das NSA-Patent beschreibt ein Verfahren, wie sich ein Text, der auch von einer Maschine aus der gesprochenen Sprache transkribiert worden sein kann, nach bestimmten Themen durchsucht werden kann und so besser ist als eine Suche nach Schlüsselbegriffen. Als Anwendungsgebiete werden u.a. genannt: sprachgesteuerte Schnittstelle mit einem Computer, um beispielsweise in einer Datenbank nach Informationen zu suchen, Verarbeitung natürlicher Sprache, Nachverarbeitung, um die maschinelle Spracherkennung zu verbessern, oder automatische Übersetzung.
Zweifel wurden immer laut, ob Echelon tatsächlich in der Lage ist, alle über die Satelliten laufende Kommunikation nach bestimmten Begriffen zu durchsuchen, wie dies beschrieben wurde (STOA-Bericht. Was bei schriftlicher Kommunikation wie bei Faxmitteilungen oder Emails eher vorstellbar ist, scheint bei mündlicher Kommunikation doch bislang nahezu unmöglich zu sein. Wenn denn das im Patent beschriebene Verfahren tatsächlich funktioniert oder eingesetzt wird, dann könnte dies das ungerichtete Abhören von Millionen von Telefonanrufen zumindest erleichtern. In der Beschreibung wird denn auch gesagt, dass die Erkennung von Inhalten in einer freien Rede ein Forschungsbereich ist, der steigendes Interesse auf sich zieht. Schwierig sei dies aber, weil die in der Rede enthaltene Information niemals explizit ausgesprochen wird und weil mündliche Äußerungen stets weniger kohärent wie geschriebene Sätze seien. Der Patentantrag wurde, wie gesagt, bereits 1997 gestellt. In der Zwischenzeit könnte das Verfahren auch weiter perfektioniert worden sein. Ein älteres Patent wird übrigens auf der Website der NSA beschrieben.
Das Patent beschreibt ein Verfahren, wie sich automatisch für einen Text eine thematische Beschreibung erzeugen lässt oder wie er automatisch nach einem Inhalt durchsucht werden kann, ohne dabei auf ganz bestimmte Begriffe zurückgreifen zu müssen, da hierzu Definitionen verwendet werden. Das zu analysierende Dokument muss zwar ein Text - in beliebiger Länge - sein, "aber der Text kann aus jeder beliebigen Quelle stammen (e.g., machine transcribed speech, optical character reader, text generated from news wire, etc.)." Die automatische Erzeugung der thematischen Beschreibung soll Worte enthalten können, die im Dokument selbst nicht vorkommen. Überdies soll es mit der thematischen Beschreibung eines Dokumentes auch möglich sein, nach anderen Dokumenten mit derselben Beschreibung zu suchen, oder es sollen Dokumente nach ihrer thematischen Beschreibung sortiert werden können.