WolframAlpha

Die Berechnung der Welt

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

Es ist vier Uhr nachmittags auf dem Harvard-Campus, und Stephen Wolfram sagt:

Ich glaube, wenn ich zwanzig Minuten hätte, dann könnte ich den genauen Winkel der Sonne über dem momentanen Ort hier errechnen, und es könnte richtig sein. Aber ich würd's wahrscheinlich nicht machen. Und viele Leute wären gar nicht erst in der Lage, das korrekt auszurechnen. bringt nun dieses kleine Stück Wissenschaft, das es ermöglicht, für jeden Ort und jede Tageszeit den Winkel der Sonne zu bestimmen, und stellt es der Allgemeinheit zur Verfügung.

Wolfram ist halb durch eine zweistündige Präsentation von WolframAlpha; in wenigen Wochen soll der Service online gehen, und Ende April gab er vor Harvards Jurastudenten die erste Demo, die die Öffentlichkeit per Webcast mitverfolgen konnte. Mittlerweile ist klar, dass nicht als "Google-Killer" konzipiert ist, wie spekuliert wurde. Wolfram stellt seinem System lauter Fragen, auf die man von Google keine guten Antworten erwarten würde: Wieviel ist das Molekulargewicht von Koffein geteilt durch das von Wasser? Wie hoch ist die Lebenserwartung eines 40jährigen Mannes in Italien, heute im Vergleich zu 1933? Wie war das Wetter in Princeton, New Jersey, an dem Tag, als Kurt Gödel starb? "Durchschnittliche Temperatur 30 Grad Fahrenheit", Frost herrschte an jenem 14. Januar 1978, nun wissen wir es.

Stephen Wolfram bei seiner Präsentation in Harvard

Wenn jemand die Antwort auf eine bestimmte Frage bereits explizit formuliert hat, dann ist es Googles Job, sie zu finden. hingegen berechnet Informationen, die sich aus bekannten Zahlen ergeben, die aber nicht explizit zur Verfügung stehen. Zum Beispiel: "Was ist die Höhe des Mount Everest, geteilt durch die Länge der Golden Gate Bridge?"

Die Wahrscheinlichkeit, dass Google die Antwort auf derart spezifische Fragen findet, ist sehr gering. "Was wir mit machen: wir nehmen alles, was es an Daten über die Welt gibt, und alle Methoden und Modelle und Gleichungen und Formeln, die wir kennen, um Dinge miteinander in Beziehung zu setzen, und verpacke sie so, dass der Benutzer eine Website diese Art von Aufgaben stellen kann. Das Ziel ist, für ein sehr breites Spektrum an Themengebieten Expertenwissen zu generieren." Wolfram beschreibt vier Komponenten seines Systems:

  1. Kuratiertes Datenmaterial sowohl aus öffentlich zugänglichen wie auch aus propreitären Quellen; "viele Datenbanken", so Wolfram, "die nicht im Internet sind." Automatisches Vorbereiten von neuem Datenmaterial ist oft möglich, aber letzlich kann Wolframs System nur durch das Urteil menschlicher Experten erweitert werden - es lernt nicht von allein, weil Maschinen die Qualität des Erlernten nicht beurteilen können.
  2. Algorithmen. Mathematica, das Flaggschiff unter den Produkten von Wolfram Research, ist seit 23 Jahren eine führende Mathematik-Software. "Zum Glück gibt es nur eine endliche Zahl von mathematischen Methoden", freut sich Wolfram, und die meisten von ihnen sind mittlerweile implementiert in den "fünf bis sechs Millionen Zeilen Mathematica-Kode", die die Funktionalität von ausmachen.
  3. Eine linguistische Komponente. "Anders als bei den meisten Systemen zur Verarbeitung natürlicher Sprache, die längere Texte zu verstehen versuchen, ging es für uns darum, aus den kurzen Eingaben durchschnittlicher User schlau zu werden." Aud dieselbe Art wie ein Chatbot erkennt Sprachmuster und ersetzt sie sukzessive durch Ausdrücke in Mathematica-Kode.
  4. Generative Präsentations-Technologie. Mathematica ist berühmt für starke Werkzeuge zur Daten-Visualisierung, und generiert eine Unzahl von Grafen, Skalen, Tabellen, um Resultate darzustellen. "Auch hier braucht man viel Erfahrung, braucht menschliche Mitarbeit. Wir haben viele Jahre an etwas gearbeitet, was wir 'Computational Aesthetics' nennen und benutzen, um beispielsweise die Präsentation grafischer Daten automatisch zu optimieren."

"Es funktionier nur, wenn wir gleichzeitig an allen vier Komponenten arbeiten." Während seiner Demonstration bemühte sich Wolfram, keine übertriebenen Erwartungen zu schüren: "Ich war mir nicht sicher, ob es möglich wäre, und tatsächlich bin ich etwas überrascht, dass es so gut funktioniert, wie es das tut. Wir stehen erst am Anfang; wenn ich in eine typische Referenzbibliothek gehe, würde ich sagen, dass wir bei etwa 90 Prozent der Regale, die es dort gibt, immerhin schon mal mit der Kodierung angefangen haben."

Wenn im Mai online geht, soll die Site nicht nur mit Menschen interagieren können, sonder auch mit Computern: Durch Mathematica-Ausdrücke können Programmierer mit dem System kommunizieren und dessen Ergebnisse - ob auf der Ebene von automatisch generierten HTML-Seiten, von XML-Blobs oder von Resultaten einzelner Berechnungen - in die eigenen Anwendungen übernehmen.

Das System trägt auch der Tatsache Rechnung, dass manche wissenschaftlichen Ergebnisse umstritten beziehungsweise nur in einem bestimmten Kontext "wahr" oder "falsch" sind. Wer beispielsweise nach Informationen über die Eigenschaften des Redshift sucht, den fragt das System, ob er Einsteins statisches Modell eines Universums als Diskussionsgrundlage wählt oder ein späteres, dynamisches. Und wann immer jemand mit einem neuen, ernstzunehmenden Modell für das Universum um die Ecke kommt, muss dieses Modell erst kodiert und die Kodierung dann von Menschen überprüft werden, um den Usern zur Verfügung zu stehen. "Wir wollen einen zentralen Ort schaffen, an dem neues Wissen durch einen bestimmten Prozeß kodiert und so allen zur Verfügung gestellt werden kann. Meistens ist es doch heute so, dass nur Wissenschaftler was von wissenschaftlichen Erkenntnissen habe. Das wollen wir ändern"

In den letzten Jahren haben etwa hundert Wolfram-Angestellte an dem Projekt gearbeitet; bis zu tausend könnten es in Zukunft werden. Wolfram hofft, dass andere Forscher fehlende Daten beisteuern; die Aufgabe seiner Firma sieht er darin, eine effiziente Art der Dateneingabe zu ermöglichen. Das Problem ist, dass Wolframs Reputation an die Korrektheit des Datenapparats gekoppelt ist. Wolfram hat einige Widersacher; wenn jetzt aus aktuellem Anlass jemand eine große Menge an Daten über die Schweinegrippe zur Verfügung stellt, muss sein Team sicherstellen, dass ihm niemand eine Ente unterschiebt.