In 50 Millisekunden zur perfekten Story
Künstliche Intelligenz als Autor von Content
Acht Fragen an den Computerlinguisten, Firmengründer und bundesdeutschen Pionier der automatischen Generierung von Inhalten, Alexander Siebert, aus Anlass der Telepolis-Buchneuerscheinung "Roboterjournalismus, Chatbots & Co.", in dem sich ein Kapitel Sieberts Unternehmen Retresco widmet.
Herr Siebert, jetzt erklären Sie bitte mal einem Laien, wie das funktioniert, ein automatisch generierter Text?
Alexander Siebert: Am besten lässt sich das anhand eines Spielberichts zu einem Fußballspiel erklären. Zu jedem Fußballspiel gibt es nach Abpfiff Daten: die Aufstellung, das Spielergebnis und verschiedene Spielereignisse, wie Torschüsse, Auswechslungen oder gelbe und rote Karten. Auch historische Kontexte wie der bisherige Saisonverlauf können in Daten erfasst werden. Diese werden in einer Datenbank gespeichert und mittels einer Datenanalyse von der Software nach relevanten Aussagen untersucht. Spannend sind hierbei natürlich Fragestellungen nach dem Favoriten, Trends oder für das Spielergebnis entscheidenden Auswechslungen.
Auf Basis dessen schreibt die Software mithilfe des ihr beigebrachten Wortschatzes und Satz- und Phrasenbaukastens einzelne Sätze, die sinnvoll miteinander verknüpft werden und schließlich einen vollständigen Spielbericht ergeben. Für diesen gesamten Prozess des Berechnens und Schreibens eines solchen Berichts braucht die Technologie im Schnitt 50 Millisekunden.
Es ist fast eine philosophische Frage: Schafft es die Software, wirklich Neues zu produzieren oder setzt sie nur von Menschenhand verfasste, vorhandene Versatzstücke neu zusammen?
Alexander Siebert: Die Leistung der Software ist stark davon abhängig, was der Mensch ihr beibringt bzw. bereits beigebracht hat. Bestimmte Redewendungen, stilistische Mittel sowie linguistisches Basiswissen und Fachvokabular müssen ihr also antrainiert werden, damit sie auf Basis dessen neue Texte schreiben kann. Betrachtet man das Endergebnis, produziert die Software also durchaus Neues.
Neue Wörter, neue Satzkonstruktionen und neue Stilistik kann man aber noch nicht von ihr erwarten. Darüber hinaus ist die Software abhängig von Daten und den ihr beigebrachten Analysemöglichkeiten. Eine Doktorarbeit wird sie in der nächsten Dekade noch nicht schreiben, das wird noch eine ganze Weile dauern.
In meinem Buch sagen Sie, "eCommerce, Finance, Healthcare und LegalTech" seien "riesige Märkte", in denen "Texte massenhaft automatisiert werden" können. Können Sie ein paar Beispiele für bereits existierende Anwendungsszenarien geben? Und was schwebt Ihnen vor?
Alexander Siebert: Sprache ist und bleibt unser wichtigstes Kommunikationsmittel. Viele Unternehmen stellen mehr und mehr fest, dass sie sowohl in die Richtung ihrer Kunden als auch in Richtung ihrer Mitarbeiter viel kommunizieren müssen. Diese Kommunikation wird zunehmend individueller und persönlicher und kann schon aufgrund der wachsenden Individualität nicht durch Menschen allein bedient werden.
Des Weiteren verfügen Unternehmen heutzutage immer eher über eine gute Datenlage. Diese Daten sind essentiell für automatische Textgenerierung. So sehen wir z.B. im eCommerce verstärkt den Bedarf der Generierung von Produktbeschreibungen, die mit größerer Geschwindigkeit automatisch geschrieben und aktualisiert werden können, um zum Beispiel saisonale Höhepunkte einbetten zu können. In der Finanzindustrie gibt es viele standardisierte Reportings - wie automatisierte Research-Texte, Fondsberichte und Marktanalysen. Durch die automatische Textgenerierung können wir den immer komplexeren Marktsituationen sehr individuell und effizienter gerecht werden. Dieser Bedarf zieht sich durch alle Branchen und Sektoren und es zeigen sich quasi täglich neue Nutzungsszenarien.
Sie beschreiben in meinem Buch den Use Case immobilienscout24.de: Jemand gibt Eckdaten seiner zu vermietenden Wohnung ein und Ihre Textgenerierungssoftware macht daraus einen ansprechenden Text. Einerseits ist das eine sinnvolle Anwendung. Andererseits muss man sich Sorgen machen: Werden wir geistig zunehmend weniger gefordert? Werden wir irgendwann verdummen, wenn uns Software immer mehr Texte abnehmen wird, am Ende etwa auch Motivationsschreiben bei Bewerbungen?
Alexander Siebert: Nein, das sehe ich nicht so. In vielen Anwendungen geht es um Informationen für den Rezipienten, also den Leser. Sein Informationsbedürfnis muss gestillt werden und Sprache ist dafür ein ideales Mittel. Wenn dieser Prozess automatisiert ablaufen kann, ist sowohl dem Unternehmen als auch dem Kunden geholfen. In vielen Applikationen schreibt die Maschine auch nur für den Menschen vor. Maschine und Mensch gehen also Hand in Hand.
Personalisierung der Inhalte
2014 haben Sie einer Art Manifest für die Huffington Post Deutschland geschrieben: "Medien-Portale stellen ihren Lesern bis 2020 Inhalte zum überwiegenden Teil automatisiert und individualisiert zur Verfügung." Nun, war das nicht etwas zu optimistisch gedacht?
Alexander Siebert: Nein. Viele Medienportale experimentieren sehr intensiv mit der Personalisierung ihrer Angebote. Es gibt viele Inhalte, so dass es durchaus sinnvoll ist, diese Inhalte persönlicher auf Basis der Leseinteressen zusammenzustellen. So wie wir alle zunehmend individualisierte Suchergebnisse im Web oder Online Shop erhalten. Das bekommen wir nur nicht so bewusst mit, weil keiner die Ergebnisse im Alltag miteinander vergleicht. Hier kann man nur aus den ersten Erfahrungen sagen, dass viele Nutzer gar keine personalisierten Nachrichtenseiten nutzen möchten, weil sie stets das Gefühl hätten, etwas zu verpassen.
Auch das automatisierte Schreiben hält zunehmend in die datenbezogene Berichterstattung Einzug: Wetterberichte, Sportberichte, Events und vieles mehr werden automatisch erstellt. Das macht auch Sinn, weil es hier schlicht um ein Informationsbedürfnis geht, das ein Verlag bedienen muss.
Maschinen müssen erst noch lernen, neue Probleme auf Basis vorhandenen Wissens zu lösen
Man kann ja im Moment fast so etwas wie den Angriff der Bots erleben: Nicht nur Schreibroboter im Journalismus, Chatbots in der Kundenkommunikation, Social Bots in der Politik, Anwaltsbots im Rechtssystem und Teacherbots im Bildungssystem. In Kombination mit humanoiden Robotern gibt es auch Ersetzungsszenarien vom Zahnarzt bis zum Frisör. Wie sehen Sie das, wird das unsere Zukunft sein? Erobern Bots alle sozialen Systeme?
Alexander Siebert: Wir werden ihnen sicherlich immer mehr begegnen. Vor allem in Servicebereichen, aber auch in der internen Unternehmenskommunikation. Wir betreiben z.B. die interne Chatbot-Plattform der Commerzbank. Hier gibt es mehr und mehr Bots für die Mitarbeiterkommunikation, mit der man schnell und sehr individuell dem einzelnen Mitarbeiter Informationen und Orientierung geben kann. Das wird gut genutzt und stiftet tatsächlich viel Mehrwert.
Grundsätzlich muss man aber sagen, dass zu viele die Fähigkeiten dieser Technologie überschätzt haben und die Erwartungshaltung und der Aufwand nicht immer mit der Realität zusammenpassen, sodass der Trend aktuell eher wieder rückläufig ist. Das ist aber durchaus gelernt bei derartigen Tech Hypes. Es wird gute Beispiele geben, wie z.B. irgendwann Google Duplex. Ein Anwaltbot, der Ihr Mandat übernimmt, wird hingegen nicht mal eben Realität werden. Dazu müssen Maschinen erst einmal lernen, neue Probleme auf Basis vorhandenen Wissens zu lösen und somit wirklich intelligent zu sein. Das ist aber noch ein weiter Weg.
Wie "intelligent" automatische Textgenerierung schon arbeitet, könnte man doch daran bemessen, indem man Textgenerierungssoftware einfach eine Marktvorschau zum automatischen Textgenerierungsmarkt schreiben lässt. Und in fünf Jahren wissen wir, ob die Software Recht hatte. Wäre so etwas denkbar?
Alexander Siebert: Wenn man ihr die Daten für die Marktvorschau gibt, könnte sie einen solchen Bericht automatisch schreiben. Ob die Vorhersage aber richtig oder falsch war, hängt maßgeblich von den zur Verfügung gestellten Daten ab.
Zum Abschluss darf die Frage nach starker künstlicher Intelligenz nicht fehlen: Wie wird es weitergehen? Werden wir sie jemals erreichen? Was ist Ihre Prognose?
Alexander Siebert: Sie wird kommen. Da bin ich mir sicher. Aber das ist noch sehr lange hin. Ich bin jedoch dieser Debatte zunehmend überdrüssig, weil das die Erwartungshaltung an die Technologie lenkt. Wir müssen schauen, dass wir mit den Möglichkeiten der schwachen KI (weak AI) Lösungen schaffen, die in der Realität Einsatz finden: "Mensch und Maschine" und nicht "Mensch oder Maschine". Es werden gerade viele neue Berufe geschaffen, die die Technologie trainieren. Textagenturen z.B., die früher tagtäglich viele, viele Texte geschrieben haben, bauen heute Module für die Software, damit sie diese Arbeit übernimmt.
Andere Länder, wie z.B. China überholen uns in Nutzung, Forschung und Adaptionsgeschwindigkeit von KI sehr schnell. Wir müssen vor allem den Unternehmen und der öffentlichen Verwaltung helfen, diese KI-Technologien zu verstehen, zu bewerten und einzusetzen. Nur durch echten Einsatz und den kontinuierlichen Umgang mit KI sowie einer engen Verdrahtung mit der Forschung werden wir wettbewerbsfähig bleiben.
Diese Fragen sind aus meiner Sicht viel spannender als das genaue Jahrzehnt, an dem uns ein mechanisiertes Ebenbild des menschlichen Gehirns zur Verfügung stehen wird und uns alle auffressen will.
Alexander Siebert ist Gründer und kreativer Ideengeber von Retresco. Bevor er seine Leidenschaft für Daten und Sprache 2008 in einem eigenen Unternehmen bündelte, war er an der Berlin-Brandenburgischen Akademie der Wissenschaften tätig. Dort widmete er sich der Computerlinguistik und veröffentlichte eine Reihe wissenschaftlicher Publikationen.
Stefan Weber ist Medienwissenschaftler aus Salzburg und wurde als "Plagiatsjäger" einer breiteren Öffentlichkeit bekannt. Er publizierte 2007 bei Telepolis das vielbeachtete Buch "Das Google-Copy-Paste-Syndrom". 2018 erschien "Roboterjournalismus, Chatbots & Co.". Weber arbeitet als Researcher in Salzburg und als Universitätslektor an der Universität Wien.