zurück zum Artikel

Die Automatisierung der Inhalte-Erstellung

KI als Autor von Content

Als ich das zum ersten Mal sah, dachte ich: Was zur Hölle ist das?

( Ein Nutzer berichtet in der Dokumentation "Inside Google" über seine Reaktion auf das für ihn erste automatisch generierte Fotoalbum von Google Photos)

"Kopieren, Programmieren, Automatisieren sind die neuen […] Werkzeuge.

( Kenneth Goldsmith, Klappentext zu "Uncreative Writing")

Weshalb staunte der versierte App-Nutzer? Die Google Photos-App hat automatisch eine Bildergalerie von Fotos seines jüngsten Urlaubs produziert. Wie aus dem Nichts war sie da, ungefragt: Ein- und auszoomende Urlaubsbilder, die Übergänge zum Teil mit Effekten, wie wir sie von PowerPoint kennen. Die Google-App hat alle Bilder geolokalisiert, die Reiseroute rekonstruiert und Datumsangaben ergänzt. Schließlich unterlegte sie das Ganze mit der üblichen Einheitsmusik, die wir von Abertausenden anderen Videos im Netz kennen.

Teil 1: Eine Million Bücher mit automatisch erzeugten Texten [1]

Zwangsbeglückung mit "kuratierten Sammlungen"

Mein iPhone hat mich im vergangenen Jahr ähnlich überrascht: Die Funktion heißt "Andenken".

'Andenken' legt automatisch kuratierte Sammlungen Ihrer wichtigsten Fotos und Videos an. Die Fotos-App durchsucht automatisch Ihre Mediathek nach bedeutenden Personen, Orten, Urlauben usw., und präsentiert diese dann in kuratierten Sammlungen, die als ‚Andenken‘ bezeichnet werden.

(Apple-Support [2])

Urplötzlich schenkte mir mein iPhone einen "Film" über den Sommerurlaub mit meiner Tochter.

Nicht nur Google und Apple, auch Facebook beglückt seine NutzerInnen mittlerweile mit solchen "Diashows". Unter dem Titel "Zusammenhalt ist alles" und mit dem Zwischentitel "Zusammensein macht glücklich" erhielt ich unlängst ein 43 Sekunden dauerndes, automatisch generiertes Video, in dem meine Aufnahmen mit einem Fotopool von Facebook scheinbar recht beliebig durchmischt wurden.

Der Inhalt des Facebook-Fotovideos ist gleichermaßen unangreifbar, d.h. politisch korrekt wie stupide. Der Themenkomplex Zusammensein/Zusammenhalt hat weltweite Gültigkeit. Das Template gilt für jede/n Facebook-NutzerIn, der oder die eine Anzahl von FreundInnen hat. Funktion ist wohl nur die eigene Viralität: das Teilen des Videos mit anderen. Der Inhalt selbst ist so sinnbefreit wie viele Social Cards oder Social Clips, die derzeit mit Tools der Semi-Automatisierung von Inhalten1 [3] für Facebook und andere soziale Medien erstellt werden.

Quelle: Eigener Screenshot von Facebook

Automatisch generierte Multimedia

Imageclips gelten bei vielen Unternehmen immer noch als sehr kostspielige Projekte. Weniger bekannt ist, dass es mittlerweile auch Angebote gibt, mit denen man gratis oder zu sehr niedrigen Kosten automatisch Videos generieren kann, wie etwa MySimpleShow. Der Berliner Pionier in Sachen automatischer Textgenerierung und Textanalyse, Retresco, hat mit MySimpleShow, ebenfalls aus Berlin, ein solches automatisches Imagevideo produziert. Auch die Stimme kommt hier natürlich von der Maschine.

Anbieter zur Erstellung von Erklärvideos arbeiten ebenfalls mit Templates, hier Storylines [4] genannt. Das Tool eignet sich nicht nur für Unternehmensvideos, sondern auch für Kochrezepte, Einladungen und Buchzusammenfassungen. Auch hier ist der ästhetische Preis zu zahlen: "Originalität" wird zur massenhaften Replikation.

Noch fertigen Studierende ihre Präsentationen mit PowerPoint (oder seltener: Prezi) selbst an, und die Inhalte sind noch sehr textlastig. Nur selten stellen StudentInnen ihr Thema mit einem Explainer Video dar. Doch das könnte sich ändern, wenn wir uns weiter weg von der typografischen und hin zur "posttypografischen Kultur" (Michael Giesecke2 [5], Frank Hartmann) bewegen, in der multimediale Skills den rein textlichen überlegen sein sollen.

Diese Beispiele zeigen, dass die vielgepriesene Multimedia-Kompetenz für die Erstellung von Multimedia-Inhalten dieser Art kaum mehr notwendig ist, da solche Contents (zumindest semi-)automatisch erstellt werden können. Google und Facebook beglücken NutzerInnen bereits mit Ready-Mades: Der/die NutzerIn muss gar nichts mehr auswählen bzw. in Auftrag geben, sondern der Push-Mechanismus der Medien selbst liefert die konfektionierten Inhalte frei Haus. Die eigene Kreativität, das eigene Arrangement, das eigene Storyboard sind hier nicht mehr vonnöten. Anbieter zur Produktion von Explainer Videos, von Social Cards oder Social Clips verlangen zumindest eine Auswahl aus einer endlichen Serie von Templates und auch noch das eigene Texten, wobei auch hier deutliche Limitierungen bestehen.

Automatisch generierte Fließtexte

Eigenes Texten? Wenn Bewegtbilder bereits automatisch produziert werden können, müsste dies auch für Texte möglich sein, obwohl die Aufgabe ungleich schwieriger erscheint. Doch gerade das Feld der automatischen Textgenerierung boomt seit einigen Jahren und scheint ökonomisch zumindest derzeit vielversprechender zu sein als automatisierte Multimedia-Produktion. Bei der automatischen Textgenerierung ist immer zu unterscheiden zwischen templatebasierten Ansätzen, Machine-Learning-Verfahren und "echten" Deep-Learning-Methoden auf Basis künstlicher neuronaler Netze, hier vor allem rekurrenter neuronaler Netze.

Quelle: 2txt [6]

Betrachten wir als nächstes einführendes Beispiel das Versprechen des Berliner Unternehmens "2txt - natural language generation". In der Selbstdarstellung [7] grenzt sich die Company von templatebasierten Ansätzen ab: "Unsere semantischen Modelle und Grammatiken sind wesentlich flexibler als herkömmliche Template-Lösungen und besitzen damit eine so große Ausdruckskraft, dass wir deutlich skalierbarer und vielfältiger Texte generieren können als vergleichbare Ansätze." Man kann daran glauben oder nicht. Nur Kunden könnten bestätigen, dass dies tatsächlich bereits funktioniert. Woher weiß selbst das schlaueste künstliche neuronale Netz "von sich aus", dass es sich etwa beim Modell GE72 7RE-049DE um "ein leistungsstarkes Oberklasse-Notebook" handelt? Eine solche Verknüpfung ist nur möglich, wenn das dem Programm schon einmal irgendwo gesagt wurde oder es Zugriff auf Dokumente oder Web-Inhalte hat, aus denen diese Information hervorgeht.

Wie immer in der Netzkultur ist es schwierig, Heilsversprechen von Unternehmen zu verifizieren. Jede Innovation produziert rasch zahllose Anbieter und Nachahmer im Netz. Nicht anders verläuft die derzeitige Entwicklung im Bereich der automatischen Textgenerierung.

Dennoch: Wie breit das Feld der automatisch erzeugten Inhalte (d.h. von Automated Content) bzw. das Feld des Versprechens von automatisch erzeugten Inhalten bereits ist, zeigt folgende Tabelle, die selbstverständlich keinen Anspruch auf Vollständigkeit erhebt (eigene Übersicht, Erhebungszeitraum Juli 2018, aktualisiert November 2018):

Bekannte Anbieter automatisch erzeugter Inhalte nach Content-Typen:
Content-Typ Anbieter (Auswahl) Webseite
Journalistischer Text (z.B. Wetter, Sport, Wirtschaftsnachrichten, Wahlergebnis) In den USA z.B. Automated Insights und Narrative Science, in DE z.B. Retresco, AX Semantics, TextOmatic https://automatedinsights.com [8], https://narrativescience.com [9], https://www.retresco.de [10], https://www.ax-semantics.com [11], https://textomatic.net [12]
E-Commerce-Text (z.B. Produktbeschreibung) 2TXT, Retresco, AX Semantics, TextOmatic https://2txt.de [13], https://www.retresco.de [14], https://www.ax-semantics.com [15], https://textomatic.net [16]
Google-Analytics-Bericht Narrative Science https://www.quillengage.com [17]
Wissenschaftlicher (Kurz-)Text Articoolo http://essaybuddy.net [18]
Wissenschaftliches Buch ICON Group International https://www.icongrouponline.com [19]
Belletristisches Buch (Lyrik, Roman …) P.M. Parkers Algorithmus,
ICON Group
https://www.youtube.com/watch?v=SkS5PkHQphY [20]
Songtext DopeLearning
Rap Lyrics Generator
http://deepbeat.org/ [21]
Infografik Graphiq https://www.graphiq.com [22]
Kunstwerk
(Grafik, Bild)
Rutgers University, Googles DeepDream https://sites.google.com/site/digihumanlab/home [23] (nicht kommerziell); https://ai.googleblog.com/2015/07/deepdream-code-example-for-visualizing.html [24]
https://sites.google.com/site/digihumanlab/home [25] (nicht kommerziell); https://ai.googleblog.com/2015/07/deepdream-code-example-for-visualizing.html [26] (nicht kommerziell)
Explainer Video simpleshow https://www.mysimpleshow.com/de [27]
Video, Imageclip Wibbitz https://www.wibbitz.com [28]
Computerspiel Farm Defenders von TotoGEO (P. M. Parker) https://www.youtube.com/watch?v=xIJdfQDihUc [29]
(Kurz-)Film Thereforefilms http://www.thereforefilms.com/sunspring.html [30]

Automatisch generierte Inhalte als nächste Etappe der Digitalisierung

Paradigmatisch geht es immer darum, dass Daten in Content verwandelt werden: Das ist das Versprechen von Automated Content. Bislang hat die Digitalisierung die Tools zur Produktion von Inhalten perfektioniert. Nun macht sie sich daran, die Produktion von Inhalten selbst zu leisten. Der "Kommunikator" aus der Kommunikationswissenschaft, der bislang in allen Modellen als ein Mensch gedacht war, kann nun auch ein Computerprogramm, kann ein Code sein. Das ist neu in der Evolution der Medien, obwohl sich Spuren eines "Schreibroboters" bereits 1726 in Jonathan Swifts "Gullivers Reisen" finden lassen.3 [31]

Bislang galt die Unterscheidung von Daten und Informationen oder die Trias von Daten, Informationen und Wissen als unverrückbar. Ebenso hieß es: Die Daten kann zwar die Maschine liefern, aber die Interpretation der Daten muss immer noch der Mensch leisten. Nunmehr scheint auch die Interpretation algorithmisch bearbeitbar zu werden. Semantische Technologien erheben erstmals den Anspruch, tatsächliches Textverstehen zu leisten. Neuere Ansätze wie etwa die Latente Semantische Analyse (LSA) oder die von AX Semantics eingesetzte Technologie versprechen die automatische Erkennung des Bedeutungsraums eines Wortes oder ganzen Satzes. Dabei ist immer zu berücksichtigen, dass es sich um mathematische Verfahren handelt, die - ganz im Sinne der Philosophen Ludwig Wittgenstein und Josef Mitterer - innerhalb der Sprache agieren. Wenn der semantische Raum ein Vektorraum ist, gibt es keinen "Realitätskontakt". Vielmehr treffen Terme der Sprache auf mathematische Gleichungen. Die Versuche, dem Computer Textverstehen, also eine Art Hermeneutik beizubringen, passen somit zu Strömungen in der Sprachphilosophie, die Bedeutungen auf andere Bedeutungen zurückführen und/oder Sprache als wichtigsten (im radikalen Sinne sogar: primordialen und alleinigen) Konstrukteur von Wirklichkeit verstehen.

Die (noch ungeschriebene) kurze Geschichte von Automated Content

Noch niemand hat eine Geschichte von Automated Content geschrieben. An dieser Stelle nur so viel: Vorboten von Automated Content finden sich im analogen Zeitalter gleich mehrere: Man denke nur an die Methoden des Cut-up und Fold-in von William S. Burroughs und Brion Gysin, also des Zerschneidens, Faltens und Neu-Zusammenlegens von Texten, wodurch scheinbar beliebige und nicht verständliche ‚neue‘ Texte entstehen. Durch menschliche Auswahl dieser willkürlichen Kreationen entstehen mögliche neue Sinnzusammenhänge. Das Prinzip der Aleatorik spielte im 20. Jahrhundert nicht nur in der Literatur, sondern auch in der Malerei und in der Musik eine Rolle. Automatisches Schreiben gilt schon seit den Surrealisten als eine Methode, um am Bewusstsein vorbei Texte zu generieren.4 [32] Roland Barthes‘ vielzitiertes semiologisches Diktum vom "Tod des Autors" war zwar 1969 als Aufruf gedacht, sich weniger um die Intentionen des Autors und mehr um den Text selbst zu kümmern, erhält aber aus heutiger Sicht eine neue Bedeutung: Der menschliche Autor wird womöglich zunehmend obsolet, wenn Algorithmen Texte, Bilder und schließlich sogar Filmskripte produzieren können. Im positiven Szenario werden bloß redundante Tätigkeiten vom Computer erledigt werden: Wer will schon Hunderte Produktbeschreibungen für einen Webshop verfassen oder aus Fließtexten dutzende Prüfungsfragen und Antworten für Multiple-Choice-Tests generieren? Wenn hierbei die Maschine hilfreich oder gar federführend sein kann, scheint das einen positiven Effekt zu haben: In der Positiv-Vision von Automated Content hat der Mensch (wieder mehr) Zeit, sich um kreative(re) Aufgaben zu kümmern.

Was geschieht aber, wenn Algorithmen sich aufmachen5 [33], um in jene Domäne der Kreativität, des Erzeugens von neuem Wissen vorzudringen, von der man noch bis vor Kurzem glaubte, dass sie auch weiter exklusiv dem Menschen vorbehalten sein wird? Nehmen wir etwa den kreativen Prozess des Schreibens einer wissenschaftlichen Arbeit: Was geschieht, wenn die Arbeitsschritte der Themenfindung, der Literatursuche, der Quellenbewertung, des Zitierens und des Schreibens von Computerprogrammen übernommen werden können? Automatisches Lektorat und Layout verstehen sich von selbst. Und: Die automatisch generierten Texte werden dann auch noch zunächst vom Computer und nicht vom Menschen geprüft, namentlich von Plagiatssoftware. Was geschieht, wenn der Kommunikator ein Computerprogramm ist und der erste Rezipient ein anderes Computerprogramm? Man kann dann nicht mehr argumentieren, dass der Computer redundante Tätigkeiten erledigen würde. Im Gegenteil, er würde dann ja in das Zentrum der menschlichen Kreativität vordringen. Ebenso verfehlt wäre der Hinweis darauf, dass Studierende dann Zeit für andere Kreativarbeiten hätten. Denn auch Bilder, Videos und Filme könnte dann der Computer erstellen. In einem solchen Szenario wäre der Mensch tatsächlich nur noch eines: der Programmierer und Optimierer der Maschinen, der Überwacher des automatisierten Prozesses. (Und wenn sich eines Tages auch noch die Programme selbst optimieren können, was dann?)

Die Auswirkungen auf menschliche Sprache und Kognition wären nicht absehbar. Unsere Hirnstrukturen würden sich wohl stark verändern, wenn wir nicht mehr selbst kreativ Probleme lösen müssen, sondern nur noch die Codes perfektionieren, die für uns die Probleme lösen.

Dieser Artikel ist eine leicht überarbeitete Fassung von Kapitel 2 des Buchs "Roboterjournalismus, Chatbots & Co. Wie Algorithmen Inhalte produzieren und unser Denken beeinflussen", erschienen am 19.11.2018 in der Heise-Reihe "Telepolis".


URL dieses Artikels:
https://www.heise.de/-4228345

Links in diesem Artikel:
[1] https://www.heise.de/tp/features/Eine-Million-Buecher-mit-automatisch-erzeugten-Texten-4209972.html
[2] https://support.apple.com/de-de/HT207023
[3] https://www.heise.de/tp/features/Die-Automatisierung-der-Inhalte-Erstellung-4228345.html?view=fussnoten#f_1
[4] https://www.mysimpleshow.com/de/features/#all-storylines
[5] https://www.heise.de/tp/features/Die-Automatisierung-der-Inhalte-Erstellung-4228345.html?view=fussnoten#f_2
[6] https://2txt.de
[7] https://2txt.de
[8] https://automatedinsights.com
[9] https://narrativescience.com
[10] https://www.retresco.de
[11] https://www.ax-semantics.com
[12] https://textomatic.net
[13] https://2txt.de
[14] https://www.retresco.de
[15] https://www.ax-semantics.com
[16] https://textomatic.net
[17] https://www.quillengage.com/
[18] http://essaybuddy.net/
[19] https://www.icongrouponline.com/
[20] https://www.youtube.com/watch?v=SkS5PkHQphY
[21] http://deepbeat.org/
[22] https://www.graphiq.com/
[23] https://sites.google.com/site/digihumanlab/home
[24] https://ai.googleblog.com/2015/07/deepdream-code-example-for-visualizing.html
[25] https://sites.google.com/site/digihumanlab/home
[26] https://ai.googleblog.com/2015/07/deepdream-code-example-for-visualizing.html
[27] https://www.mysimpleshow.com/de
[28] https://www.wibbitz.com
[29] https://www.youtube.com/watch?v=xIJdfQDihUc
[30] http://www.thereforefilms.com/sunspring.html
[31] https://www.heise.de/tp/features/Die-Automatisierung-der-Inhalte-Erstellung-4228345.html?view=fussnoten#f_3
[32] https://www.heise.de/tp/features/Die-Automatisierung-der-Inhalte-Erstellung-4228345.html?view=fussnoten#f_4
[33] https://www.heise.de/tp/features/Die-Automatisierung-der-Inhalte-Erstellung-4228345.html?view=fussnoten#f_5