TEIL II
Maschinen das Malen, Schreiben,
Komponieren und Spielen beibringen
Teil I war eine Einführung ins generative Deep Learning mit Fokus auf zwei der wichtigsten Innovationen der letzten Jahre, Variational Autoencoder und Generative Adversarial Networks. Der restliche Teil dieses Buchs stellt eine Reihe von Anwendungsfällen vor, wie generative Modellierungstechnik auf gewisse Aufgabenstellungen angewandt werden kann. Die nächsten drei Kapitel befassen sich mit drei zentralen Elementen der menschlichen Kreativität: Malen, Schreiben und musikalische Komposition.
In Kapitel 5 schauen wir uns zwei Methoden des maschinellen Malens an. Zuerst untersuchen wir das CycleGAN, das, wie der Name schon sagt, eine Adaption der GAN-Architektur ist, die dem Modell beibringt, ein Foto in ein Gemälde eines bestimmten Stils (oder umgekehrt) umzuwandeln. Danach schauen wir uns die neuronale Stiltransfer-Technik an, die in vielen Fotobearbeitungs-Apps verwendet wird, um den Stil eines Gemäldes auf ein Foto zu übertragen und so den Eindruck zu erwecken, dass es um ein Bild desselben Künstlers handelt.
In Kapitel 6 wenden wir uns dem maschinellen Schreiben zu – eine Aufgabe, die ganz andere Herausforderungen als die Bilderzeugung mit sich bringt. In diesem Kapitel lernen Sie das rekurrente neuronale Netzwerk (RNN) kennen, das uns erlaubt, Problemstellungen mit sequenziellen Daten anzugehen. Wir erfahren hier auch, wie die Encoder-Decoder-Architektur funktioniert, und erstellen damit einen einfachen Frage-Antwort-Generator.
Kapitel 7 befasst sich mit der Erzeugung von Musik, die zwar auch ein Problem der sequenziellen Generierung darstellt, aber noch zusätzliche Herausforderungen wie die Modellierung von Tonhöhe und Rhythmus mit sich bringt. Wir werden sehen, dass viele Methoden der Texterzeugung auch in dem Musikbereich angewandt werden können, aber wir werden uns ebenfalls mit einer Deep-Learning-Architektur namens MuseGAN befassen, die Ideen aus Kapitel 4 (über GANs) auf Musikdaten überträgt.
Kapitel 8 zeigt, wie generative Modelle auch in anderen Bereichen des maschinellen Lernens eingesetzt werden können, z. B. im Reinforcement Learning. Dieses Kapitel stellt einen der spannendsten Forschungsartikel der letzten Jahre vor. In diesem Beitrag zeigen die Autoren, wie ein generatives Modell als Umgebung verwendet werden kann, in der der Agent trainiert. Dadurch kann der Agent von möglichen Zukunftsszenarien träumen und simulieren, was passieren würde, wenn er bestimmte Aktionen vollzieht – und all das in seinem eigenen konzeptionellen Modell der Umgebung.
Abschließend fasst Kapitel 9 die aktuelle Entwicklung der generativen Modellierung zusammen und eruiert noch einmal die Methoden, die Sie in diesem Buch kennengelernt haben. Wir werfen auch einen Blick in die Zukunft und überlegen, wie die modernsten heute verfügbaren Methoden die Art und Weise, wie wir über Kreativität denken, verändern könnten. Schließlich fragen wir uns, ob wir jemals eine künstliche Intelligenz erzeugen können, die Kunst erschaffen kann, die sich in ihrer Kreativität nicht von den Werken menschlicher Vorreiter in Kunst, Literatur und Musik unterscheidet.
KAPITEL 5
Malen
Bislang haben wir verschiedene Möglichkeiten kennengelernt, ein Modell darauf zu trainieren, anhand eines Trainingsdatensatzes, den wir imitieren möchten, neue Beispiele zu erzeugen. Wir haben dies auf verschiedene Datensätze angewandt und gesehen, wie VAEs und GANs eine Zuordnung zwischen latentem Raum und ursprünglichem Pixelraum erlernen können. Durch das zufällige Wählen eines Punkts im latenten Raum können wir dann mithilfe des generativen Modells diesen Punkt in ein neues Bild im Pixelraum umwandeln.
Beachten Sie, dass alle bislang geseh...