Generative Modelle haben sich zu einem der spannendsten Themenbereiche der Künstlichen Intelligenz entwickelt: Mit generativem Deep Learning ist es inzwischen möglich, einer Maschine das Malen, Schreiben oder auch das Komponieren von Musik beizubringen – kreative Fähigkeiten, die bisher dem Menschen vorbehalten waren. Mit diesem praxisnahen Buch können Data Scientists einige der eindrucksvollsten generativen Deep-Learning-Modelle nachbilden, wie z.B. Generative Adversarial Networks (GANs), Variational Autoencoder (VAEs), Encoder-Decoder- sowie World-Modelle.

David Foster vermittelt zunächst die Grundlagen des Deep Learning mit Keras und veranschaulicht die Funktionsweise jeder Methode, bevor er zu einigen der modernsten Algorithmen auf diesem Gebiet vorstößt. Die zahlreichen praktischen Beispiele und Tipps helfen Ihnen herauszufinden, wie Ihre Modelle noch effizienter lernen und noch kreativer werden können.

- Entdecken Sie, wie Variational Autoencoder den Gesichtsausdruck auf Fotos verändern können
- Erstellen Sie praktische GAN-Beispiele von Grund auf und nutzen Sie CycleGAN zur Stilübertragung und MuseGAN zum Generieren von Musik
- Verwenden Sie rekurrente generative Modelle, um Text zu erzeugen, und lernen Sie, wie Sie diese Modelle mit dem Attention-Mechanismus verbessern können
- Erfahren Sie, wie generatives Deep Learning Agenten dabei unterstützen kann, Aufgaben im Rahmen des Reinforcement Learning zu erfüllen
- Lernen Sie die Architektur von Transformern (BERT, GPT-2) und Bilderzeugungsmodellen wie ProGAN und StyleGAN kennen

"Dieses Buch ist eine leicht zugängliche Einführung in das Deep-Learning-Toolkit für generatives Modellieren. Wenn Sie ein kreativer Praktiker sind, der es liebt, an Code zu basteln, und Deep Learning für eigene Aufgaben nutzen möchte, dann ist dieses Buch genau das Richtige für Sie."
— David Ha, Research Scientist bei Google Brain

375,005 Studierende vertrauen auf uns

Zugang zu über 1,5 Millionen Titeln zu einem fairen monatlichen Preis.

Mit unseren Lerntools kannst du noch effizienter lernen.

Verlag

O'Reilly

Jahr

2020

ISBN drucken

9783960091288

eBook-ISBN:

9783960103547

Thema

Informatik

Thema

Data Mining

TEIL II

Maschinen das Malen, Schreiben,
Komponieren und Spielen beibringen

Teil I war eine Einführung ins generative Deep Learning mit Fokus auf zwei der wichtigsten Innovationen der letzten Jahre, Variational Autoencoder und Generative Adversarial Networks. Der restliche Teil dieses Buchs stellt eine Reihe von Anwendungsfällen vor, wie generative Modellierungstechnik auf gewisse Aufgabenstellungen angewandt werden kann. Die nächsten drei Kapitel befassen sich mit drei zentralen Elementen der menschlichen Kreativität: Malen, Schreiben und musikalische Komposition.

In Kapitel 5 schauen wir uns zwei Methoden des maschinellen Malens an. Zuerst untersuchen wir das CycleGAN, das, wie der Name schon sagt, eine Adaption der GAN-Architektur ist, die dem Modell beibringt, ein Foto in ein Gemälde eines bestimmten Stils (oder umgekehrt) umzuwandeln. Danach schauen wir uns die neuronale Stiltransfer-Technik an, die in vielen Fotobearbeitungs-Apps verwendet wird, um den Stil eines Gemäldes auf ein Foto zu übertragen und so den Eindruck zu erwecken, dass es um ein Bild desselben Künstlers handelt.

In Kapitel 6 wenden wir uns dem maschinellen Schreiben zu – eine Aufgabe, die ganz andere Herausforderungen als die Bilderzeugung mit sich bringt. In diesem Kapitel lernen Sie das rekurrente neuronale Netzwerk (RNN) kennen, das uns erlaubt, Problemstellungen mit sequenziellen Daten anzugehen. Wir erfahren hier auch, wie die Encoder-Decoder-Architektur funktioniert, und erstellen damit einen einfachen Frage-Antwort-Generator.

Kapitel 7 befasst sich mit der Erzeugung von Musik, die zwar auch ein Problem der sequenziellen Generierung darstellt, aber noch zusätzliche Herausforderungen wie die Modellierung von Tonhöhe und Rhythmus mit sich bringt. Wir werden sehen, dass viele Methoden der Texterzeugung auch in dem Musikbereich angewandt werden können, aber wir werden uns ebenfalls mit einer Deep-Learning-Architektur namens MuseGAN befassen, die Ideen aus Kapitel 4 (über GANs) auf Musikdaten überträgt.

Kapitel 8 zeigt, wie generative Modelle auch in anderen Bereichen des maschinellen Lernens eingesetzt werden können, z. B. im Reinforcement Learning. Dieses Kapitel stellt einen der spannendsten Forschungsartikel der letzten Jahre vor. In diesem Beitrag zeigen die Autoren, wie ein generatives Modell als Umgebung verwendet werden kann, in der der Agent trainiert. Dadurch kann der Agent von möglichen Zukunftsszenarien träumen und simulieren, was passieren würde, wenn er bestimmte Aktionen vollzieht – und all das in seinem eigenen konzeptionellen Modell der Umgebung.

Abschließend fasst Kapitel 9 die aktuelle Entwicklung der generativen Modellierung zusammen und eruiert noch einmal die Methoden, die Sie in diesem Buch kennengelernt haben. Wir werfen auch einen Blick in die Zukunft und überlegen, wie die modernsten heute verfügbaren Methoden die Art und Weise, wie wir über Kreativität denken, verändern könnten. Schließlich fragen wir uns, ob wir jemals eine künstliche Intelligenz erzeugen können, die Kunst erschaffen kann, die sich in ihrer Kreativität nicht von den Werken menschlicher Vorreiter in Kunst, Literatur und Musik unterscheidet.

KAPITEL 5

Malen

Bislang haben wir verschiedene Möglichkeiten kennengelernt, ein Modell darauf zu trainieren, anhand eines Trainingsdatensatzes, den wir imitieren möchten, neue Beispiele zu erzeugen. Wir haben dies auf verschiedene Datensätze angewandt und gesehen, wie VAEs und GANs eine Zuordnung zwischen latentem Raum und ursprünglichem Pixelraum erlernen können. Durch das zufällige Wählen eines Punkts im latenten Raum können wir dann mithilfe des generativen Modells diesen Punkt in ein neues Bild im Pixelraum umwandeln.

Beachten Sie, dass alle bislang geseh...

Cover
Titel
Impressum
Inhalt
Vorwort
Teil I Einführung ins Generative Deep Learning
Teil II Maschinen das Malen, Schreiben, Komponieren und Spielen beibringen
Fußnoten
Index
Über den Autor
Kolophon

Häufig gestellte Fragen

Kann ich jederzeit kündigen?

Ja, du kannst dein Abo jederzeit über den Tab Abo in deinen Kontoeinstellungen auf der Perlego-Website kündigen. Dein Abo bleibt bis zum Ende deines aktuellen Abrechnungszeitraums aktiv. Erfahre, wie du dein Abo kündigen kannst

Kann ich Bücher herunterladen?

Nein, Bücher können nicht als externe Dateien, z. B. PDFs, zur Verwendung außerhalb von Perlego heruntergeladen werden. Du kannst jedoch Bücher in der Perlego-App herunterladen, um sie offline auf deinem Smartphone oder Tablet zu lesen. Erfahre, wie du Bücher herunterladen kannst, um sie offline zu lesen

Welcher Unterschied besteht bei den Preisen zwischen den Aboplänen?

Perlego bietet zwei Pläne an: Essential und Complete

Essential ist ideal für Lernende und Fachkräfte, die es genießen, eine Vielzahl von Themen zu erkunden. Greife auf die Essential Library mit über 800.000 vertrauenswürdigen Titeln und Bestsellern in den Bereichen Wirtschaft, persönliche Weiterentwicklung und Geisteswissenschaften zu. Enthält unbegrenzte Lesezeit und Standard-Vorlesestimme.
Complete: Perfekt für fortgeschrittene Lernende und Forschende, die vollen, uneingeschränkten Zugriff benötigen. Entsperre über 1,5 Millionen Bücher zu Hunderten von Themen, einschließlich akademischen und spezialisierten Titeln. Der Complete-Plan enthält außerdem fortschrittliche Funktionen wie Premium Vorlesen und Forschungsassistent.

Beide Pläne sind mit monatlicher, halbjährlicher oder jährlicher Abrechnungskadenz verfügbar.

Wie funktioniert Perlego?

Wir sind ein Online-Lehrbuch-Abonnement-Service, bei dem du für weniger als den Preis eines einzelnen Buchs pro Monat Zugriff auf eine gesamte Online-Bibliothek erhältst. Bei über 1,5 Millionen Büchern zu mehr als 990 Themen bist du bestens versorgt! Erfahre mehr über unsere Mission

Unterstützt Perlego Text-zu-Sprache?

Achte auf das Symbol zum Vorlesen bei deinem nächsten Buch, um zu sehen, ob du es dir auch anhören kannst. Bei diesem Tool wird dir Text laut vorgelesen, wobei der Text beim Vorlesen auch grafisch hervorgehoben wird. Du kannst das Vorlesen jederzeit anhalten, beschleunigen und verlangsamen. Erfahre mehr über die Funktion „Vorlesen“

Kann ich auf meinem Tablet oder Smartphone lesen?

Ja! Du kannst die Perlego-App sowohl auf iOS- als auch auf Android-Geräten nutzen, damit du jederzeit und überall lesen kannst – sogar offline. Perfekt für den Weg zur Arbeit oder wenn du unterwegs bist.
Bitte beachte, dass wir Geräte, auf denen die Betriebssysteme iOS 13 und Android 7 oder noch ältere Versionen ausgeführt werden, nicht unterstützen können. Mehr über die Verwendung der App erfahren

Ist Generatives Deep Learning als Online-PDF/ePub verfügbar?

Ja, du kannst auf Generatives Deep Learning von David Foster, Marcus Fraaß, Konstantin Mack, Marcus Fraaß,Konstantin Mack im PDF- und/oder ePUB-Format sowie auf andere beliebte Bücher in Informatik & Data Mining zugreifen. In unserem Katalog stehen über 1,5 Millionen Bücher zur Verfügung.

Generatives Deep Learning

Maschinen das Malen, Schreiben und Komponieren beibringen

Generatives Deep Learning

Maschinen das Malen, Schreiben und Komponieren beibringen

Über dieses Buch

375,005 Studierende vertrauen auf uns

Information

TEIL II

Maschinen das Malen, Schreiben,
Komponieren und Spielen beibringen

KAPITEL 5

Malen

Inhaltsverzeichnis

Häufig gestellte Fragen

Über dieses Buch

375,005 Studierende vertrauen auf uns

Information

TEIL II

Maschinen das Malen, Schreiben,Komponieren und Spielen beibringen

KAPITEL 5

Malen

Inhaltsverzeichnis

Häufig gestellte Fragen

Maschinen das Malen, Schreiben,
Komponieren und Spielen beibringen