Deep Learning für die Biowissenschaften
eBook - ePub
Verfügbar bis 19 Apr |Weitere Informationen

Deep Learning für die Biowissenschaften

Einsatz von Deep Learning in Genomik, Biophysik, Mikroskopie und medizinischer Analyse

  1. 236 Seiten
  2. German
  3. ePUB (handyfreundlich)
  4. Über iOS und Android verfügbar
eBook - ePub
Verfügbar bis 19 Apr |Weitere Informationen

Deep Learning für die Biowissenschaften

Einsatz von Deep Learning in Genomik, Biophysik, Mikroskopie und medizinischer Analyse

Über dieses Buch

Deep Learning hat bereits in vielen Bereichen bemerkenswerte Ergebnisse erzielt. Jetzt hält es Einzug in die Wissenschaften, insbesondere in die Biowissenschaften. Dieses praxisorientierte Buch bietet Programmierern und Wissenschaftlern einen Überblick darüber, wie Deep Learning in Genomik, Chemie, Biophysik, Mikroskopie, medizinischer Analyse und der Arzneimittelforschung eingesetzt wird.
Das Buch vermittelt Deep-Learning-Grundlagen und führt in die Arbeit mit der Python-Bibliothek DeepChem ein. Sie erfahren, wie Deep Learning z.B. zur Analyse von Mikroskopaufnahmen, für molekulare Daten und bei medizinischen Scans genutzt wird. Abschließend zeigen Bharath Ramsundar und seine Co-Autoren anhand einer Fallstudie Techniken für die Entwicklung neuer Therapeutika, eine der größten interdisziplinären Herausforderungen der Wissenschaft.
  • Lernen Sie, wie Machine Learning auf molekulare Daten angewendet werden kann
  • Erfahren Sie, warum Deep Learning ein mächtiges Werkzeug für Genetik und Genomik ist
  • Setzen Sie Deep Learning ein, um biophysikalische Systeme zu verstehen
  • Erhalten Sie eine kurze Einführung in Machine Learning mit DeepChem
  • Nutzen Sie Deep Learning zur Auswertung von Mikroskopaufnahmen
  • Analysieren Sie medizinische Scans mithilfe von Deep-Learning-Techniken
  • Erfahren Sie mehr über Variational Autoencoder (VAE) und Generative Adversarial Networks (GANs)
  • Interpretieren Sie, was Ihr Modell tut und wie es funktioniert

"Ein wertvoller Beitrag für die wissenschaftliche Community."
– Prabhat
Teamleader Data and Analytics Services, NERSC, Lawrence Berkeley National Laboratory
"Ein hervorragender High-Level-Überblick, dersowohl Einstiegspunkte in bestimmte Techniken bietet als auch die Erörterung der zugrundeliegenden Wissenschaft."
– C. Titus Brown
Associate Professor, University of California, Davis

Häufig gestellte Fragen

Ja, du kannst dein Abo jederzeit über den Tab Abo in deinen Kontoeinstellungen auf der Perlego-Website kündigen. Dein Abo bleibt bis zum Ende deines aktuellen Abrechnungszeitraums aktiv. Erfahre, wie du dein Abo kündigen kannst.
Derzeit stehen all unsere auf mobile Endgeräte reagierenden ePub-Bücher zum Download über die App zur Verfügung. Die meisten unserer PDFs stehen ebenfalls zum Download bereit; wir arbeiten daran, auch die übrigen PDFs zum Download anzubieten, bei denen dies aktuell noch nicht möglich ist. Weitere Informationen hier.
Perlego bietet zwei Pläne an: Elementar and Erweitert
  • Elementar ist ideal für Lernende und Interessierte, die gerne eine Vielzahl von Themen erkunden. Greife auf die Elementar-Bibliothek mit über 800.000 professionellen Titeln und Bestsellern aus den Bereichen Wirtschaft, Persönlichkeitsentwicklung und Geisteswissenschaften zu. Mit unbegrenzter Lesezeit und Standard-Vorlesefunktion.
  • Erweitert: Perfekt für Fortgeschrittene Studenten und Akademiker, die uneingeschränkten Zugriff benötigen. Schalte über 1,4 Mio. Bücher in Hunderten von Fachgebieten frei. Der Erweitert-Plan enthält außerdem fortgeschrittene Funktionen wie Premium Read Aloud und Research Assistant.
Beide Pläne können monatlich, alle 4 Monate oder jährlich abgerechnet werden.
Wir sind ein Online-Abodienst für Lehrbücher, bei dem du für weniger als den Preis eines einzelnen Buches pro Monat Zugang zu einer ganzen Online-Bibliothek erhältst. Mit über 1 Million Büchern zu über 1.000 verschiedenen Themen haben wir bestimmt alles, was du brauchst! Weitere Informationen hier.
Achte auf das Symbol zum Vorlesen in deinem nächsten Buch, um zu sehen, ob du es dir auch anhören kannst. Bei diesem Tool wird dir Text laut vorgelesen, wobei der Text beim Vorlesen auch grafisch hervorgehoben wird. Du kannst das Vorlesen jederzeit anhalten, beschleunigen und verlangsamen. Weitere Informationen hier.
Ja! Du kannst die Perlego-App sowohl auf iOS- als auch auf Android-Geräten verwenden, um jederzeit und überall zu lesen – sogar offline. Perfekt für den Weg zur Arbeit oder wenn du unterwegs bist.
Bitte beachte, dass wir keine Geräte unterstützen können, die mit iOS 13 oder Android 7 oder früheren Versionen laufen. Lerne mehr über die Nutzung der App.
Ja, du hast Zugang zu Deep Learning für die Biowissenschaften von Bharath Ramsundar,Peter Eastman,Patrick Walters,Vijay Pande, Helena Schock im PDF- und/oder ePub-Format. Aus unserem Katalog stehen dir über 1 Million Bücher zur Verfügung.

Information

Verlag
O'Reilly
Jahr
2020
eBook-ISBN:
9783960103516

KAPITEL 1

Warum Biowissenschaften?

Einsatzgebiete für all diejenigen mit technischem Verständnis und Leidenschaft für Daten gibt es viele, aber nur wenige Gebiete haben eine so grundlegende Auswirkung wie die biomedizinische Forschung. Der Beginn der modernen Medizin hat die Natur der menschlichen Existenz grundlegend verändert. In den letzten 20 Jahren wurden wir Zeuge, wie Innovationen das Leben unzähliger Menschen verändert haben. Bei ihrem ersten Auftreten im Jahr 1981 war HIV/Aids eine zumeist tödliche Krankheit. Die kontinuierliche Weiterentwicklung antiretroviraler Therapien hat die Lebenserwartung betroffener Patienten erheblich verlängert. Andere Krankheiten, wie zum Beispiel Hepatitis C, die vor einem Jahrzehnt noch als nicht behandelbar galt, können nun geheilt werden. Fortschritte in der Genetik ermöglichen die Identifikation und, hoffentlich bald, die Behandlung einer Vielzahl von Erkrankungen. Dank innovativer Diagnostik und Instrumentierung können Mediziner Krankheiten im menschlichen Körper spezifisch identifizieren und gezielt behandeln. Viele dieser Durchbrüche haben von rechnergestützten Methoden profitiert und werden durch diese weiter vorangetrieben.

Warum Deep Learning?

Algorithmen für Machine Learning sind inzwischen ein wichtiger Bestandteil des Alltags, vom Onlineshopping bis Social Media. Informatiker entwickeln Algorithmen, die es digitalen Assistenten wie Amazon Echo oder Google Home ermöglichen, Sprache zu verstehen. Fortschritte im Machine Learning haben die Übersetzung von Webseiten im laufenden Betrieb ermöglicht. Des Weiteren hat Machine Learning viele Bereiche der Physik und Biowissenschaften beeinflusst. Algorithmen werden auf alles angewandt, von der Entdeckung neuer Galaxien aus Teleskopaufnahmen bis zur Klassifizierung subatomarer Wechselwirkungen am Large Hadron Collider.
Eine der Triebfedern dieser technologischen Fortschritte war die Entwicklung einer Klasse von Methoden des Machine Learning, die als Deep Neural Networks bekannt sind. Während die technologischen Voraussetzungen für künstliche neuronale Netze in den 1950er-Jahren entwickelt und in den 1980er-Jahren verfeinert wurden, entfaltete sich deren volles Potenzial erst in den letzten zehn Jahren mit der Weiterentwicklung der Computerhardware. Im nächsten Kapitel werden wir eine umfassendere Übersicht über Deep Neural Networks geben, es ist jedoch wichtig, die aus der Anwendung von Deep Learning entstandenen Fortschritte zu würdigen:
  • Viele der Entwicklungen bei der Spracherkennung, die in Mobiltelefonen, Computern, Fernsehern und anderen mit dem Internet verbundenen Geräten allgegenwärtig sind, wurden durch Deep Learning vorangetrieben.
  • Die Bilderkennung ist eine Schlüsselkomponente für selbstfahrende Autos, die Internetsuche und andere Anwendungen. Viele der Deep-Learning-Entwicklungen, die Anwendungen für Privatkunden vorangetrieben haben, werden jetzt in der biomedizinischen Forschung eingesetzt, zum Beispiel um Tumorzellen verschiedenen Typen zuzuordnen.
  • Empfehlungssysteme sind zu einer Schlüsselkomponente des Onlineerlebnisses geworden. Unternehmen wie Amazon wenden Deep Learning an, um ihre Kunden, die ein bestimmtes Produkt gekauft haben, dazu zu bewegen, zusätzliche Einkäufe zu tätigen. Netflix geht ähnlich vor, um Filme vorzuschlagen, die ein Nutzer möglicherweise ebenfalls sehen möchte. Viele der Ideen, die hinter diesen Empfehlungssystemen stehen, werden verwendet, um neue Moleküle zu identifizieren, die als Ausgangspunkte für neue Wirkstoffentdeckungen dienen könnten.
  • Übersetzungen waren einst die Domäne sehr komplexer statistischer Computerprogramme. In den letzten Jahren hat Deep Learning die Systeme, die jahrelang manuell kuratiert wurden, übertroffen. Viele der gleichen Ideen werden nun genutzt, um Konzepte aus der wissenschaftlichen Literatur zu extrahieren und Wissenschaftler auf Publikationen aufmerksam zu machen, die sie möglicherweise übersehen hätten.
Die hier genannten sind nur einige der Innovationen, die durch die Anwendung von Deep-Learning-Methoden entstanden sind. Es ist eine interessante Zeit, in der sich allgemein verfügbare wissenschaftliche Daten und Methoden zu deren Verarbeitung annähern. Diejenigen, die in der Lage sind, Daten mit neuen Methoden zu kombinieren, um aus Mustern in diesen Daten zu lernen, können wichtige wissenschaftliche Fortschritte erzielen.

In den modernen Biowissenschaften geht es um Daten

Wie bereits erwähnt, hat sich die grundlegende Art der Biowissenschaften verändert. Die Verfügbarkeit von Robotik sowie miniaturisierte Experimente haben zu einem drastischen Anstieg der experimentellen Daten, die erstellt werden können, geführt. In den 1980er-Jahren führte ein Biologe ein einzelnes Experiment durch, das nur ein einzelnes Ergebnis lieferte. Dieses konnte dann meist manuell unter Zuhilfenahme eines Taschenrechners verarbeitet werden. Spulen wir zur heutigen Biologie vor, dann verfügen wir über Instrumente, die in ein oder zwei Tagen Millionen experimenteller Datenpunkte erzeugen können. Die Gensequenzierung beispielsweise, in der riesige Datensätze entstehen, ist kostengünstig und routinemäßig geworden.
Die Fortschritte in der Gensequenzierung haben zur Entwicklung von Datenbanken geführt, die das genetische Erbgut einer Person mit einer Vielzahl von gesundheitlichen Auswirkungen, wie Diabetes, Krebs und genetisch bedingten Erkrankungen wie Mukoviszidose, verknüpfen. Mithilfe analytischer Methoden zur Analyse und Gewinnung dieser Daten entwickeln Wissenschaftler ein Verständnis für die Ursachen dieser Krankheiten und nutzen dieses, um neue Therapien zu entwickeln.
Fachgebiete, die ehemals hauptsächlich auf menschlicher Beobachtung beruhten, verwenden nun Datensätze, die nicht länger manuell ausgewertet werden können. Heutzutage wird routinemäßig Machine Learning eingesetzt, um Bilder von Zellen zu klassifizieren. Die Ergebnisse dieser Machine-Learning-Modelle werden verwendet, um Krebstumore zu identifizieren und zu klassifizieren und die Auswirkung möglicher Krebstherapien zu bewerten.
Fortschritte in experimentellen Techniken haben zum Aufbau mehrerer Datenbanken geführt, in denen die Strukturen von Chemikalien und die Auswirkungen dieser Chemikalien auf eine Vielzahl von biologischen Prozessen oder Aktivitäten katalogisiert werden. Diese Struktur-Aktivitäts-Beziehungen (SARs) bilden die Grundlagen eines Wissenschaftszweigs, der als Cheminformatik bezeichnet wird. Wissenschaftler nutzen diese umfangreichen Datensätze zum Erstellen von Vorhersagemodellen, die die nächste Generation der Arzneimittelentwicklung vorantreiben werden.
Diese großen Datenmengen erfordern eine neue Generation von Wissenschaftlern, die sowohl in der Wissenschaft als auch der Informatik zu Hause sind. Diejenigen, die Kenntnisse aus beiden Bereichen besitzen, haben das Potenzial, Muster und Trends in großen Datensätzen aufzudecken und die wissenschaftlichen Entdeckungen von morgen zu sein.

Was werden Sie lernen?

In den ersten Kapiteln dieses Buchs geben wir einen Überblick über Deep Learning und wie es in den Biowissenschaften angewendet werden kann. Wir fangen mit Machine Learning an, das definiert wird als »die Wissenschaft (und Kunst), Rechner so zu programmieren, dass sie aus Daten lernen können«.1
Kapitel 2 enthält eine kurze Einführung in Deep Learning. Wir beginnen mit einem Beispiel, in dem gezeigt wird, wie diese Art des Machine Learning verwendet werden kann, um eine einfache Aufgabe wie die lineare Regression auszuführen, und gehen dann zu komplexeren Modellen über, die häufig zur Lösung von realen Problemen in den Biowissenschaften verwendet werden. Im Machine Learning wird ein Datensatz zunächst in einen Trainingsdatensatz, der zur Entwicklung des Models genutzt wird, und einen Testdatensatz, anhand dessen die Leistung des Modells ermittelt wird, aufgeteilt. In Kapitel 2 besprechen wir einige Details rund um Training und Validierung von Vorhersagemodellen. Sobald ein Modell erzeugt wurde, kann seine Leistung in der Regel durch Anpassen mehrerer Parameter, auch bekannt als Hyperparameter, optimiert werden. Das Kapitel gibt einen Überblick über diesen Ablauf. Deep Learning ist keine für sich stehende Technik, sondern beinhaltet eine Reihe verwandter Methoden. Kapitel 2 endet mit einer Einführung in einige der wichtigsten Deep-Learning-Varianten.
In Kapitel 3 stellen wir DeepChem vor, eine Open-Source-Programmbibliothek, die eigens entwickelt wurde, um die Erstellung von Deep-Learning-Modellen für eine Vielzahl biowissenschaftlicher Anwendungen zu vereinfachen. Nach dem Überblick über DeepChem stellen wir unser erstes Programmierbeispiel vor, das zeigt, wie mit der DeepChem-Bibliothek ein Modell zur Vorhersage der Toxizität von Molekülen erstellt werden kann. In einem zweiten Programmierbeispiel zeigen wir, wie mit DeepChem Bilder klassifiziert werden können, eine in der modernen Biologie häufig anzutreffende Aufgabe. Wie bereits kurz erwähnt, wird Deep Learning in einer Vielzahl von bildgebenden Verfahren eingesetzt, die von der Krebsdiagnose bis zur Erkennung von Glaukomen reichen. Die Vorstellung dieser spezifischen Anwendungen mündet dann in eine Erklärung einiger der inneren Funktionsweisen von Deep-Learning-Methoden.
Kapitel 4 gibt einen Überblick darüber, wie Machine Learning auf Moleküle angewendet werden kann. Wir beginnen mit einer Einführung zu Molekülen, den Bausteinen von allem, das uns umgibt. Obwohl Moleküle mit Bausteinen gleichgesetzt werden können, sind sie nicht starr. Vielmehr sind Moleküle flexibel und zeigen dynamisches Verhalten. Um Moleküle mithilfe eines analytischen Verfahrens wie dem Deep Learning charakterisieren zu können, müssen wir in der Lage sein, Moleküle in einem Computer darzustellen. Diese Codierungen ähneln der Art und Weise, in der ein Bild als eine Ansammlung von Pixeln dargestellt werden kann. Im zweiten Teil von Kapitel 4 beschreiben wir eine Reihe von Darstellungsmöglichkeiten von Molekülen und wie diese Darstellungen in Deep-Learning-Modellen verwendet werden können.
Kapitel 5 bietet eine Einführung in das Gebiet der Biophysik, bei der die Gesetze der Physik auf biologische Phänomene angewendet werden. Wir beginnen mit Proteinen, den molekularen Maschinen, die das Leben ermöglichen. Eine Schlüsselkomponente für die Vorhersage von Arzneimittelauswirkungen auf den Körper ist das Verständnis ihrer Wechselwirkungen mit Proteinen. Um diese Effekte zu verstehen, beginnen wir mit einem Überblick darüber, wie Proteine aufgebaut sind und wie sich die Proteinstrukturen unterscheiden. Proteine sind Entitäten, deren 3-D-Struktur ihre biologische Funktion bestimmt. Damit ein Machine-Learning-Modell den Einfluss eines Wirkstoffmoleküls auf die Funktion eines Proteins vorhersagen kann, müssen wir diese 3-D-Struktur in eine Form bringen, die von einem Machine-Learning-Programm verarbeitet werden kann. Im zweiten Teil von Kapitel 5 untersuchen wir eine Reihe von Möglichkeiten, wie Proteinstrukturen dargestellt werden können. Mit dem nun vorhandenen Wissen betrachten wir ein weiteres Codebeispiel, in dem wir Deep Learning verwenden, um vorherzusagen, inwieweit ein Wirkstoffmolekül mit einem Protein interagieren wird.
Die Genetik ist zu einer Schlüsselkomponente der heutigen Medizin geworden. Die genetische Tumorsequenzierung hat personalisierte Krebstherapien ermöglicht und das Potenzial, die Medizin zu revolutionieren. Die ehemals komplexe und sehr kostenintensive Gensequenzierung ist heutzutage alltäglich und wird routinemäßig durchgeführt. Wir haben sogar den Punkt erreicht, an dem Hundebesitzer kostengünstige Gentests bekommen können, um die Abstammungslinie ihrer Haustiere zu bestimmen. In Kapitel 6 geben wir einen Überblick über Genetik und Genomik und beginnen mit einer Einführung in DNA und RNA, die Vorlagen der Proteinherstellung. Jüngste Entdeckungen haben enthüllt, dass die Wechselwirkungen zwischen DNA und RNA viel komplexer sind, als ursprünglich angenommen. In der zweiten Hälfte von Kapitel 6 stellen wir einige Codebeispiele vor, die zeigen, wie mithilfe von Deep Learning mehrere Faktoren vorhergesagt werden können, die die Wechselwirkungen von DNA und RNA beeinflussen.
Wir haben in diesem Kapitel bereits auf die vielen Fortschritte hingewiesen, die auf der Anwendung von Deep Learning auf die Analyse biologischer und medizinischer Bilder basieren. Viele der in diesen Experimenten untersuchten Phänomene sind zu klein, um mit bloßem Auge beobachtet werden zu können. Um die Bilder zu erhalten, die für Deep-Learning-Methoden benötigt werden, müssen wir ein Mikroskop benutzen. Kapitel 7 gibt einen Überblick über die unzähligen Formen der Mikroskopie, angefangen mit dem einfachen Lichtmikroskop, das wir alle aus der Schule kennen, bis hin zu hoch entwickelten Instrumenten, die in der Lage sind, Bilder in atomarer Auflösung zu machen. Des Weiteren werden einige der Grenzen aktueller Ansätze aufgezeigt und Informationen zu den experimentellen Pipelines gegeben, um die Bilder für Deep-Learning-Modelle zu erhalten.
Ein sehr vielversprechender Bereich ist die Anwendung von Deep Learning für medizinische Diagnosen. Die Medizin ist unglaublich komplex, und kein Arzt kann das gesamte verfügbare medizinische Wissen in sich vereinen. Im Idealfall könnte ein Machine-Learning-Modell die medizinische Literatur verarbeiten und Mediziner beim Stellen von Diagnosen unterstützen. Obwohl wir so weit noch nicht sind, sind wir auf einem guten Weg. Kapitel 8 beginnt mit der Geschichte des Machine Learning im Stellen von Diagnosen und skizziert den Übergang von manuell codierten Regeln hin zur statistischen Analyse der medizinischen Ergebnisse. Wie bereits bei vielen anderen Themen angesprochen, ist ein wichtiger Bestandteil die Darstellung medizinischer Informationen in einem Format, das ein Machine-Learning-Programm verarbeiten kann. In diesem Kapitel stellen wir die elektronische Patientenakte vor und weisen auf einige der Probleme hin, die diese Aufzeichnungen betreffen. Oftmals sind medizinische Bilder sehr komplex, und die Auswertung sowie die Interpretation dieser Bilder gestalten sich selbst für erfahrene Spezialisten schwierig. In diesen Fällen kann Deep Learning die Fähigkeiten eines Menschen erweitern, indem Bilder klassifiziert und Schlüsselmerkmale identifiziert werden. Kapitel 8 schließt mit einer Reihe von Beispielen dafür, wie Deep Learning in einer Vielzahl von Bereichen zur Analyse medizinischer Bilder verwendet wird.
Wie bereits erwähnt, ist Machine Learning ein wichtiger Bestandteil der Suche nach neuen Wirkstoffen. Wissenschaftler wenden Deep Learning an, um die Wechselwirkungen zwischen Wirkstoffmolekülen und Proteinen auszuwerten. Diese Wechselwirkungen können biologische Reaktionen hervorrufen, die therapeutische Auswirkungen für einen Patienten haben. Die Modelle, die wir bisher besprochen haben, waren diskriminative Modelle. Ausgehend von einer Reihe von Eigenschaften eines Moleküls erstellt das Modell eine Vorhersage einer anderen Eigenschaft. Diese Vorhersagen benötigen ein Input-Molekül, das aus einer Datenbank vorhandener Moleküle oder der Fantasie eines Wissenschaftlers entstammen kann. Was wäre, wenn wir uns nicht auf Vorhandenes oder der Fantasie Entstammendes verlassen müssten, sondern ein Computerprogramm hätten, das neue Moleküle »erfinden« könnte? Kapitel 9 stellt eine weitere Methode des Deep Learning vor, das generative Modell. Ein generatives Modell wird zunächst auf verfügbaren Molekülen trainiert und anschließend genutzt, um neue Moleküle zu erzeugen. Das Deep-Learning-Programm, das diese Moleküle erzeugt, kann auch durch weite...

Inhaltsverzeichnis

  1. Cover
  2. Titel
  3. Impressum
  4. Inhalt
  5. Vorwort
  6. 1 Warum Biowissenschaften?
  7. 2 Einführung in Deep Learning
  8. 3 Machine Learning mit DeepChem
  9. 4 Machine Learning mit Molekülen
  10. 5 Biophysikalisches Machine Learning
  11. 6 Deep Learning in der Genomik
  12. 7 Machine Learning in der Mikroskopie
  13. 8 Deep Learning in der Medizin
  14. 9 Generative Modelle
  15. 10 Interpretieren von Deep-Learning-Modellen
  16. 11 Beispiel eines virtuellen Screening-Workflows
  17. 12 Chancen und Perspektiven
  18. Fußnoten
  19. Index
  20. Über die Autoren
  21. Kolophon