Wiley-Schnellkurs Bioinformatik für Anwender
eBook - ePub

Wiley-Schnellkurs Bioinformatik für Anwender

  1. German
  2. ePUB (handyfreundlich)
  3. Über iOS und Android verfügbar
eBook - ePub

Wiley-Schnellkurs Bioinformatik für Anwender

Über dieses Buch

Die digitale Datenverarbeitung wird auch für Lebenswissenschaftler immer wichtiger. Hier setzt dieser Schnellkurs an. Röbbe Wünschiers erklärt Ihnen, wie Sie mit Sequenz-, Struktur- und anderen Daten umgehen sollten. Er erläutert, wie Sie Linux als virtuelle Maschine installieren und wie Ihnen Linuxtools wie Sed oder die einfache Programmiersprache AWK bei der Datenanalyse helfen können. Außerdem führt er Sie knapp in weitere Bereiche ein, die Ihnen das digitale Leben erleichtern können: das Datenbanksystem MariaDB/MySQL, die Programmierumgebung R für statistisches Rechnen und Datenvisualisierung, die Textsatzsprache LaTeX und einiges mehr. Ausgearbeitete Beispiele aus den Lebenswissenschaften und Übungsaufgaben samt Lösungen helfen Ihnen Ihr Wissen zu festigen und zu überprüfen. Auf der Webseite datenmassen.de finden sich alle Daten und Abbildungen zum Download.

Häufig gestellte Fragen

Ja, du kannst dein Abo jederzeit über den Tab Abo in deinen Kontoeinstellungen auf der Perlego-Website kündigen. Dein Abo bleibt bis zum Ende deines aktuellen Abrechnungszeitraums aktiv. Erfahre, wie du dein Abo kündigen kannst.
Nein, Bücher können nicht als externe Dateien, z. B. PDFs, zur Verwendung außerhalb von Perlego heruntergeladen werden. Du kannst jedoch Bücher in der Perlego-App herunterladen, um sie offline auf deinem Smartphone oder Tablet zu lesen. Weitere Informationen hier.
Perlego bietet zwei Abopläne an: Elementar und Erweitert
  • Elementar ist ideal für Lernende und Profis, die sich mit einer Vielzahl von Themen beschäftigen möchten. Erhalte Zugang zur Basic-Bibliothek mit über 800.000 vertrauenswürdigen Titeln und Bestsellern in den Bereichen Wirtschaft, persönliche Weiterentwicklung und Geisteswissenschaften. Enthält unbegrenzte Lesezeit und die Standardstimme für die Funktion „Vorlesen“.
  • Pro: Perfekt für fortgeschrittene Lernende und Forscher, die einen vollständigen, uneingeschränkten Zugang benötigen. Schalte über 1,4 Millionen Bücher zu Hunderten von Themen frei, darunter akademische und hochspezialisierte Titel. Das Pro-Abo umfasst auch erweiterte Funktionen wie Premium-Vorlesen und den Recherche-Assistenten.
Beide Abopläne sind mit monatlichen, halbjährlichen oder jährlichen Abrechnungszyklen verfügbar.
Wir sind ein Online-Abodienst für Lehrbücher, bei dem du für weniger als den Preis eines einzelnen Buches pro Monat Zugang zu einer ganzen Online-Bibliothek erhältst. Mit über 1 Million Büchern zu über 1.000 verschiedenen Themen haben wir bestimmt alles, was du brauchst! Weitere Informationen hier.
Achte auf das Symbol zum Vorlesen bei deinem nächsten Buch, um zu sehen, ob du es dir auch anhören kannst. Bei diesem Tool wird dir Text laut vorgelesen, wobei der Text beim Vorlesen auch grafisch hervorgehoben wird. Du kannst das Vorlesen jederzeit anhalten, beschleunigen und verlangsamen. Weitere Informationen hier.
Ja! Du kannst die Perlego-App sowohl auf iOS- als auch auf Android-Geräten nutzen, damit du jederzeit und überall lesen kannst – sogar offline. Perfekt für den Weg zur Arbeit oder wenn du unterwegs bist.
Bitte beachte, dass wir Geräte, auf denen die Betriebssysteme iOS 13 und Android 7 oder noch ältere Versionen ausgeführt werden, nicht unterstützen können. Mehr über die Verwendung der App erfahren.
Ja, du hast Zugang zu Wiley-Schnellkurs Bioinformatik für Anwender von Röbbe Wünschiers im PDF- und/oder ePub-Format sowie zu anderen beliebten Büchern aus Medizin & Biostatistik. Aus unserem Katalog stehen dir über 1 Million Bücher zur Verfügung.

Information

Verlag
Wiley-VCH
Jahr
2016
ISBN drucken
9783527530403
eBook-ISBN:
9783527805532
Auflage
1
Thema
Medizin

1
Einleitung

1.1 Was Sie über Bioinformatik wissen sollten

Bioinformatik ist ein dehnbarer Begriff. Er spannt einen Bogen von der Entwicklung von Algorithmen was nicht Thema dieses Buches ist bis hin zur reinen Anwendung von Software zur Datenanalyse was dem Thema dieses Buches schon näher kommt. Lassen Sie mich dies anhand zweier Begegnungen verdeutlichen:
Neulich traf ich einen Krebsforscher. Mit ihm sprach ich unter anderem über die Fortschritte bei der Genomanalyse und welchen Beitrag sie für seine Arbeit leistet. Pfiffig wie er war, enthüllte er erst im Verlauf unseres Gespräches, dass er Krebse erforscht nicht Tumore. Die Genomanalysen, die seine Arbeit betreffen, gehören in den Bereich des DNA-Barcodings, also der Identifizierung von biologischen Arten anhand eines eindeutigen genetischen Markers. Solche Marker zu finden, ist eine typische bioinformatische Aufgabe und zeigt, wie tief die Bioinformatik in klassische Disziplinen der Lebenswissenschaften eingedrungen ist.
Eine weitere Begegnung: Mit einem Professor der Genetik hatte ich das Vergnügen, eine zweiwöchige Sommerakademie zur Synthetischen Biologie zu leiten. Privat sprachen wir auch über unsere Forschung. Er arbeitet unter anderem am Ribosomal Readthrough, einem Phänomen, bei dem Ribosomen während der Translation der mRNA in ein Protein gelegentlich das Stopcodon überlesen. Er hatte eine riesige Excel-Datei mit RNA-Sequenzen von Transkripten, in denen er nach bestimmten Sequenzmotiven suchen wollte. Ich zeigte ihm, wie einfach das mit den Linux-Kommandozeilenprogrammen Sed und AWK geht. Innerhalb weniger Stunden konnte er seine Daten selbstständig analysieren und war begeistert.
Bei beiden Begegnungen war Bioinformatik ein Thema, aber kein zentrales, sondern das Mittel zum Zweck. Und genau in diese Bioinformatik, also die Bioinformatik als Mittel zum Zweck, möchte ich Sie einführen. Dabei greife ich auf meine persönliche 15-jährige Erfahrung als forschender und lehrender Biologe zurück, der experimentell arbeitet und dabei große Datenmengen erzeugt. Zunächst waren dies überwiegend Genexpressionsdaten, die mit DNA-Mikroarrays erzeugt wurden. Diese Daten mussten geplottet (Abb. 1.1) und annotiert (Abb. 1.2) werden. Eine hohe Zahl steht für eine hohe Aktivität des Gens. Später kamen Sequenzdaten aus NG (next generation) DNA- und RNA-Sequenzierungen dazu. Eine Sequenzierung erzeugt dabei rund 40 Millionen Sequenzen, die in einer etwa 2-3 GB großen Datei im FastQ-Format gespeichert sind. Die Verarbeitung dieser Daten stößt an die Grenzen von MS Excel und des Notepads.
IMG
Abb. 1.1 Visualisierung von Genexpressionsdaten. Über die Kommandozeile kann mit einem zugegebenermaßen langen Befehl eine Datenbankabfrage gestellt (Zeile 1), die Daten formatiert (Zeilen 2+3) und anschließend geplottet (Zeile 4) werden.
IMG
Abb. 1.2 Mit dem relationalen Dankenbanksystem MariaDB (oder MySQL, siehe Abschnitt 10.2) können Daten aus verschieden Tabellen kombiniert werden.

Wichtiger Hinweis

Die Bioinformatik, die ich Ihnen zeigen möchte, ist eine angewandte Bioinformatik. Sie ist Mittel zum Zweck. Es geht mir nicht um die Herleitung oder gar Entwicklung von Algorithmen, sondern um die Verarbeitung und Analyse von Daten aus den Lebenswissenschaften. Und dies ist kein Theoriebuch. Sie müssen die Tasten schon selbst tanzen lassen.

1.1.1 Bioinformatik heißt mit Computern »sprechen«

Was haben »Montagsmaler« und »Activity« mit Bioinformatik zu tun? Bis 1996 gab es die Sendung Montagsmaler. Ein Begriff musste gemalt und von den Gruppenpartnern geraten werden. Bei dem Gesellschaftsspiel Activity muss ein pantomimisch vorgestellter Begriff erraten werden. Beide Vorgehensweisen sind im weiteren Sinn graphisch, ebenso wie Powerpoint. Aber wie viele Powerpoint-Präsentation sind zu textlastig? Zu viele und es gibt einen Stapel Ratgeber darüber, wie man dies vermeidet. Und warum sind diese Präsentationen zu textlastig? Weil es häufig leichter fällt, einen Sachverhalten zu beschreiben, anstatt ihn zu skizzieren.
In der Bioinformatik wird dem Computer über Programmiersprachen beschrieben, wie er Daten verarbeitet soll. Zum Beispiel: nehme aus der Datei seqs.fasta alle Sequenzen, die mit einem Startcodon (ATG) beginnen, im Leseraster mindestens ein Cystein codieren und mit einem Stopcodon (TAA, TGA, TAG) enden → markiere diese offenen Leseraster → markiere die Cysteincodons → zeige das Ergebnis an. Dies ist in Abb. 1.3 dargestellt. Der eigentliche Befehl steht in der ersten Zeile des Terminals. Wenn Sie das Kapitel 3 durchgearbeitet haben, werden Sie diesen Befehl auch verstehen.
IMG
Abb. 1.3 Der Terminal ist ein wichtiges Element der Bioinformatik, da sich komplexe Arbeitsanweisungen leichter als Text denn per »zeige-und-klicke«formulieren lassen.
Sie sehen also, dass Sie mit dem Terminal ein Powertool zu Verfügung haben, mit dem Sie sehr effizient komplexe Prozessierungen von Daten vornehmen können.

1.1.2 Kleine Geschichte der Bioinformatik

Historisch betrachtet sind die Entstehung der Chemo- und Bioinformatik die konsequente Antwort auf die Entwicklungen der Molekularbiologie. Die Sequenzierung des ersten Proteins durch Frederick Sanger 1953 und die erste Kristallstrukturanalyse eines Proteins durc...

Inhaltsverzeichnis

  1. Cover
  2. Vorwort von Michael Bölker
  3. Vorwort von Diethard Tautz
  4. Vorwort des Autors
  5. 1 Einleitung
  6. Teil I Vorbereiten
  7. 3 Daten und Linux
  8. 4 Programmierung
  9. Teil II Arbeiten
  10. 6 RNASeq und Biogas  IdentifikationBiogas-produzierender Bakterien
  11. 7 Vom Gen zum Methan – Expressionsdaten auf Stoffwechselkarten projizieren
  12. 8 Bio(t)error  Gefährliche Mutationen desH1N1-Schweinegrippevirus
  13. 9 Ebola  Detektion von Variation durch Resequenzierung
  14. Teil III Veröffentlichen
  15. 11 Daten beschreiben & darstellen mit R
  16. 12 Es allen zeigen
  17. Teil IV Antworten und Literatur
  18. Literaturverzeichnis
  19. Index
  20. Eula