Statistik mit R
eBook - ePub

Statistik mit R

Eine praxisorientierte Einführung in R

  1. 366 Seiten
  2. German
  3. ePUB (handyfreundlich)
  4. Über iOS und Android verfügbar
eBook - ePub

Statistik mit R

Eine praxisorientierte Einführung in R

Über dieses Buch

Erfahren Sie in diesem Buch, was Sie wirklich wissen müssen, um statistische Analysen mit R erfolgreich durchzuführen. Diese pragmatische Einführung in die statistische Arbeit mit R eignet sich insbesondere für Studenten und Wissenschaftler aus dem wirtschafts-, sozialoder politikwissenschaftlichen Bereich, aber auch für diejenigen, die beruflich mit Statistik zu tun haben, weil sie zum Beispiel Finanzmarktdaten auswerten oder an Marktforschungsstudien arbeiten. Anders als viele andere Einführungen in R vermittelt Ihnen dieses Buch nicht nur die Grundlagen der Sprache R, sondern verknüpft dies mit der kompakten Darstellung zentraler Methoden der Statistik: Statistische Kernkonzepte werden gut nachvollziehbar beschrieben, bevor sie mit R angewandt werden. Eine Interpretation des R-Outputs aus statistischer Sicht sowie die Erläuterung der häufigsten Fehlermeldungen und ihrer Ursachen trägt dazu bei, Konzepte besser zu verstehen und Zusammenhänge zu erkennen. Auf diese Weise werden Sie rasch in die Lage versetzt, produktiv mit R zu arbeiten. Themen des Buchs sind: - Mit Daten arbeiten: Ihre Arbeit mit R organisieren, Einlesen von Daten in R, Datenspeicherung - Daten aufbereiten: unterschiedliche Datensätze kombinieren, Daten filtern, sortieren und bereinigen - Daten deskriptiv analysieren: den Datensatz kennenlernen, Lage-, Streuungs-und Zusammenhangsmaße berechnen und interpretieren - Kontinuierliche Daten analysieren: Lineare Regressionsmodelle, Hypothesentests, Diagnose und Behandlung von Annahmeverletzungen - Kategoriale Daten analysieren: Lineares Wahrscheinlichkeitsmodell, Logit-und Probit-Modelle - Ergebnisse präsentieren: Ergebnisse in Tabellen und Grafiken aussagekräftig präsentieren

Häufig gestellte Fragen

Ja, du kannst dein Abo jederzeit über den Tab Abo in deinen Kontoeinstellungen auf der Perlego-Website kündigen. Dein Abo bleibt bis zum Ende deines aktuellen Abrechnungszeitraums aktiv. Erfahre, wie du dein Abo kündigen kannst.
Derzeit stehen all unsere auf mobile Endgeräte reagierenden ePub-Bücher zum Download über die App zur Verfügung. Die meisten unserer PDFs stehen ebenfalls zum Download bereit; wir arbeiten daran, auch die übrigen PDFs zum Download anzubieten, bei denen dies aktuell noch nicht möglich ist. Weitere Informationen hier.
Perlego bietet zwei Pläne an: Elementar and Erweitert
  • Elementar ist ideal für Lernende und Interessierte, die gerne eine Vielzahl von Themen erkunden. Greife auf die Elementar-Bibliothek mit über 800.000 professionellen Titeln und Bestsellern aus den Bereichen Wirtschaft, Persönlichkeitsentwicklung und Geisteswissenschaften zu. Mit unbegrenzter Lesezeit und Standard-Vorlesefunktion.
  • Erweitert: Perfekt für Fortgeschrittene Studenten und Akademiker, die uneingeschränkten Zugriff benötigen. Schalte über 1,4 Mio. Bücher in Hunderten von Fachgebieten frei. Der Erweitert-Plan enthält außerdem fortgeschrittene Funktionen wie Premium Read Aloud und Research Assistant.
Beide Pläne können monatlich, alle 4 Monate oder jährlich abgerechnet werden.
Wir sind ein Online-Abodienst für Lehrbücher, bei dem du für weniger als den Preis eines einzelnen Buches pro Monat Zugang zu einer ganzen Online-Bibliothek erhältst. Mit über 1 Million Büchern zu über 1.000 verschiedenen Themen haben wir bestimmt alles, was du brauchst! Weitere Informationen hier.
Achte auf das Symbol zum Vorlesen in deinem nächsten Buch, um zu sehen, ob du es dir auch anhören kannst. Bei diesem Tool wird dir Text laut vorgelesen, wobei der Text beim Vorlesen auch grafisch hervorgehoben wird. Du kannst das Vorlesen jederzeit anhalten, beschleunigen und verlangsamen. Weitere Informationen hier.
Ja! Du kannst die Perlego-App sowohl auf iOS- als auch auf Android-Geräten verwenden, um jederzeit und überall zu lesen – sogar offline. Perfekt für den Weg zur Arbeit oder wenn du unterwegs bist.
Bitte beachte, dass wir keine Geräte unterstützen können, die mit iOS 13 oder Android 7 oder früheren Versionen laufen. Lerne mehr über die Nutzung der App.
Ja, du hast Zugang zu Statistik mit R von Joachim Zuckarelli im PDF- und/oder ePub-Format sowie zu anderen beliebten Büchern aus Informatik & Data Mining. Aus unserem Katalog stehen dir über 1 Million Bücher zur Verfügung.

Information

Verlag
O'Reilly
Jahr
2017
eBook-ISBN:
9783960101420

KAPITEL 1

Einführung

Die Verbreitung der Statistiksoftware R hat in den vergangenen Jahren deutlich Fahrt aufgenommen. Kein Wunder also, dass es mittlerweile im Internet eine beträchtliche Menge von Tutorials und Foren gibt, die sich dem Open-Source-Programm widmen. Auch an Fachbüchern herrscht sicherlich kein Mangel.
Die meisten dieser Fachbücher führen systematisch in die Programmiersprache R ein und beschäftigen sich der Reihe nach ausgiebig mit den Sprachkonzepten, auf denen R aufgebaut ist. Viele der Bücher sind ausgezeichnete Programmierkurse, die dem Leser die Grundlagen der R-Programmierung vermitteln. Vorerfahrung in anderen Programmiersprachen wird vielleicht nicht notwendigerweise vorausgesetzt, ist dem Verständnis der Materie aber ungemein zuträglich. Gleiches gilt für Kenntnisse über statistische Methoden, deren Umsetzung in R – oftmals auch eher knapp – vorgestellt wird. Wenn sich der Leser mehr für die Hintergründe der statistischen Methodik und ihrer Anwendung interessiert, sei er wiederum auf die einschlägigen Statistiklehrbücher verwiesen.
Dieses Buch geht einen vollkommen anderen Weg.
Statistische Methodik und deren Anwendung in R werden Sie hier gemeinsam behandelt finden. Das Ziel dabei ist, ein einführendes Verständnis von – der Titel sagt es bereits – Statistik mit R zu vermitteln. Dieses Buch ist also nicht einfach ein Buch über R. Auch nicht über Statistik. Es ist ein Buch über Statistik mit R. Deren Verbindung steht im Vordergrund dieser Einführung.
Dementsprechend wiederholen wir an den entsprechenden Stellen im Buch zunächst die statistischen Konzepte, bevor wir sie in R umsetzen. Auch der Interpretation der Ergebnisse messen wir einen hohen Stellenwert bei. Denn das Buch soll Ihnen nicht nur helfen, Ihre statistischen Kenntnisse aufzufrischen und sie erfolgreich in R umzusetzen. Sie sollen auch verstehen, was die Ergebnisse, die Sie auf diese Weise produzieren, eigentlich bedeuten.
Weil wir Wert auf Anwendungsorientierung legen, beschäftigen wir uns zum Beispiel auch mit den am häufigsten anzutreffenden Fehlermeldungen, die gerade Anfänger gern an den Rand der Verzweiflung treiben. Dafür sparen wir uns lange theoretische Erörterungen der Sprachkonzepte von R – so elegant und faszinierend sie auch sein mögen (auf die eine oder andere Randbemerkung konnte der Autor aber nicht verzichten). Mit einem echten Datensatz, den Sie unter http://downloads.oreilly.de/9783960090441 ebenso von der Website zum Buch herunterladen können wie die Beispielskripte, mit denen wir hier arbeiten, steigen Sie direkt in die praktische Arbeit ein.
Das Buch versteht sich im besten Sinne des Wortes als Einführung, es führt Sie systematisch in die Statistik mit R ein. Als Nachschlagewerk ist es nicht primär gedacht. Viele Abschnitte beginnen aber mit einer Übersicht, der Sie über die Inhalte des folgenden Texts informiert und die R-Anweisungen zusammenfasst, die in diesem Abschnitt behandelt werden. Lesen Sie die Kapitel am besten der Reihe nach, ihre Anordnung orientiert sich an der Struktur des statistischen Arbeitens – vom Vorbereiten der Daten über die eigentliche Analyse bis hin zur Präsentation der Ergebnisse. Zudem werden Sie viele interessante Erkenntnisse über R entlang des Weges entdecken in Abschnitten, die sich primär einem ganz anderen Thema widmen. Denn hier steht die Anwendung von R für statistische Zwecke im Vordergrund, nicht R selbst. Deshalb behandeln wir R-Techniken dort, wo sie für die Anwendung am meisten Sinn ergeben.
Weil Statistik mit R eine Einführung ist, können wir natürlich nicht alle denkbaren statistischen Methoden ausführlich diskutieren. Themen wie Panelmodelle oder Zeitreihenanalyse werden Sie hier vergeblich suchen. Dafür setzen wir nur geringe statistische Vorkenntnisse und überhaupt keine Programmiererfahrung voraus. Alles, was Sie zum Verständnis brauchen, werden Sie beim Lesen lernen bzw. wiederholen. Wenn Sie bereits über entsprechende statistische Kenntnisse verfügen, können Sie die überwiegend in separaten Repetitorien organisierte Wiederholung der statistischen Konzepte natürlich überspringen und sich direkt auf die Umsetzung in R konzentrieren.
In diesem ersten Kapitel erfahren Sie, wie dieses Buch aufgebaut ist und wie Sie es am besten nutzen, um einen reibungslosen Einstieg in die Arbeit mit R zu finden. Außerdem werden Sie einiges über R selbst lernen – was R eigentlich ist, was man damit machen kann und was es so besonders attraktiv macht.
Damit Sie startbereit für die nächsten Kapitel sind, in denen wir in die Arbeit mit R einsteigen, erfahren Sie hier außerdem, wie Sie R installieren und wie Sie sich Hilfe zu R beschaffen, wenn Sie einmal nicht weiterkommen.
R ist ein Open-Source-Programm. Viele engagierte Menschen überall auf der Welt arbeiten hart daran, es fortzuentwickeln und seinen Funktionsumfang ständig zu erweitern. Ohne deren großartigen Einsatz gäbe es weder R noch dieses Buch. Ihre Arbeit verdient allerhöchste Anerkennung.
Bedanken möchte ich mich an dieser Stelle auch bei Alexandra Follenius vom O’Reilly Verlag, die den langen und arbeitsreichen Prozess, der schließlich zu diesem Buch geführt hat, mit Rat und Tat begleitet hat, sowie bei den fachlichen Gutachtern Jörg Beyer und Jörg Staudemeyer, die viele wertvolle Anregungen geliefert und so erheblich zum Gelingen des Buchs beigetragen haben.
Dank gebührt vor allem aber meiner wunderbaren Frau Anja, ohne deren unermüdliche Unterstützung und immense Geduld dieses Buch und so vieles andere nicht möglich wäre.
Jetzt aber viel Spaß bei den ersten Schritten in die faszinierende Welt von R!

An wen richtet sich dieses Buch?

Statistik mit R wird Sie rasch in die Lage versetzen, selbstständig mit R zu arbeiten. Ganz gleich, ob Sie über einem Seminarpapier sitzen, Ihre Bachelor- oder Master-Thesis anfertigen, oder Ihre Dissertation schreiben; ganz gleich, ob Sie R in der akademischen Welt einsetzen, zum Beispiel im betriebswirtschaftlichen, volkswirtschaftlichen, sozial- oder politikwissenschaftlichen Bereich, oder ob Sie beruflich mit Statistik zu tun haben, weil Sie zum Beispiel Finanzmarktdaten auswerten oder an Marktforschungsstudien arbeiten – dieses Buch bietet Ihnen eine pragmatische und praxisorientierte Einführung in die statistische Arbeit mit R.

Aufbau dieses Buchs

Das Buch ist wie folgt aufgebaut:
  • In Kapitel 1 lernen Sie die Grundlagen von R kennen, woher Sie R beziehen können, wie Sie es installieren und wie Sie (abgesehen von diesem Buch) weitere Hilfe, Unterstützung und Informationen zu R erhalten.
  • Kapitel 2 widmet sich der oft unterschätzten, tatsächlich für systematisches und fehlerfreies Arbeiten aber sehr wichtigen Frage, wie Sie Ihre Arbeit mit R und um R herum geschickt organisieren, um effizient zu sein, Ordnung in Ihren Daten und Dokumenten zu halten und Datenverlusten vorzubeugen.
  • In Kapitel 3 beschäftigen wir uns damit, wie man in R mit Daten arbeitet. Insbesondere lernen Sie hier, wie R Daten speichert und wie Sie Ihre Daten in R einlesen können.
  • Kapitel 4 ist ganz der Datenaufbereitung gewidmet, also den Vorbereitungen der eigentlichen statistischen Analysen. Hier sehen Sie unter anderem, wie Sie mit unterschiedlichen Datensätzen arbeiten und wie Sie Daten filtern, sortieren und nach Kriterien selektieren können.
  • In Kapitel 5 beginnen wir mit der Datenanalyse, zunächst mit deskriptiven Untersuchungen, um den Datensatz genauer kennenzulernen. Dieses Kapitel behandelt nicht nur die praktische Durchführung deskriptiver Analysen in R, sondern umfasst auch ein Repetitorium zur deskriptiven Statistik.
  • Kapitel 6 führt in die lineare Regression ein. Auch hier können Sie, sofern Bedarf besteht, zunächst die statistischen Grundlagen wiederholen, bevor Sie in die eigentliche Arbeit mit R einsteigen. Neben der Schätzung von Regressionsmodellen behandelt dieses Kapitel auch Hypothesentests sowie den Umgang mit Verletzungen der Annahmen des linearen Regressionsmodells.
  • In Kapitel 7 wenden wir uns der Analyse kategorialer Daten zu, also Daten, die nicht jeden beliebigen Wert annehmen können, sondern nur bestimmte, festgelegte Ausprägungen. Die Analyse kategorialer Daten ist in vielfacher Hinsicht eine Erweiterung des linearen Regressionsmodells und schließt insofern an das vorangegangene Kapitel an.
  • Kapitel 8 beschäftigt sich damit, wie Sie die Ergebnisse, die mit den in den Kapiteln 5, 6 und 7 behandelten Methoden erzielt wurden, in Tabellen und Grafiken aussagekräftig, übersichtlich und ansprechend präsentieren können.
  • Kapitel 9 schließlich widmet sich der Programmierung mit R, also der Frage, wie Sie nicht nur einzelne R-Anweisungen ausführen, sondern viele Anweisungen zu ganzen Programmen zusammensetzen können, zum Beispiel, um wiederkehrende Aufgaben effizient zu automatisieren.

Was ist R?

R – das ist der 18. Buchstabe des Alphabets und zugleich der Anfangsbuchstabe der Vornamen von Ross Ilhaka und Robert Gentlemen. Diese beiden Herren schufen Anfang der Neunzigerjahre des letzten Jahrhunderts an der Universität der neuseeländischen Millionenstadt Auckland auf Basis einer älteren Sprache namens S eine neue Programmiersprache, deren Haupteinsatzgebiet die Verarbeitung und Analyse statistischer Daten ist und die man heute, was die beiden damals sicherlich nicht zu träumen wagten, ohne zu übertreiben als Welterfolg bezeichnen kann.
R ist heutzutage aus der akademischen Welt nicht mehr wegzudenken und wird zunehmend auch von Unternehmen eingesetzt. Ersteres zeigt sich nicht zuletzt darin, dass neue statistische Methoden heute oft als Erstes in R programmiert und verbreitet werden. Ein gutes Indiz für die wachsende Popularität von R im geschäftlichen Umfeld ist der Umstand, dass immer mehr Unternehmen R in ihre Produkte integrieren und einige große Player der Softwarebranche, darunter Microsoft und Oracle, das R Consortium gegründet haben, um die Entwicklung und Anwendung von R weiter zu fördern.
Seinen Erfolg verdankt R nicht zuletzt der Tatsache, dass es für den Anwender kostenlos ist. Darin unterscheidet es sich von den bekannten kommerziellen Statistiksoftwarepaketen, wie beispielsweise SPSS oder Stata, bei denen man für jährliche Lizenzen selbst der einfachsten Programmeditionen durchaus bereits mehrere Hundert Euro zahlen kann. Wer nicht so viel Geld in die Hand nehmen will oder kann, für den ist R eine günstige Alternative.
R wird unter der sogenannten GNU General Public License angeboten, bei der es sich, anders als der ungewöhnliche Name vielleicht vermuten lässt, mitnichten um einen Vertrag über die öffentliche Nutzung afrikanischer Antilopen handelt. Es ist vielmehr eine Softwarelizenz, die dem Nutzer einige Grundfreiheiten garantiert, darunter das Recht, seine in R selbst geschriebenen Programme weiterzuverteilen und sogar R selbst zu verändern. Dieser Umstand führt zum zweiten wesentlichen Erfolgsfaktor von R: Neben der eigentlichen R-Software gibt es buchstäblich Tausende von Erweiterungen, die von Benutzern entwickelt worden sind. Mit diesen Erweiterungspaketen, die Sie sich kostenlos aus dem Internet über das Comprehe...

Inhaltsverzeichnis

  1. Cover
  2. Titel
  3. Impressum
  4. Inhalt
  5. 1 Einführung
  6. 2 Die eigene Arbeit organisieren
  7. 3 Mit Daten arbeiten
  8. 4 Daten aufbereiten
  9. 5 Daten deskriptiv analysieren
  10. 6 Lineare Regression: Kontinuierliche Daten analysieren (Inferenzstatistik I)
  11. 7 Kategoriale Daten analysieren (Inferenzstatistik II)
  12. 8 Ergebnisse präsentieren
  13. 9 Programmieren mit R
  14. Index
  15. Über den Autor