Spark Cookbook
eBook - ePub

Spark Cookbook

Rishi Yadav

Partager le livre
  1. 226 pages
  2. English
  3. ePUB (adapté aux mobiles)
  4. Disponible sur iOS et Android
eBook - ePub

Spark Cookbook

Rishi Yadav

DĂ©tails du livre
Aperçu du livre
Table des matiĂšres
Citations

À propos de ce livre

If you are a data engineer, an application developer, or a data scientist who would like to leverage the power of Apache Spark to get better insights from big data, then this is the book for you.

Foire aux questions

Comment puis-je résilier mon abonnement ?
Il vous suffit de vous rendre dans la section compte dans paramĂštres et de cliquer sur « RĂ©silier l’abonnement ». C’est aussi simple que cela ! Une fois que vous aurez rĂ©siliĂ© votre abonnement, il restera actif pour le reste de la pĂ©riode pour laquelle vous avez payĂ©. DĂ©couvrez-en plus ici.
Puis-je / comment puis-je télécharger des livres ?
Pour le moment, tous nos livres en format ePub adaptĂ©s aux mobiles peuvent ĂȘtre tĂ©lĂ©chargĂ©s via l’application. La plupart de nos PDF sont Ă©galement disponibles en tĂ©lĂ©chargement et les autres seront tĂ©lĂ©chargeables trĂšs prochainement. DĂ©couvrez-en plus ici.
Quelle est la différence entre les formules tarifaires ?
Les deux abonnements vous donnent un accĂšs complet Ă  la bibliothĂšque et Ă  toutes les fonctionnalitĂ©s de Perlego. Les seules diffĂ©rences sont les tarifs ainsi que la pĂ©riode d’abonnement : avec l’abonnement annuel, vous Ă©conomiserez environ 30 % par rapport Ă  12 mois d’abonnement mensuel.
Qu’est-ce que Perlego ?
Nous sommes un service d’abonnement Ă  des ouvrages universitaires en ligne, oĂč vous pouvez accĂ©der Ă  toute une bibliothĂšque pour un prix infĂ©rieur Ă  celui d’un seul livre par mois. Avec plus d’un million de livres sur plus de 1 000 sujets, nous avons ce qu’il vous faut ! DĂ©couvrez-en plus ici.
Prenez-vous en charge la synthÚse vocale ?
Recherchez le symbole Écouter sur votre prochain livre pour voir si vous pouvez l’écouter. L’outil Écouter lit le texte Ă  haute voix pour vous, en surlignant le passage qui est en cours de lecture. Vous pouvez le mettre sur pause, l’accĂ©lĂ©rer ou le ralentir. DĂ©couvrez-en plus ici.
Est-ce que Spark Cookbook est un PDF/ePUB en ligne ?
Oui, vous pouvez accĂ©der Ă  Spark Cookbook par Rishi Yadav en format PDF et/ou ePUB ainsi qu’à d’autres livres populaires dans Computer Science et Data Processing. Nous disposons de plus d’un million d’ouvrages Ă  dĂ©couvrir dans notre catalogue.

Informations

Année
2015
ISBN
9781783987061
Édition
1
Sous-sujet
Data Processing

Spark Cookbook


Table of Contents

Spark Cookbook
Credits
About the Author
About the Reviewers
www.PacktPub.com
Support files, eBooks, discount offers, and more
Why Subscribe?
Free Access for Packt account holders
Preface
What this book covers
What you need for this book
Who this book is for
Sections
Getting ready
How to do it

How it works

There's more

See also
Conventions
Reader feedback
Customer support
Downloading the color images of this book
Errata
Piracy
Questions
1. Getting Started with Apache Spark
Introduction
Installing Spark from binaries
Getting ready
How to do it...
Building the Spark source code with Maven
Getting ready
How to do it...
Launching Spark on Amazon EC2
Getting ready
How to do it...
See also
Deploying on a cluster in standalone mode
Getting ready
How to do it...
How it works...
See also
Deploying on a cluster with Mesos
How to do it...
Deploying on a cluster with YARN
Getting ready
How to do it...
How it works

Using Tachyon as an off-heap storage layer
How to do it...
See also
2. Developing Applications with Spark
Introduction
Exploring the Spark shell
How to do it...
Developing Spark applications in Eclipse with Maven
Getting ready
How to do it...
Developing Spark applications in Eclipse with SBT
How to do it...
Developing a Spark application in IntelliJ IDEA with Maven
How to do it...
Developing a Spark application in IntelliJ IDEA with SBT
How to do it...
3. External Data Sources
Introduction
Loading data from the local filesystem
How to do it...
Loading data from HDFS
How to do it...
There's more

Loading data from HDFS using a custom InputFormat
How to do it...
Loading data from Amazon S3
How to do it...
Loading data from Apache Cassandra
How to do it...
There's more...
Merge strategies in sbt-assembly
Loading data from relational databases
Getting ready
How to do it...
How it works

4. Spark SQL
Introduction
Understanding the Catalyst optimizer
How it works

Analysis
Logical plan optimization
Physical planning
Code generation
Creating HiveContext
Getting ready
How to do it...
Inferring schema using case classes
How to do it...
Programmatically specifying the schema
How to do it...
How it works

Loading and saving data using the Parquet format
How to do it...
How it works

There's more

Loading and saving data using the JSON format
How to do it...
How it works

There's more

Loading and saving data from relational databases
Getting ready
How to do it...
Loading and saving data from an arbitrary source
How to do it...
There's more

5. Spark Streaming
Introduction
Word count using Streaming
How to do it...
Streaming Twitter data
How to do it...
Streaming using Kafka
Getting ready
How to do it...
There's more

6. Getting Started with Machine Learning Using MLlib
Introduction
Creating vectors
How to do it

How it works...
Creating a labeled point
How to do it

Creating matrices
How to do it

Calculating summary statistics
How to do it

Calculating correlation
Getting ready
How to do it

Doing hypothesis testing
How to do it

Creating machine learning pipelines using ML
Getting ready
How to do it

7. Supervised Learning with MLlib – Regression
Introduct...

Table des matiĂšres