
- Spanish
- PDF
- Disponible en iOS y Android
Big data con python
Descripción del libro
Para lograr analizar datos y convertirlos en información, el primer paso es ser capaz de incorporarlos a nuestro programa, esto es, cargar los datos. En este capítulo discutimos la adquisición de datos desde fichero, por lo que en primer lugar es necesario plantearse una serie de preguntas: ¿qué son datos? ¿Su adquisición se limita a descargar datos de internet? ¿Es capaz el lenguaje Python de entender cualquier fuente de información, tales como texto, imágenes, audio y vídeo? ¿Puedo obtener información de cualquier fuente, como páginas oficiales del gobierno, periódicos, redes sociales y foros de opinión?Aunque en general entendemos por datos cualquier tipo de información que se almacena en un ordenador, en el contexto de este libro usaremos datos para referirnos a colecciones de elementos con una serie de atributos.
Preguntas frecuentes
- Esencial es ideal para estudiantes y profesionales que disfrutan explorando una amplia variedad de materias. Accede a la Biblioteca Esencial con más de 800.000 títulos de confianza y best-sellers en negocios, crecimiento personal y humanidades. Incluye lectura ilimitada y voz estándar de lectura en voz alta.
- Avanzado: Perfecto para estudiantes avanzados e investigadores que necesitan acceso completo e ilimitado. Desbloquea más de 1,4 millones de libros en cientos de materias, incluidos títulos académicos y especializados. El plan Avanzado también incluye funciones avanzadas como Premium Read Aloud y Research Assistant.
Ten en cuenta que no podemos dar soporte a dispositivos con iOS 13 o Android 7 o versiones anteriores. Aprende más sobre el uso de la app.
Información
Índice
- ÍNDICE
- PRÓLOGO
- LOS AUTORES
- Capítulo 1 - LECTURA DE FICHEROS
- INTRODUCCIÓN
- CSV
- TSV
- EXCEL
- JSON
- XML
- CONCLUSIONES
- REFERENCIAS
- Capítulo 2 - WEB SCRAPING
- INTRODUCCIÓN
- FICHEROS INCLUIDOS EN LA PÁGINA WEB
- DATOS QUE FORMAN PARTE DE LA PÁGINA
- ELEMENTOS DE FORMATO
- LISTAS
- ENLACES
- IMÁGENES
- TABLAS
- FORMULARIOS
- ATRIBUTOS MÁS USUALES
- DATOS QUE REQUIEREN INTERACCIÓN
- ACCESO AL DRIVER A TRAVÉS DE LA VARIABLE DE ENTORNO PATH
- ACCESO AL DRIVER INCORPORANDO LA RUTA EN EL CÓDIGO PYTHON
- COMPONENTE “/”
- COMPONENTE “*”
- COMPONENTE “.”
- COMPONENTE “//”
- FILTROS [ … ]
- CONCLUSIONES
- REFERENCIAS
- Capítulo 3 - RECOLECCIÓN MEDIANTEAPIS
- INTRODUCCIÓN
- API TWITTER
- BÚSQUEDA PUNTUAL DE TWEETS
- BÚSQUEDA DE TWEETS EN STREAMING
- API-REST
- REFERENCIAS
- Capítulo 4 - MONGODB
- INTRODUCCIÓN
- ¿DE VERDAD NECESITO UNA BASE DE DATOS? ¿CUÁL?
- ARQUITECTURA CLIENTE-SERVIDOR DE MONGODB
- BASES DE DATOS, COLECCIONES Y DOCUMENTOS
- CARGA DE DATOS
- CONSULTAS SIMPLES
- IGUALDAD
- OTROS OPERADORES DE COMPARACIÓN Y LÓGICOS
- ARRAYS
- $EXISTS
- AGREGACIONES
- VISTAS
- UPDATE Y REMOVE
- REFERENCIAS
- Capítulo 5 - APRENDIZAJE AUTOMÁTICO CON SCIKIT-LEARN
- INTRODUCCIÓN
- NUMPY
- PANDAS (PYTHON DATA ANALYSIS LIBRARY)
- APRENDIZAJE AUTOMÁTICO
- APRENDIZAJE SUPERVISADO
- APRENDIZAJE NO SUPERVISADO
- BIBLIOTECA SCIKIT-LEARN
- TUBERÍAS
- PERSISTENCIA DE MODELOS
- OPTIMIZACIÓN DE HIPERPARÁMETROS
- CONCLUSIONES
- REFERENCIAS
- Capítulo 6 - PROCESAMIENTO DISTRIBUIDO CON SPARK
- INTRODUCCIÓN
- CONJUNTOS DE DATOS DISTRIBUIDOS RESILIENTES
- CREACIÓN DE RDDS
- ACCIONES
- TRANSFORMACIONES
- EJEMPLO DE PROCESAMIENTO DE RDD
- CONCLUSIONES
- REFERENCIAS
- Capítulo 7 - SPARKSQL Y SPARKML
- SPARKSQL
- DATAFRAMES DESDE VALORES Y RDDS
- DATAFRAMES DESDE FICHEROS
- INSPECCIÓN DE DATAFRAMES
- FILTRADO DE DATAFRAMES
- COMBINACIÓN DE DATAFRAMES
- TRANSFORMACIÓN DE DATAFRAMES
- SQL SOBRE DATAFRAMES
- SPARK ML
- REFERENCIAS
- Capítulo 8 - VISUALIZACIÓN DE RESULTADOS
- INTRODUCCIÓN
- LA BIBLIOTECA MATPLOTLIB
- GRÁFICAS
- CONCLUSIONES
- REFERENCIAS
- APENDICE - INSTALACIÓN DELSOFTWARE
- ÍNDICE ANALÍTICO