
- Spanish
- PDF
- Disponible en iOS y Android
Big data con python
Descripción del libro
Para lograr analizar datos y convertirlos en información, el primer paso es ser capaz de incorporarlos a nuestro programa, esto es, cargar los datos. En este capítulo discutimos la adquisición de datos desde fichero, por lo que en primer lugar es necesario plantearse una serie de preguntas: ¿qué son datos? ¿Su adquisición se limita a descargar datos de internet? ¿Es capaz el lenguaje Python de entender cualquier fuente de información, tales como texto, imágenes, audio y vídeo? ¿Puedo obtener información de cualquier fuente, como páginas oficiales del gobierno, periódicos, redes sociales y foros de opinión?Aunque en general entendemos por datos cualquier tipo de información que se almacena en un ordenador, en el contexto de este libro usaremos datos para referirnos a colecciones de elementos con una serie de atributos.
Preguntas frecuentes
- El plan Essential es ideal para los estudiantes y los profesionales a los que les gusta explorar una amplia gama de temas. Accede a la biblioteca Essential, con más de 800 000 títulos de confianza y superventas sobre negocios, crecimiento personal y humanidades. Incluye un tiempo de lectura ilimitado y la voz estándar de «Lectura en voz alta».
- Complete: perfecto para los estudiantes avanzados y los investigadores que necesitan un acceso completo sin ningún tipo de restricciones. Accede a más de 1,4 millones de libros sobre cientos de temas, incluidos títulos académicos y especializados. El plan Complete también incluye funciones avanzadas como la lectura en voz alta prémium y el asistente de investigación.
Ten en cuenta que no será compatible con los dispositivos que se ejecuten en iOS 13 y Android 7 o en versiones anteriores. Obtén más información sobre cómo usar la aplicación.
Información
Índice
- ÍNDICE
- PRÓLOGO
- LOS AUTORES
- Capítulo 1 - LECTURA DE FICHEROS
- INTRODUCCIÓN
- CSV
- TSV
- EXCEL
- JSON
- XML
- CONCLUSIONES
- REFERENCIAS
- Capítulo 2 - WEB SCRAPING
- INTRODUCCIÓN
- FICHEROS INCLUIDOS EN LA PÁGINA WEB
- DATOS QUE FORMAN PARTE DE LA PÁGINA
- ELEMENTOS DE FORMATO
- LISTAS
- ENLACES
- IMÁGENES
- TABLAS
- FORMULARIOS
- ATRIBUTOS MÁS USUALES
- DATOS QUE REQUIEREN INTERACCIÓN
- ACCESO AL DRIVER A TRAVÉS DE LA VARIABLE DE ENTORNO PATH
- ACCESO AL DRIVER INCORPORANDO LA RUTA EN EL CÓDIGO PYTHON
- COMPONENTE “/”
- COMPONENTE “*”
- COMPONENTE “.”
- COMPONENTE “//”
- FILTROS [ … ]
- CONCLUSIONES
- REFERENCIAS
- Capítulo 3 - RECOLECCIÓN MEDIANTEAPIS
- INTRODUCCIÓN
- API TWITTER
- BÚSQUEDA PUNTUAL DE TWEETS
- BÚSQUEDA DE TWEETS EN STREAMING
- API-REST
- REFERENCIAS
- Capítulo 4 - MONGODB
- INTRODUCCIÓN
- ¿DE VERDAD NECESITO UNA BASE DE DATOS? ¿CUÁL?
- ARQUITECTURA CLIENTE-SERVIDOR DE MONGODB
- BASES DE DATOS, COLECCIONES Y DOCUMENTOS
- CARGA DE DATOS
- CONSULTAS SIMPLES
- IGUALDAD
- OTROS OPERADORES DE COMPARACIÓN Y LÓGICOS
- ARRAYS
- $EXISTS
- AGREGACIONES
- VISTAS
- UPDATE Y REMOVE
- REFERENCIAS
- Capítulo 5 - APRENDIZAJE AUTOMÁTICO CON SCIKIT-LEARN
- INTRODUCCIÓN
- NUMPY
- PANDAS (PYTHON DATA ANALYSIS LIBRARY)
- APRENDIZAJE AUTOMÁTICO
- APRENDIZAJE SUPERVISADO
- APRENDIZAJE NO SUPERVISADO
- BIBLIOTECA SCIKIT-LEARN
- TUBERÍAS
- PERSISTENCIA DE MODELOS
- OPTIMIZACIÓN DE HIPERPARÁMETROS
- CONCLUSIONES
- REFERENCIAS
- Capítulo 6 - PROCESAMIENTO DISTRIBUIDO CON SPARK
- INTRODUCCIÓN
- CONJUNTOS DE DATOS DISTRIBUIDOS RESILIENTES
- CREACIÓN DE RDDS
- ACCIONES
- TRANSFORMACIONES
- EJEMPLO DE PROCESAMIENTO DE RDD
- CONCLUSIONES
- REFERENCIAS
- Capítulo 7 - SPARKSQL Y SPARKML
- SPARKSQL
- DATAFRAMES DESDE VALORES Y RDDS
- DATAFRAMES DESDE FICHEROS
- INSPECCIÓN DE DATAFRAMES
- FILTRADO DE DATAFRAMES
- COMBINACIÓN DE DATAFRAMES
- TRANSFORMACIÓN DE DATAFRAMES
- SQL SOBRE DATAFRAMES
- SPARK ML
- REFERENCIAS
- Capítulo 8 - VISUALIZACIÓN DE RESULTADOS
- INTRODUCCIÓN
- LA BIBLIOTECA MATPLOTLIB
- GRÁFICAS
- CONCLUSIONES
- REFERENCIAS
- APENDICE - INSTALACIÓN DELSOFTWARE
- ÍNDICE ANALÍTICO