1.

Record Nr.

UNINA9910825772803321

Autore

Sarasa Cabezuelo Antonio

Titolo

Gestión de la Información Web Usando Python / / Antonio Sarasa Cabezuelo

Pubbl/distr/stampa

Barcelona : , : Editorial UOC, , [2016]

©2016

ISBN

84-9116-486-3

Descrizione fisica

1 online resource (179 páginas sin numerar)

Collana

Tecnología

Disciplina

005.133

Soggetti

Python (Computer program language)

Lingua di pubblicazione

Spagnolo

Formato

Materiale a stampa

Livello bibliografico

Monografia

Note generali

Incluye índice.

Nota di bibliografia

Includes bibliographical references.

Sommario/riassunto

En este manual se realiza una introducción a un conjunto de herramientas y técnicas para el acceso y procesamiento de datos web, que se encuentran en formatos como XML, CSV o JSON, o bien en bases de datos tanto relacionales como NoSQL. El objetivo de esta obra es acercar al lector estos conocimientos a partir de las herramientas y librerías de un lenguaje de programación concreto como Python, el más utilizado hoy en el área del análisis de datos y big data. El primer capítulo constituye una introducción a Python, que sirve como lenguaje vehicular en el resto de los capítulos, los cuales se dedican a estudiar el acceso y procesamiento de datos en los formatos XML, JSON y CSV. Los siguientes capítulos abordan el acceso a bases de datos relacionales, SQLite y MySQL, y a la base de datos NoSQL MongoDB. En los dos últimos capítulos, se tratan técnicas de extracción de información usando web scraping y programación de páginas web con la framework Bottle. Cada capítulo contiene algunos ejercicios propuestos para fijar las ideas expuestas.