Udemy - Guida ai Big Data con Spark 2. 0 e Python - ITA
Udemy - Guida ai Big Data con Spark 2. 0 e Python - ITA
Come utilizzare Python e Spark per l'analisi dei Big Data
Cosa imparerai:
L'obiettivo finale è riuscire ad analizzare i Big Data tramite pyspark
Capire la nascita e l'evoluzione dei Big Data, a partire da Hadoop
Avere un panorama completo dei framework per i Big Data e della loro evoluzione
Capire l'evoluzione del framework Spark e dei suoi moduli
Impostare un ambiente di lavoro in locale e su Databricks
Importare e analizzare i dati tramite pyspark
Manipolazione dati e machine learning
Cenni di database SQL e NoSQL
Cenni di Spark Streaming
Se l'analisi di grossi quantitativi di dati sta diventando sempre di più una necessità, non solo nel campo del marketing, ma anche di settori come la medicina e la diagnostica, da alcuni anni ci si sta ponendo il problema di quali siano le metodologie migliori per trarre quanta più informazione utile possibile dai grandi dataset che possono essere reperiti in vari modi su internet (ad esempio nel caso di analisi di social media) o fanno parte del patrimonio di un'azienda.
Viviamo infatti nell'era dei cosiddetti "Big Data". Questo termine, coniato attorno al 2001, nasce per indicare enormi dataset che possono essere analizzati per estrarre informazione finora difficilmente accessibile e difficilmente processabile da un solo computer, per quanto potente, ma per analizzare i quali è necessario utilizzare più computer connessi in qualche modo tra loro in maniera coordinata.
Di conseguenza, anche dal lato dell'organizzazione dei dati sono nati dei framework particolari per la gestione di queste grosse quantità di dati, il più recente dei quali è Spark.
Spark, come vedremo, può essere utilizzato con molti linguaggi di programmazione, tra i quali Python è uno dei più importanti e utilizzati.
Requisiti:
- Microsoft Windows o Mac
- Formato: mp4
Size: 4.37 GB
BUON DOWNLOAD
Warning! You are not allowed to view this text.