Arquitetura e Componentes
Arquitetura e Componentes
Formação Spark com Pyspark : o Curso Completo
Comprar agora
Saiba mais
1. Introdução
Apresentação
Material para Download
Introdução ao Spark
13
Arquitetura e Componentes
Context e Session
Formatos de Big Data
2
2. Instalação e Primeiros Passos
Introdução sobre a Instalação
8
Downloads
Instalando VM Ubuntu
2
Instalando Spark
20
Bibliotecas Adicionais
6
Rodando Exemplos
Baixando dados de Exemplo
3
Opcional: Putty com SSH
Putty com SSH
2
3. DataFrames e RDDs
RDD, Dataset e Dataframe
RDD parte I
4
RDD parte II
2
DataFrames Parte I
2
DataFrames Parte II
10
DataFrames Parte III
4
DataFrames Parte IV
2
Principais Ações e Transformações
Exportando dados
2
Importando Dados
Atividades: Faça você mesmo
2
Solução do Faça você mesmo
4
4. Spark SQL
Spark SQL
2
Bancos de Dados e Tabelas
2
Tabelas Gerenciadas e Externas
6
Views
Comparando DataFrames com Tabelas SQL
2
Joins
Joins com DataFrames e SQL
Utilizando Spark-sql
Atividades: Faça você mesmo
4
Solução do Faça você mesmo
Solução do Faça você mesmo - Continuação
6
5. Outras Fontes de Dados
Conectado a Outras Fontes de Dados
PostgreSQL
Instalando PostgreSQL
13
Drive JDBC
Lendo e Gravando Dados no PostgreSql
MongoDB
Instalando MongoDB
6
Lendo e Gravando Dados no MongoDB
6. Criando Aplicações
Aplicação 1: Escrevendo no Console
Aplicação 2: Escrevendo no Console com Parâmetros
Opção e argumentos em Linha de Comando
Aplicação 3: Conversor de Formatos de Arquivos em Spark
2
Atividades: Faça você mesmo
Solução do Faça você mesmo
7. Machine Learning
Fundamentos de Machine Learning
2
Machine Learning no Spark
Preparando Dados para Regressão
4
Criando um Modelo de Regressão
Preparando Dados para Classificação
Criando um Modelo de Classificação
3
Pipelines
Atividades: Faça você mesmo
Solução do Faça você mesmo
8. Spark Structured Streaming
O que é "Streaming"
Spark Structured Streaming
5
Casos Práticos
4
De JSON para o Console
2
De JSON para PostgreSQL
4
9. Otimização
Particionamento
Particionamento e Bucketing no Spark
2
Cache
Cache e Persistência no Spark
2
10. Outros Aspectos
Usando Spark com Notebooks do Jupyter
Convertendo Pandas para DataFrame do Spark
Usando biblioteca Koalas
2
Spark UI
Configurações do Spark
11. Construindo um Cluster
Introdução
Clonando VMs
2
Configurando Nó Master
Configurando Workers
Executando em Cluster
3
Formação Spark com Pyspark : o Curso Completo
Comprar agora
Saiba mais
1. Introdução
Apresentação
Material para Download
Introdução ao Spark
13
Arquitetura e Componentes
Context e Session
Formatos de Big Data
2
2. Instalação e Primeiros Passos
Introdução sobre a Instalação
8
Downloads
Instalando VM Ubuntu
2
Instalando Spark
20
Bibliotecas Adicionais
6
Rodando Exemplos
Baixando dados de Exemplo
3
Opcional: Putty com SSH
Putty com SSH
2
3. DataFrames e RDDs
RDD, Dataset e Dataframe
RDD parte I
4
RDD parte II
2
DataFrames Parte I
2
DataFrames Parte II
10
DataFrames Parte III
4
DataFrames Parte IV
2
Principais Ações e Transformações
Exportando dados
2
Importando Dados
Atividades: Faça você mesmo
2
Solução do Faça você mesmo
4
4. Spark SQL
Spark SQL
2
Bancos de Dados e Tabelas
2
Tabelas Gerenciadas e Externas
6
Views
Comparando DataFrames com Tabelas SQL
2
Joins
Joins com DataFrames e SQL
Utilizando Spark-sql
Atividades: Faça você mesmo
4
Solução do Faça você mesmo
Solução do Faça você mesmo - Continuação
6
5. Outras Fontes de Dados
Conectado a Outras Fontes de Dados
PostgreSQL
Instalando PostgreSQL
13
Drive JDBC
Lendo e Gravando Dados no PostgreSql
MongoDB
Instalando MongoDB
6
Lendo e Gravando Dados no MongoDB
6. Criando Aplicações
Aplicação 1: Escrevendo no Console
Aplicação 2: Escrevendo no Console com Parâmetros
Opção e argumentos em Linha de Comando
Aplicação 3: Conversor de Formatos de Arquivos em Spark
2
Atividades: Faça você mesmo
Solução do Faça você mesmo
7. Machine Learning
Fundamentos de Machine Learning
2
Machine Learning no Spark
Preparando Dados para Regressão
4
Criando um Modelo de Regressão
Preparando Dados para Classificação
Criando um Modelo de Classificação
3
Pipelines
Atividades: Faça você mesmo
Solução do Faça você mesmo
8. Spark Structured Streaming
O que é "Streaming"
Spark Structured Streaming
5
Casos Práticos
4
De JSON para o Console
2
De JSON para PostgreSQL
4
9. Otimização
Particionamento
Particionamento e Bucketing no Spark
2
Cache
Cache e Persistência no Spark
2
10. Outros Aspectos
Usando Spark com Notebooks do Jupyter
Convertendo Pandas para DataFrame do Spark
Usando biblioteca Koalas
2
Spark UI
Configurações do Spark
11. Construindo um Cluster
Introdução
Clonando VMs
2
Configurando Nó Master
Configurando Workers
Executando em Cluster
3