Machine Learning com Spark e Pyspark: o Curso Completo
- Compre Agora
- Saiba mais
1. Introdução

Apresentação
Introdução
Por que Machine Learning com Spark?
2. Conceitos Gerais de Machine Learning

Introdução
Introdução Parte II
Classificação
Regressão
Agrupamentos
Sistemas de Recomendação
Regressão Linear
Regressão Logística
Categorical Encoding
Feature Scalling
3. Preparação de Ambiente

Escolhendo o Ambiente
LINUX: Introdução sobre Instalação com VM Linux
Downloads Necessários
Instalando VM Ubuntu
Instalando Spark
Bibliotecas Adicionais
Rodando Exemplos na Linha de Comando
Instalando e Configurando Jupyter Notebooks
WINDOWS: Orientações de Instalação e Configuração
NUVEM: Databricks Community Edition
4. Importação de Dados

Dados Utilizados Durante o Curso
Material para Download
Introdução a Importação de Dados no Spark
Formato LIBSVM
Exemplos de Importações Diversas
Importando LIBSVM
5. Engenharia de Atributos e Pré-Processamento

Vetorização de Atributos com VectorAssembler
Geração de Características com PCA (Principal component analysis)
Binarização de Atributos
Indexação de Texto com StringIndexer
Índice para Texto com IndexToString
Categorical Encoding com One Hot Encoding
Tratando Valores Ausentes com Imputer
Expansão de Atributos com PolynomialExpansion
Normalização de Dados com Normalizer
Padronização de Dados com StandarScaler
Padronização de Dados com RobustScaler
Padronização de Dados com MinMaxScaler
Padronização de Dados com MaxAbsScaler
Discretização de Dados
Transformação com RFormula
Divisor de Vetores com VectorSlicer
Seleção de Atributos com ChiSqSelector (qui-quadrado)
Seleção de Atributos com UnivariateFeatureSelector
6. Regressão com Spark

Regressão Linear Múltipla com Spark
Métodos Diversos de Regressão
Regressão com RandomForest (Florestas Aleatórias)
7. Classificação Binária e Multi Classe com Spark

Classificação Logística
Classificação com NaiveBayes
Classificação com Rede Neural Artificial (Multi Layer Perceptron)
8. Agrupamentos com Spark

Agrupamentos com Kmeans
Agrupamento Hierárquico com HierarchicalBisecting
9. Associadores com Spark

Associadores com FP-Growth
10. Construindo Pipelines de Machine Learning

Construindo Pipelines com Spark
11. Ajuste de Hiper Parâmetros (Tunning)

Ajuste com Cross-Validation
Ajuste com Train-Validation Split

11. Ajuste de Hiper Parâmetros (Tunning)

2 Lições