Machine Learning com Spark e Pyspark: o Curso Completo
Compre Agora
Saiba mais
1. Introdução
Apresentação
Introdução
Por que Machine Learning com Spark?
2. Conceitos Gerais de Machine Learning
Introdução
Introdução Parte II
Classificação
Regressão
Agrupamentos
Sistemas de Recomendação
Regressão Linear
Regressão Logística
Categorical Encoding
Feature Scalling
3. Preparação de Ambiente
Escolhendo o Ambiente
LINUX: Introdução sobre Instalação com VM Linux
Downloads Necessários
Instalando VM Ubuntu
Instalando Spark
Bibliotecas Adicionais
Rodando Exemplos na Linha de Comando
Instalando e Configurando Jupyter Notebooks
WINDOWS: Orientações de Instalação e Configuração
NUVEM: Databricks Community Edition
4. Importação de Dados
Dados Utilizados Durante o Curso
Material para Download
Introdução a Importação de Dados no Spark
Formato LIBSVM
Exemplos de Importações Diversas
Importando LIBSVM
5. Engenharia de Atributos e Pré-Processamento
Vetorização de Atributos com VectorAssembler
Geração de Características com PCA (Principal component analysis)
Binarização de Atributos
Indexação de Texto com StringIndexer
Índice para Texto com IndexToString
Categorical Encoding com One Hot Encoding
Tratando Valores Ausentes com Imputer
Expansão de Atributos com PolynomialExpansion
Normalização de Dados com Normalizer
Padronização de Dados com StandarScaler
Padronização de Dados com RobustScaler
Padronização de Dados com MinMaxScaler
Padronização de Dados com MaxAbsScaler
Discretização de Dados
Transformação com RFormula
Divisor de Vetores com VectorSlicer
Seleção de Atributos com ChiSqSelector (qui-quadrado)
Seleção de Atributos com UnivariateFeatureSelector
6. Regressão com Spark
Regressão Linear Múltipla com Spark
Métodos Diversos de Regressão
Regressão com RandomForest (Florestas Aleatórias)
7. Classificação Binária e Multi Classe com Spark
Classificação Logística
Classificação com NaiveBayes
Classificação com Rede Neural Artificial (Multi Layer Perceptron)
8. Agrupamentos com Spark
Agrupamentos com Kmeans
Agrupamento Hierárquico com HierarchicalBisecting
9. Associadores com Spark
Associadores com FP-Growth
10. Construindo Pipelines de Machine Learning
Construindo Pipelines com Spark
11. Ajuste de Hiper Parâmetros (Tunning)
Ajuste com Cross-Validation
Ajuste com Train-Validation Split
Produtos
Curso
Seção
11. Ajuste de Hiper Parâmetros (Tunning)
11. Ajuste de Hiper Parâmetros (Tunning)
Machine Learning com Spark e Pyspark: o Curso Completo
Compre Agora
Saiba mais
1. Introdução
Apresentação
Introdução
Por que Machine Learning com Spark?
2. Conceitos Gerais de Machine Learning
Introdução
Introdução Parte II
Classificação
Regressão
Agrupamentos
Sistemas de Recomendação
Regressão Linear
Regressão Logística
Categorical Encoding
Feature Scalling
3. Preparação de Ambiente
Escolhendo o Ambiente
LINUX: Introdução sobre Instalação com VM Linux
Downloads Necessários
Instalando VM Ubuntu
Instalando Spark
Bibliotecas Adicionais
Rodando Exemplos na Linha de Comando
Instalando e Configurando Jupyter Notebooks
WINDOWS: Orientações de Instalação e Configuração
NUVEM: Databricks Community Edition
4. Importação de Dados
Dados Utilizados Durante o Curso
Material para Download
Introdução a Importação de Dados no Spark
Formato LIBSVM
Exemplos de Importações Diversas
Importando LIBSVM
5. Engenharia de Atributos e Pré-Processamento
Vetorização de Atributos com VectorAssembler
Geração de Características com PCA (Principal component analysis)
Binarização de Atributos
Indexação de Texto com StringIndexer
Índice para Texto com IndexToString
Categorical Encoding com One Hot Encoding
Tratando Valores Ausentes com Imputer
Expansão de Atributos com PolynomialExpansion
Normalização de Dados com Normalizer
Padronização de Dados com StandarScaler
Padronização de Dados com RobustScaler
Padronização de Dados com MinMaxScaler
Padronização de Dados com MaxAbsScaler
Discretização de Dados
Transformação com RFormula
Divisor de Vetores com VectorSlicer
Seleção de Atributos com ChiSqSelector (qui-quadrado)
Seleção de Atributos com UnivariateFeatureSelector
6. Regressão com Spark
Regressão Linear Múltipla com Spark
Métodos Diversos de Regressão
Regressão com RandomForest (Florestas Aleatórias)
7. Classificação Binária e Multi Classe com Spark
Classificação Logística
Classificação com NaiveBayes
Classificação com Rede Neural Artificial (Multi Layer Perceptron)
8. Agrupamentos com Spark
Agrupamentos com Kmeans
Agrupamento Hierárquico com HierarchicalBisecting
9. Associadores com Spark
Associadores com FP-Growth
10. Construindo Pipelines de Machine Learning
Construindo Pipelines com Spark
11. Ajuste de Hiper Parâmetros (Tunning)
Ajuste com Cross-Validation
Ajuste com Train-Validation Split
2 Lições
Ajuste com Cross-Validation
Ajuste com Train-Validation Split