Padronização de Dados com StandarScaler

Padronização de Dados com StandarScaler

Pré-visualização indisponível

Você precisa fazer login ou se inscrever para ver esta lição.

EntrarInscrever-se

Machine Learning com Spark e Pyspark: o Curso Completo

Comprar agoraSaiba mais

1. Introdução

Apresentação

Introdução

Por que Machine Learning com Spark?

2. Conceitos Gerais de Machine Learning

Introdução

Introdução Parte II

Classificação

Regressão

Agrupamentos

Sistemas de Recomendação

Regressão Linear

Regressão Logística

Categorical Encoding

Feature Scalling

3. Preparação de Ambiente

Escolhendo o Ambiente

LINUX: Introdução sobre Instalação com VM Linux

Downloads Necessários

Instalando VM Ubuntu

Instalando Spark2

Bibliotecas Adicionais2

Rodando Exemplos na Linha de Comando

Instalando e Configurando Jupyter Notebooks

WINDOWS: Orientações de Instalação e Configuração

NUVEM: Databricks Community Edition

4. Importação de Dados

Dados Utilizados Durante o Curso

Material para Download2

Introdução a Importação de Dados no Spark

Formato LIBSVM

Exemplos de Importações Diversas

Importando LIBSVM

5. Engenharia de Atributos e Pré-Processamento

Vetorização de Atributos com VectorAssembler

Geração de Características com PCA (Principal component analysis)

Binarização de Atributos

Indexação de Texto com StringIndexer

Índice para Texto com IndexToString

Categorical Encoding com One Hot Encoding

Tratando Valores Ausentes com Imputer2

Expansão de Atributos com PolynomialExpansion

Normalização de Dados com Normalizer

Padronização de Dados com StandarScaler

Padronização de Dados com RobustScaler

Padronização de Dados com MinMaxScaler

Padronização de Dados com MaxAbsScaler

Discretização de Dados

Transformação com RFormula

Divisor de Vetores com VectorSlicer

Seleção de Atributos com ChiSqSelector (qui-quadrado)4

Seleção de Atributos com UnivariateFeatureSelector

6. Regressão com Spark

Regressão Linear Múltipla com Spark

Métodos Diversos de Regressão

Regressão com RandomForest (Florestas Aleatórias)

7. Classificação Binária e Multi Classe com Spark

Classificação Logística

Classificação com NaiveBayes

Classificação com Rede Neural Artificial (Multi Layer Perceptron)

8. Agrupamentos com Spark

Agrupamentos com Kmeans2

Agrupamento Hierárquico com HierarchicalBisecting

9. Associadores com Spark

Associadores com FP-Growth

10. Construindo Pipelines de Machine Learning

Construindo Pipelines com Spark

11. Ajuste de Hiper Parâmetros (Tunning)

Ajuste com Cross-Validation 2

Ajuste com Train-Validation Split2