Padronização de Dados com StandarScaler

Padronização de Dados com StandarScaler

Pré-visualização indisponível

Você precisa fazer login ou se inscrever para ver esta lição.

EntrarInscrever-se

Machine Learning com Spark e Pyspark: o Curso Completo

Comprar agoraSaiba mais

1. Introdução

  • Apresentação
  • Introdução
  • Por que Machine Learning com Spark?

2. Conceitos Gerais de Machine Learning

  • Introdução
  • Introdução Parte II
  • Classificação
  • Regressão
  • Agrupamentos
  • Sistemas de Recomendação
  • Regressão Linear
  • Regressão Logística
  • Categorical Encoding
  • Feature Scalling

3. Preparação de Ambiente

  • Escolhendo o Ambiente
  • LINUX: Introdução sobre Instalação com VM Linux
  • Downloads Necessários
  • Instalando VM Ubuntu
  • Instalando Spark2
  • Bibliotecas Adicionais2
  • Rodando Exemplos na Linha de Comando
  • Instalando e Configurando Jupyter Notebooks
  • WINDOWS: Orientações de Instalação e Configuração
  • NUVEM: Databricks Community Edition

4. Importação de Dados

  • Dados Utilizados Durante o Curso
  • Material para Download2
  • Introdução a Importação de Dados no Spark
  • Formato LIBSVM
  • Exemplos de Importações Diversas
  • Importando LIBSVM

5. Engenharia de Atributos e Pré-Processamento

  • Vetorização de Atributos com VectorAssembler
  • Geração de Características com PCA (Principal component analysis)
  • Binarização de Atributos
  • Indexação de Texto com StringIndexer
  • Índice para Texto com IndexToString
  • Categorical Encoding com One Hot Encoding
  • Tratando Valores Ausentes com Imputer2
  • Expansão de Atributos com PolynomialExpansion
  • Normalização de Dados com Normalizer
  • Padronização de Dados com StandarScaler
  • Padronização de Dados com RobustScaler
  • Padronização de Dados com MinMaxScaler
  • Padronização de Dados com MaxAbsScaler
  • Discretização de Dados
  • Transformação com RFormula
  • Divisor de Vetores com VectorSlicer
  • Seleção de Atributos com ChiSqSelector (qui-quadrado)4
  • Seleção de Atributos com UnivariateFeatureSelector

6. Regressão com Spark

  • Regressão Linear Múltipla com Spark
  • Métodos Diversos de Regressão
  • Regressão com RandomForest (Florestas Aleatórias)

7. Classificação Binária e Multi Classe com Spark

  • Classificação Logística
  • Classificação com NaiveBayes
  • Classificação com Rede Neural Artificial (Multi Layer Perceptron)

8. Agrupamentos com Spark

  • Agrupamentos com Kmeans2
  • Agrupamento Hierárquico com HierarchicalBisecting

9. Associadores com Spark

  • Associadores com FP-Growth

10. Construindo Pipelines de Machine Learning

  • Construindo Pipelines com Spark

11. Ajuste de Hiper Parâmetros (Tunning)

  • Ajuste com Cross-Validation 2
  • Ajuste com Train-Validation Split2