Skip to content

Machine Learning codes approaching models, clustering, underfitting, overfitting and neural networks.

License

Notifications You must be signed in to change notification settings

JonatasFontele/machine-learning-lead-dell

Repository files navigation

GitHub Open Source

Machine Learning

alt text

O objetivo é conhecer as principais técnicas de Aprendizado de Máquina (Machine Learning) e saber como utilizá-las, construindo modelos que extraem informação a partir de dados dos mais diferentes tipos. Foi utilizado Jupyter Badge.

ipynb

  • fruit_data_with_colors_analise.ipynb
    • Introdução à Análise de Dados com Python.
      • Demonstração da leitura de arquivos em modo texto.
      • Demonstração da tabela e informações básicas.
    • Análise Estatística de um Conjunto de Dados.
      • Demonstração das estatísticas do conjunto de dados.
      • Demonstração da manipulação de linhas e colunas.
    • Análise e Visualização de um Conjunto de Dados.
      • Demonstração do balanceamento dos dados.
      • Demonstração da visualização de gráficos.
      • Finalização da demonstração da funcionalidade básica de um notebook Jupyter.
  • fruit_data_with_colors_miss_analise.ipynb
    • Introdução ao Pré-processamento de Dados com Python.
      • Demonstração da leitura de arquivos em modo texto com valores faltantes (missing values).
      • Demonstração da tabela e informações básicas com valores faltantes.
    • Imputando Valores Faltantes.
      • Tratar os dados de modo que os valores faltantes passem a não existir.
    • Eliminação de Colunas.
      • Demonstração de eliminação de coluna quando a imputação de dados se mostrar ineficiente por serem muitos dados faltantes.
    • Transformando a escala dos dados.
      • Transformar a escala dos dados para deixar os dados com importâncias iguais.
    • Encontrando outliers
      • Demonstrar como encontrar os dados discrepantes, elementos que possuem uma de suas características fora de um padrão.
  • regressao_para_prever_venda_sorvetes.ipynb
    • Introdução a Regressão.
      • Criação de um DataFrame com arrays do numpy.
      • Demonstração de separação de variável independente e variável dependente.
      • Demonstração de treinamento de modelo usando regressão linear.
      • Demonstração e plot de previsão.
  • car_data_regressao_linear_multipla.ipynb
  • fruit_data_with_colors_KNN_&_boston_house_prices_KNN.ipynb
    • Introdução ao KNN.
      • Exemplificar a distância Euclidiana.
      • Demonstração do KNN para classificação usando fruit_data_with_colors.
      • Demonstração de pré-processamento de dados para o KNN.
      • Demonstração do KNN para regressão usando load_boston.
  • arvore_de_decisao.ipynb
    • Introdução às árvores de decisão.
      • Implementando as árvores de decisão.
      • Selecionando features com árvores de decisão.

Conteúdo Programático

  • 1.Introdução a machine learning

    • Descrever fundamentos e conceitos de Aprendizado de Máquina, tais como as diferentes tarefas sobre dados.
  • 2.Modelos de aprendizado de máquina

    • Descrever os principais modelos de Aprendizado de Máquina, tais como a sua utilidade diante de diversos tipos de dados.
  • 3.Clusterização e modelos

    • Definir o conceito e o algoritmo de clusterização e K-Means.
  • 4.Avaliação de modelos

    • Aprender técnicas de como avaliar um modelo segundo os conceitos de underfitting e overfitting.
  • 5.Introdução às redes neurais

    • Descrever as principais arquiteturas de Redes Neurais, tal como a sua implementação a partir do TensorFlow Badge.
  • 6.Tópicos avançados

    • Estudar modelos e análises mais avançadas em Aprendizado de Máquina.