Como fazer NORMALIZAÇÃO e PADRONIZAÇÃO de DADOS (O Guia Completo)

Поделиться
HTML-код
  • Опубликовано: 13 дек 2024

Комментарии • 62

  • @SempreVolto
    @SempreVolto 26 дней назад +1

    Cara, to impressionado com o seu conteúdo, está completamente dentro dos meus padrões de exigência para classificar como conteúdo de qualidade.

  • @daleffi
    @daleffi 2 месяца назад +1

    Parabéns pelo trabalho!
    Lembrando aqui das coisas que vi na minha pós graduação.
    É importante saber o conceito matemático por baixo do capô, galera.
    O pessoal só quer sair importando pacote e depois nao sabe o que está acontecendo no seu modelo.
    Parabéns mais uma vez.
    Ganhou outro inscrito!

  • @camila92500
    @camila92500 3 месяца назад +2

    Estudo na USP (Ciências de dados) e vc explicou muito melhor que meus professores! Muito obrigada!

  • @toninhobalani
    @toninhobalani 5 месяцев назад +1

    Melhor vídeo que já vi sobre o assunto! Com muito conteúdo profundo. Não somente o operacional! Parabéns!

  • @xpto-sq2uk
    @xpto-sq2uk 4 месяца назад

    Excelente. Parabéns. Melhor já visto.

  • @rodrigocezar664
    @rodrigocezar664 Год назад +2

    Já é o 3º video que eu vi só hoje, excelente didática, parabéns pelo conteúdo!!

  • @albertgodinho5137
    @albertgodinho5137 2 года назад +2

    conheci este que canal hj, excelente sua didática é esta me ajudando muito nos trabalhos da faculdade, e descobri minha nova vocação 😃. pf continue belo bem da humanidade. parabéns🙏

  • @cmallagoli
    @cmallagoli Месяц назад +1

    Como calcular a normalização de dois ativos da bolsa de valores, o WINFUT e a bolsa do Japão, o NIKKEI 225, para plotar em um gráfico de linhas que atualiza de um em um minuto entre as 8:00 e as 18:00 do fuso horário de Brasília? Lembrando que os ativos possuem as variáveis de PREÇO DE ABERTURA, PREÇO ATUAL, MÁXIMA e MÍNIMA.

    • @nerddosdados
      @nerddosdados  Месяц назад

      Pode fazer o cálculo da mesma forma que qualquer variável

  • @joseeduardojunior5534
    @joseeduardojunior5534 Год назад +1

    Cara sua didática é muito boa, explica os conceitos de forma magistral, fazendo com que a pessoa saiba o que aplica e não apenas fazer códigos.

  • @danielsilvarocha1980
    @danielsilvarocha1980 5 месяцев назад

    Excelente, sanou várias dúvidas minhas.

  • @AlexandreAfonsoF
    @AlexandreAfonsoF Год назад +1

    Muito boa essa aula (e as outras tbm)!

  • @fabionascimento2856
    @fabionascimento2856 6 месяцев назад

    Que aula showwwwww professores deveriam ver esse video

  • @Gilmar-x3v
    @Gilmar-x3v Год назад

    Material completo e bem explicado, mostrando realmente a necessidade de normalizar ou padronizar os dados. Obrigado Professor Jerferson.

  • @tiagoalves6494
    @tiagoalves6494 7 месяцев назад

    Seus vídeos são excelentes!
    Obrigado pelo conteúdo.

  • @leandrocarvalho5945
    @leandrocarvalho5945 2 года назад +1

    Excelente aula, Parabéns e continue trazendo conteúdos

  • @Garr1tano
    @Garr1tano 2 месяца назад +1

    Eu tenho acompanhados vários vídeos do canal e gostei bastante!
    1. Dos vídeos que eu vi nenhum abordava o assunto sobre cross validation (validação cruzada).
    2. Se fosse possível, faça mais vídeos sobre series temporais e algum sobre clusterização.
    3. Você informa que não devemos normalizar e nem padronizar a variável target, qual código é utilizado para isso? Você usa o dataframe.drop('coluna_target', axis=1) em seguida normaliza ou padroniza os dados?
    Obrigado!

    • @nerddosdados
      @nerddosdados  2 месяца назад

      Para a variável target da pra separa-la de várias formas, na playlist de modelos preditivos completos tem tanto usando drop como fazendo slide também

    • @Garr1tano
      @Garr1tano 2 месяца назад

      ​@@nerddosdados eu não sei se fui claro na pergunta, mas quis dizer separar a variável target antes da padronização ou normalização.
      Porque se você fizer um slice ou drop, automaticamente estará excluindo a variável target do dataframe.
      Aí queria saber qual código que você utiliza para fazer essa separação da variável target e reutiliza-la no dataframe posteriormente.

  • @luis48815
    @luis48815 Год назад +1

    mandou muito bem, obrigado

  • @martinmosqueraa
    @martinmosqueraa Год назад +1

    muito obrigado profe, ajudou muito 💜

  • @gallianijean
    @gallianijean Год назад

    Pensa num vídeo que deve ter dado trabalho para preparar, parabéns pela dedicação!

    • @nerddosdados
      @nerddosdados  Год назад

      Verdade muitooo trabalho mas o importante é que está agregando valor pra vocês

  • @beatriz9567
    @beatriz9567 8 месяцев назад

    Adorando o conteúdo do canal. Parabéns.

  • @renannunesbittencourt2416
    @renannunesbittencourt2416 2 года назад +1

    Incrível sua didática!😀

  • @MyTam90
    @MyTam90 8 месяцев назад

    Parabens pelo trabalho 👏👏

  • @dps1987
    @dps1987 Год назад

    Conteúdo muito bom, meus parabéns sucesso sempre!!

  • @estorres2020
    @estorres2020 Год назад +1

    Parabéns pelo trabalho. Quando vai ter curso? Tô dentro!!!

    • @nerddosdados
      @nerddosdados  Год назад

      Boa tarde Eduardo. O curso sairá no próximo mês e está recheado de material top.
      Com certeza vocês irão gostar.

  • @carlosjunior3298
    @carlosjunior3298 Год назад

    Chegando agora no canal e já curti bastante.. didática muito boa, clara e objetiva. Parabéns | "Poderia fazendo um conteúdo falando sobre manipulação dos dados em JSON"

    • @nerddosdados
      @nerddosdados  Год назад

      Ola Carlos
      Tenho um vídeo que ensino como utilizar uma API de CEP e tem toda manipulação de JSON, vou deixar o link pra você aqui ruclips.net/video/RpHu-YEn0-M/видео.html

  • @andrefelipeciccoribas6932
    @andrefelipeciccoribas6932 Год назад

    Excelente vídeo!

  • @alehffeinstein
    @alehffeinstein 2 года назад

    Parabéns pelo conteúdo! Muito didático e completo. Você poderia fazer um vídeo falando sobre clusterizações, por favor? Falando sobre qual tecnica (padronização ou normalização) se aplica melhor, e como tratar os dados pra aumentar a eficácia da clusterização, essas coisas... Ficaria muito grato. Mais uma vez parabéns pela iniciativa, tomara que cresça bastante o canal

    • @nerddosdados
      @nerddosdados  2 года назад +2

      Olá obrigado pelo feedback.
      Vou preparar um vídeo sobre clusterizacao falando sobre esses pontos que você comentou.

    • @nerddosdados
      @nerddosdados  2 года назад +2

      Olá, hoje as 19:00 vai ficar disponível o vídeo sobre Clusterização mostrando os resultados com dados normais e o resultado com dados normalizados, ficou bem legal vale a pena dar uma olhada. Obrigado.

    • @alehffeinstein
      @alehffeinstein 2 года назад +1

      Cara, muito obrigado! Com certeza vou dar uma olhada!

  • @MarcioLuisdeSousaBorges
    @MarcioLuisdeSousaBorges Год назад

    MUito bom !! Excelente !!

  • @flaviakrollguimaraes727
    @flaviakrollguimaraes727 Год назад

    Vídeo muito top

  • @danieljborges
    @danieljborges Год назад

    matérial muito rico, incrível. sobre a padronização... eu só consigo usar a padronização em um conjunto de dados com distribuição normal? aquela em forma de sino simetrica que a gente vê plotando um histograma?

    • @nerddosdados
      @nerddosdados  Год назад +1

      A padronização ou normalização pode ser usada em qualquer conjunto de dados. Deve ser usada principalmente nos dados que a distribuição não é simétrica

    • @danieljborges
      @danieljborges Год назад

      @@nerddosdados obrigado!!❤️

  • @leonardonassibfonseca5616
    @leonardonassibfonseca5616 Год назад

    Excelente didática, parabéns!
    Porém ficou uma dúvida. Em modelos de regressão e clusterização, a variável resposta também não seria normalizada/padronizada?

    • @nerddosdados
      @nerddosdados  Год назад

      Obrigado
      A variável resposta não precisa ser padronizada nem normalizada não, somente as preditoras

  • @mathewsaugusto4643
    @mathewsaugusto4643 Год назад

    Muito bom! Na regressao linear é preferivel tambem fazer a padronização?

  • @DanielFernandes-qg5xh
    @DanielFernandes-qg5xh Год назад

    top

  • @matheuspeixoto5593
    @matheuspeixoto5593 7 месяцев назад

    Em modelos de regressão, onde as variáveis target são contínuas, é necessário padronizar ou normalizar?

    • @nerddosdados
      @nerddosdados  7 месяцев назад

      Boa tarde
      Não é obrigatório padronizar e normalizar porém seu modelo terá uma melhor performance se você fizer isso. Eu sempre faço

    • @matheuspeixoto5593
      @matheuspeixoto5593 7 месяцев назад

      Tem um vídeo do canal ScoreCredito. Me parece que fez apenas nas variável X_treino e X_teste.
      Essa parte que tô em dúvida

  • @rodrigocezar664
    @rodrigocezar664 Год назад

    Na padronização, a média tem que dar exclusivamente o valor 0? Fiquei com esse questionamento quando você fez o describe das variaveis padronizadas e elas ficaram variando entre valores de 1.3..., -2.6...,-4.3...

    • @nerddosdados
      @nerddosdados  Год назад +1

      Olá Rodrigo. É porque como a escala dos dados ficou grande observe que os valores estão em notação científica, mas se converter pra escala decimal ele ficará zero.
      No comando seguinte onde mostra a média pelo BOXPLOT pode observar que ficou tudo zero.
      Esses dados estão com média zero mas o comando describe converteu pra notação científica por isso.

    • @rodrigocezar664
      @rodrigocezar664 Год назад

      @@nerddosdados Ahh verdade, bem que você tinha falado no vídeo mesmo, valeu!!

    • @rodrigocezar664
      @rodrigocezar664 Год назад

      @@nerddosdados Então no caso, nem sempre vai ser 0, provavelmente vai ser um 0,00000…1739 por exemplo.

  • @pauloufes
    @pauloufes Год назад

    Eu preciso padronizar para depois normalizar ou posso normalizar direto?

    • @nerddosdados
      @nerddosdados  Год назад

      Você padroniza ou normaliza, não pode fazer os dois

  • @paulamariadonascimento3784
    @paulamariadonascimento3784 2 года назад

    Oi! no caso da padronização é sempre bom tratar os outiliers antes? quando se tem uma variavel com média e desvio padrão muito alto, pode influênciar na padronização né? ou não...

    • @nerddosdados
      @nerddosdados  2 года назад +1

      Oi Paula
      Exatamente, na padronização os outliers influenciam e o ideal é retirar os outliers antes de padronizar
      Na normalização os outliers nao influenciam porque você sempre terá valores entre 0 e 1

    • @paulamariadonascimento3784
      @paulamariadonascimento3784 2 года назад

      @@nerddosdados show... obrigada

  • @xpto-sq2uk
    @xpto-sq2uk 4 месяца назад

    Excelente. Parabéns. Melhor já visto.