Parabéns pelo trabalho! Lembrando aqui das coisas que vi na minha pós graduação. É importante saber o conceito matemático por baixo do capô, galera. O pessoal só quer sair importando pacote e depois nao sabe o que está acontecendo no seu modelo. Parabéns mais uma vez. Ganhou outro inscrito!
conheci este que canal hj, excelente sua didática é esta me ajudando muito nos trabalhos da faculdade, e descobri minha nova vocação 😃. pf continue belo bem da humanidade. parabéns🙏
Como calcular a normalização de dois ativos da bolsa de valores, o WINFUT e a bolsa do Japão, o NIKKEI 225, para plotar em um gráfico de linhas que atualiza de um em um minuto entre as 8:00 e as 18:00 do fuso horário de Brasília? Lembrando que os ativos possuem as variáveis de PREÇO DE ABERTURA, PREÇO ATUAL, MÁXIMA e MÍNIMA.
Eu tenho acompanhados vários vídeos do canal e gostei bastante! 1. Dos vídeos que eu vi nenhum abordava o assunto sobre cross validation (validação cruzada). 2. Se fosse possível, faça mais vídeos sobre series temporais e algum sobre clusterização. 3. Você informa que não devemos normalizar e nem padronizar a variável target, qual código é utilizado para isso? Você usa o dataframe.drop('coluna_target', axis=1) em seguida normaliza ou padroniza os dados? Obrigado!
@@nerddosdados eu não sei se fui claro na pergunta, mas quis dizer separar a variável target antes da padronização ou normalização. Porque se você fizer um slice ou drop, automaticamente estará excluindo a variável target do dataframe. Aí queria saber qual código que você utiliza para fazer essa separação da variável target e reutiliza-la no dataframe posteriormente.
Chegando agora no canal e já curti bastante.. didática muito boa, clara e objetiva. Parabéns | "Poderia fazendo um conteúdo falando sobre manipulação dos dados em JSON"
Ola Carlos Tenho um vídeo que ensino como utilizar uma API de CEP e tem toda manipulação de JSON, vou deixar o link pra você aqui ruclips.net/video/RpHu-YEn0-M/видео.html
Parabéns pelo conteúdo! Muito didático e completo. Você poderia fazer um vídeo falando sobre clusterizações, por favor? Falando sobre qual tecnica (padronização ou normalização) se aplica melhor, e como tratar os dados pra aumentar a eficácia da clusterização, essas coisas... Ficaria muito grato. Mais uma vez parabéns pela iniciativa, tomara que cresça bastante o canal
Olá, hoje as 19:00 vai ficar disponível o vídeo sobre Clusterização mostrando os resultados com dados normais e o resultado com dados normalizados, ficou bem legal vale a pena dar uma olhada. Obrigado.
matérial muito rico, incrível. sobre a padronização... eu só consigo usar a padronização em um conjunto de dados com distribuição normal? aquela em forma de sino simetrica que a gente vê plotando um histograma?
A padronização ou normalização pode ser usada em qualquer conjunto de dados. Deve ser usada principalmente nos dados que a distribuição não é simétrica
Excelente didática, parabéns! Porém ficou uma dúvida. Em modelos de regressão e clusterização, a variável resposta também não seria normalizada/padronizada?
Na padronização, a média tem que dar exclusivamente o valor 0? Fiquei com esse questionamento quando você fez o describe das variaveis padronizadas e elas ficaram variando entre valores de 1.3..., -2.6...,-4.3...
Olá Rodrigo. É porque como a escala dos dados ficou grande observe que os valores estão em notação científica, mas se converter pra escala decimal ele ficará zero. No comando seguinte onde mostra a média pelo BOXPLOT pode observar que ficou tudo zero. Esses dados estão com média zero mas o comando describe converteu pra notação científica por isso.
Oi! no caso da padronização é sempre bom tratar os outiliers antes? quando se tem uma variavel com média e desvio padrão muito alto, pode influênciar na padronização né? ou não...
Oi Paula Exatamente, na padronização os outliers influenciam e o ideal é retirar os outliers antes de padronizar Na normalização os outliers nao influenciam porque você sempre terá valores entre 0 e 1
Cara, to impressionado com o seu conteúdo, está completamente dentro dos meus padrões de exigência para classificar como conteúdo de qualidade.
Parabéns pelo trabalho!
Lembrando aqui das coisas que vi na minha pós graduação.
É importante saber o conceito matemático por baixo do capô, galera.
O pessoal só quer sair importando pacote e depois nao sabe o que está acontecendo no seu modelo.
Parabéns mais uma vez.
Ganhou outro inscrito!
Estudo na USP (Ciências de dados) e vc explicou muito melhor que meus professores! Muito obrigada!
Obrigado Camila
Melhor vídeo que já vi sobre o assunto! Com muito conteúdo profundo. Não somente o operacional! Parabéns!
Excelente. Parabéns. Melhor já visto.
Já é o 3º video que eu vi só hoje, excelente didática, parabéns pelo conteúdo!!
conheci este que canal hj, excelente sua didática é esta me ajudando muito nos trabalhos da faculdade, e descobri minha nova vocação 😃. pf continue belo bem da humanidade. parabéns🙏
Como calcular a normalização de dois ativos da bolsa de valores, o WINFUT e a bolsa do Japão, o NIKKEI 225, para plotar em um gráfico de linhas que atualiza de um em um minuto entre as 8:00 e as 18:00 do fuso horário de Brasília? Lembrando que os ativos possuem as variáveis de PREÇO DE ABERTURA, PREÇO ATUAL, MÁXIMA e MÍNIMA.
Pode fazer o cálculo da mesma forma que qualquer variável
Cara sua didática é muito boa, explica os conceitos de forma magistral, fazendo com que a pessoa saiba o que aplica e não apenas fazer códigos.
Muito obrigado
Excelente, sanou várias dúvidas minhas.
Muito boa essa aula (e as outras tbm)!
Que aula showwwwww professores deveriam ver esse video
Material completo e bem explicado, mostrando realmente a necessidade de normalizar ou padronizar os dados. Obrigado Professor Jerferson.
Seus vídeos são excelentes!
Obrigado pelo conteúdo.
Excelente aula, Parabéns e continue trazendo conteúdos
Obrigado 👍🏻
Eu tenho acompanhados vários vídeos do canal e gostei bastante!
1. Dos vídeos que eu vi nenhum abordava o assunto sobre cross validation (validação cruzada).
2. Se fosse possível, faça mais vídeos sobre series temporais e algum sobre clusterização.
3. Você informa que não devemos normalizar e nem padronizar a variável target, qual código é utilizado para isso? Você usa o dataframe.drop('coluna_target', axis=1) em seguida normaliza ou padroniza os dados?
Obrigado!
Para a variável target da pra separa-la de várias formas, na playlist de modelos preditivos completos tem tanto usando drop como fazendo slide também
@@nerddosdados eu não sei se fui claro na pergunta, mas quis dizer separar a variável target antes da padronização ou normalização.
Porque se você fizer um slice ou drop, automaticamente estará excluindo a variável target do dataframe.
Aí queria saber qual código que você utiliza para fazer essa separação da variável target e reutiliza-la no dataframe posteriormente.
mandou muito bem, obrigado
muito obrigado profe, ajudou muito 💜
Pensa num vídeo que deve ter dado trabalho para preparar, parabéns pela dedicação!
Verdade muitooo trabalho mas o importante é que está agregando valor pra vocês
Adorando o conteúdo do canal. Parabéns.
Incrível sua didática!😀
Parabens pelo trabalho 👏👏
Conteúdo muito bom, meus parabéns sucesso sempre!!
Parabéns pelo trabalho. Quando vai ter curso? Tô dentro!!!
Boa tarde Eduardo. O curso sairá no próximo mês e está recheado de material top.
Com certeza vocês irão gostar.
Chegando agora no canal e já curti bastante.. didática muito boa, clara e objetiva. Parabéns | "Poderia fazendo um conteúdo falando sobre manipulação dos dados em JSON"
Ola Carlos
Tenho um vídeo que ensino como utilizar uma API de CEP e tem toda manipulação de JSON, vou deixar o link pra você aqui ruclips.net/video/RpHu-YEn0-M/видео.html
Excelente vídeo!
Parabéns pelo conteúdo! Muito didático e completo. Você poderia fazer um vídeo falando sobre clusterizações, por favor? Falando sobre qual tecnica (padronização ou normalização) se aplica melhor, e como tratar os dados pra aumentar a eficácia da clusterização, essas coisas... Ficaria muito grato. Mais uma vez parabéns pela iniciativa, tomara que cresça bastante o canal
Olá obrigado pelo feedback.
Vou preparar um vídeo sobre clusterizacao falando sobre esses pontos que você comentou.
Olá, hoje as 19:00 vai ficar disponível o vídeo sobre Clusterização mostrando os resultados com dados normais e o resultado com dados normalizados, ficou bem legal vale a pena dar uma olhada. Obrigado.
Cara, muito obrigado! Com certeza vou dar uma olhada!
MUito bom !! Excelente !!
Vídeo muito top
matérial muito rico, incrível. sobre a padronização... eu só consigo usar a padronização em um conjunto de dados com distribuição normal? aquela em forma de sino simetrica que a gente vê plotando um histograma?
A padronização ou normalização pode ser usada em qualquer conjunto de dados. Deve ser usada principalmente nos dados que a distribuição não é simétrica
@@nerddosdados obrigado!!❤️
Excelente didática, parabéns!
Porém ficou uma dúvida. Em modelos de regressão e clusterização, a variável resposta também não seria normalizada/padronizada?
Obrigado
A variável resposta não precisa ser padronizada nem normalizada não, somente as preditoras
Muito bom! Na regressao linear é preferivel tambem fazer a padronização?
Sim para regressao tambem
top
Em modelos de regressão, onde as variáveis target são contínuas, é necessário padronizar ou normalizar?
Boa tarde
Não é obrigatório padronizar e normalizar porém seu modelo terá uma melhor performance se você fizer isso. Eu sempre faço
Tem um vídeo do canal ScoreCredito. Me parece que fez apenas nas variável X_treino e X_teste.
Essa parte que tô em dúvida
Na padronização, a média tem que dar exclusivamente o valor 0? Fiquei com esse questionamento quando você fez o describe das variaveis padronizadas e elas ficaram variando entre valores de 1.3..., -2.6...,-4.3...
Olá Rodrigo. É porque como a escala dos dados ficou grande observe que os valores estão em notação científica, mas se converter pra escala decimal ele ficará zero.
No comando seguinte onde mostra a média pelo BOXPLOT pode observar que ficou tudo zero.
Esses dados estão com média zero mas o comando describe converteu pra notação científica por isso.
@@nerddosdados Ahh verdade, bem que você tinha falado no vídeo mesmo, valeu!!
@@nerddosdados Então no caso, nem sempre vai ser 0, provavelmente vai ser um 0,00000…1739 por exemplo.
Eu preciso padronizar para depois normalizar ou posso normalizar direto?
Você padroniza ou normaliza, não pode fazer os dois
Oi! no caso da padronização é sempre bom tratar os outiliers antes? quando se tem uma variavel com média e desvio padrão muito alto, pode influênciar na padronização né? ou não...
Oi Paula
Exatamente, na padronização os outliers influenciam e o ideal é retirar os outliers antes de padronizar
Na normalização os outliers nao influenciam porque você sempre terá valores entre 0 e 1
@@nerddosdados show... obrigada
Excelente. Parabéns. Melhor já visto.