Muito boa explicação! Estou iniciando nesta area e fui praticar em um arquivo e ficai com dúvidas pois após preparar dos os dados e quando fui fazer o processamento OneHotEncode gerou muitos NaT e NaN ao verificar variavel.isnull().sum(). É normal ou terei que fazer todo o procedimento com dados faltantes?
O LabelEncoder gera um problema chamado de Ponderação Arbitrária, muito comum pelo o que tenho visto. Por mais que exista uma ordem em uma determinada variável qualitativa, atribuir pesos as classes não faz sentido estatístico. A variável categórica só mede frequência, não dá pra multiplicar, subtrair ou fazer adições nesta variável. A única solução plausível é a aplicação do One-Hot Encoder (Dummys). No exemplo do nível de escolaridade, graduação = 1, mestrado = 2, doutorado = 3. Porque doutorado seria 3 vezes maior que graduação? Não faz sentido algum. O que pode ser feito é ROTULAR as classes, mas apenas para ter uma noção de ordem... Não para aplicar em modelos
Olá, Eduardo! Uma dúvida: No caso do atributo município em meu dataset, tendo em vista que são vários municípios (uns 6.000), estou na duvida se uso OneHotEncoder para a codificação. Terei muitas colunas!! Tenho medo de que isso atrapalhe o modelo. Como proceder? É assim mesmo?
eu ja assisti a este video umas quatro vezes.. que sacada!! outro video que eu adoro e de padronização e normalização...
Massa! Tamojunto minha JEDI!
EXCELENTE EXPLICAÇÃO! Tive que colocar em caps lock tamanha a contribuição que você deu pros meus estudos.
Tamojunto Victor!
que didática absurda! to realizando alguns cursos pagos, e tive que recorrer a essa sua aula, onde aprendi infinitamente mais!
tamojunto, Juan!!
Sensacional, muito obrigado, o video tem 32 min e é melhor que muitos curso de 48 horas.
sensacional! muito obrigado!
énóix
Além da didática maravilhosa!
Olha a empolgação desse Professor!
Dá até gosto de aprender!!
Parabéns!
Énóix, minha CDP! Simbóra!
Cara, aula top demais. Congrats!!
10:34 Label Encoder 18:08 OneHotEncoder
énóix
Muito boa aula! Parabéns
Valeu Rafa!!! tmj
Muito boa explicação! Estou iniciando nesta area e fui praticar em um arquivo e ficai com dúvidas pois após preparar dos os dados e quando fui fazer o processamento OneHotEncode gerou muitos NaT e NaN ao verificar variavel.isnull().sum(). É normal ou terei que fazer todo o procedimento com dados faltantes?
Vc disponibiliza o colab utilizado nessa aula?
Nossa, moço, vc é MARAVILHOSO!!!! ^^ Passo sempre o conhecimento pra frente ^^
Ooooopa! Que legal! Tmj Simbóraa!
Que vídeo sensacional!
Você tem uma didática absurda, parabéns.
+1 inscrito
Excelente vídeo!
Sua oratória e domínio da matéria são excelentes.
Conquistou +1 inscrito.
Caraca! Fodástico comentário João! Obrigado, cara!
Sensacional a didática
Valeu man! Tmj
Que aula top, parabéns!
Obrigado!
Valeu Alef! Simbóra!
agora eu entendi quando usar um ou o outro! obg!!
Que massa, Erivan! Tamojunto!
O LabelEncoder gera um problema chamado de Ponderação Arbitrária, muito comum pelo o que tenho visto. Por mais que exista uma ordem em uma determinada variável qualitativa, atribuir pesos as classes não faz sentido estatístico. A variável categórica só mede frequência, não dá pra multiplicar, subtrair ou fazer adições nesta variável. A única solução plausível é a aplicação do One-Hot Encoder (Dummys). No exemplo do nível de escolaridade, graduação = 1, mestrado = 2, doutorado = 3. Porque doutorado seria 3 vezes maior que graduação? Não faz sentido algum. O que pode ser feito é ROTULAR as classes, mas apenas para ter uma noção de ordem... Não para aplicar em modelos
Isso aí.....
Olá, Eduardo! Uma dúvida: No caso do atributo município em meu dataset, tendo em vista que são vários municípios (uns 6.000), estou na duvida se uso OneHotEncoder para a codificação. Terei muitas colunas!! Tenho medo de que isso atrapalhe o modelo. Como proceder? É assim mesmo?
Muito bom, parabéns. +1 inscrito.
Boa Renan! valeu demais!!!
Muito bom!
Valeu Jú! Tamojunto
Você não eliminou uma variável dummy, você eliminou a variável idade pra recalcular o VIF.
Boa Vitor! Verdade.... Se você tiver dois ou mais fatores com um VIF alto, remova um deles do modelo, e segue o jogo.....
Simbóra!
Like 338 && +1 inscrito 👏👏👏😉👍
Valeu man!
Massa, esse video!
Boa , man!
Mas idade é variável dummy?
Se vc criar classes com a idade sim.....sacou?
Muito bom!