Ao treinar um modelo com machine learning, conseguimos identificar quais são as variáveis mais importantes. No caso de uma planilha de vendas em uma grande loja, isso nos dá insights de melhoria física através da relevância das variáveis ou essa relevância só é importante mesmo para a melhoria do modelo?
cada modelo mede a importância das variáveis de uma forma diferente. O que é preciso ter claro, é que essa importância se dá pela relação da variável resposta (seu evento de interesse), e as demais variáveis. Ou seja, a primeira coisa é ter clareza de qual é o seu evento de interesse (sua variável resposta). No caso da árvore de decisão, se utiliza gini, entropia, qui-quadrado para medir a importância da variável em relação à resposta. Já nos modelos lineares generalizados, usamos o p-valor (ou intervalo de confiança).
@@teomewhy Entendi, obrigado. No caso de fazer esse treinamento em python, seria, por exemplo?: X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) Obrigado.
Excelente vídeo, Teo! Obrigado man
Animal! explicou tudo de uma maneira muito simples! parabéns Téo!
Cheguei aqui após um tweet! Obrigada me ajudou muito sz
Da hora!! Boas vindas. Espero que nosso conteúdo continue te ajudando.
Grande Teo. Por mais pílulas de conhecimento como este.
Valeu demais!
Ao treinar um modelo com machine learning, conseguimos identificar quais são as variáveis mais importantes. No caso de uma planilha de vendas em uma grande loja, isso nos dá insights de melhoria física através da relevância das variáveis ou essa relevância só é importante mesmo para a melhoria do modelo?
cada modelo mede a importância das variáveis de uma forma diferente. O que é preciso ter claro, é que essa importância se dá pela relação da variável resposta (seu evento de interesse), e as demais variáveis. Ou seja, a primeira coisa é ter clareza de qual é o seu evento de interesse (sua variável resposta).
No caso da árvore de decisão, se utiliza gini, entropia, qui-quadrado para medir a importância da variável em relação à resposta. Já nos modelos lineares generalizados, usamos o p-valor (ou intervalo de confiança).
Muito bom ! Obrigado !
Esse video é ouro rapaz
Valeu demais! Corre lá se increver no canal!
Excelente! Parabéns pelo conteúdo.
Valeu demais 👏🏻👏🏻
Show!
No final não entendi como faz o grupo A e B
Sorteio aleatório, garantindo que a população seja homogênea e que todos indivíduos tenham chances iguais de cair nos grupos.
@@teomewhy Entendi, obrigado. No caso de fazer esse treinamento em python, seria, por exemplo?:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
Obrigado.
sim, mas isso não é um teste A/B. A amostragem é uma etapa do teste A/B.
ótimo video
🎉✔️
mais conhecido como teste T
É uma possibilidade. Mas eu prefiro o teste de Tukey. Principalmente ao lidar com testes A/B/C...