Entendendo de Vez o que é PCA - Principal Component Analysis

Поделиться
HTML-код
  • Опубликовано: 27 ноя 2024

Комментарии •

  • @dglaranjeira
    @dglaranjeira Год назад +7

    Esse vídeo foi muito melhor que meu professor que tentou me explicar PCA por 3 dias. Obrigado :)

  • @Renato970
    @Renato970 4 года назад +19

    muito boa a aula consegui entender o PCA em 30 minutos o que o meu professor não conseguiu explicar em 3 aulas..

    •  3 года назад +2

      Q comentário Foda, Renato! Valeu!

  • @thaynaralucia9207
    @thaynaralucia9207 10 месяцев назад

    Cara que incrível sua aula Prof. Eduardo! Ficou muito mais simples e eficaz da forma que você detalhou o PCA. Gratidão pelo conhecimento compartilhado!

  • @thabatacavalcante9425
    @thabatacavalcante9425 Год назад +1

    Vídeo muito bommm! Obrigada por esse vídeo, ajudando uma pesquisadora de cobras desse Brasil, a entender suas análises e melhorar suas pesquisas! Obrigada, sua didática é ótima!

  • @daianemonteiro3635
    @daianemonteiro3635 Год назад +1

    Aula excelente! Me ajudando na análise de dados do mestrado.

  • @deividsmek7559
    @deividsmek7559 3 года назад +3

    Parabéns, sua didática é ótima, inclusive consegui entender tudo em velocidade 2.0.

    •  3 года назад +1

      Q massa! Olha q falo rápido hein? rsrsrsr Simbóra!

  • @luisluisrs
    @luisluisrs 2 года назад

    Ótimo, uso bastante em planejamento de operações digital

    •  2 года назад

      Boa Lúuuu!! Q massa

  • @ruanmarinho2111
    @ruanmarinho2111 2 года назад

    Me deparei com esse termo nos estudos e resolvi recorrer a um conteúdo externo. Melhor decisão que tive! Ótima didática, parabéns!

    •  2 года назад +1

      Que féra, Ruan! Massa mesmo! Tamojunto

  • @murilosilveirayoutube
    @murilosilveirayoutube 2 года назад +1

    Ótima aula, entendi demais como funciona a técnica

  • @iurisx
    @iurisx Год назад

    Muito útil. Vi um pouco no mestrado que interrompi. Agora novamente por causa de concurso.

  • @AmorimPeritoJudicial
    @AmorimPeritoJudicial Год назад

    Topíssimo esse conteúdo. Forma muito dinâmica e leve de explicar coisas profundas.

  • @nicolli.albuquerque
    @nicolli.albuquerque 2 года назад +1

    O melhor vídeo sobre o assunto. Parabéns! Ajudou imensamente no meu TCC (: Obrigada!

    •  2 года назад

      Opa! Q massa! Fiquei imensamente feliz aqui!!
      Tamojunto

  • @AndreNechio
    @AndreNechio Год назад

    Muito bom o vídeo, a explicação é bem simples e fácil de entender. Parabéns pelo material!
    Eu fiquei com uma duvida sobre o PCA que é o seguinte: Suponhamos que temos 300 variáveis de entrada, ai uso PCA e transforma em 3, crio um modelo preditivo usando essas 3 e salvo o modelo. Como posso depois do modelo criado pegar um input de 300 variáveis e usar o modelo? Eu teria que realizar um fit novamente no PCA com toda a base? Ou já existe alguma técnica para essa transformação do input de 300 para 3?
    Ficou claro minha duvida?

  • @orafaelgf
    @orafaelgf 2 года назад

    Parabéns pelo video. Ótima didática.
    Senti falta (e pelos comentários tb) de dar sequência na análise. Mostrando quais variaveis ficaram após a redução, explicar o gráfico, prever o modelo, etc… no mais, ótimo. Sucesso ao canal.

    •  2 года назад

      Boa, grande Ráfa! Anotado aqui.....simbóra!

  • @Omundodoarthur
    @Omundodoarthur 2 года назад

    Excelente explicação !! Só uma dica: esse monitor atrás de você tira muita a atenção do que você está falando... deixa ao menos uma imagem estática. Valeu !

  • @joemirgiombelli8219
    @joemirgiombelli8219 2 года назад

    Aula muito boa extremamente didática!!!!

    •  2 года назад

      Tamojunto, Joemir! Simbóra!

  • @laismoro7569
    @laismoro7569 2 года назад

    Aula maravilhosa! Muito Obrigada Prof.

    •  2 года назад

      Valeu, Jedi!!!

  • @diegolandim4259
    @diegolandim4259 2 года назад +3

    Prof. excelente trabalho! Aula nota 10. Só surgiu uma dúvida, como saber quais as variáveis do nosso dataset são então as principais. Ou seja, qual variável nos dá os 92.4% e qual nos dá os 5.3%? Obrigado

    • @renansk8flip
      @renansk8flip Год назад

      Através da análise das cargas fatoriais você vai conseguir interpretar a representatividade de cada fator em relação às variáveis

  • @kimpoletto8308
    @kimpoletto8308 3 года назад +1

    Ótima didática, brother. Parabéns

    •  3 года назад

      Valeu Kim! Tamojunto! Simbóra!

  • @carloshfmaciel
    @carloshfmaciel 3 года назад

    Bem Didático. Obrigado pelo vídeo.
    Poderia ter explicado porque componentes que explicam a variabilidade dos dados, ajudam na inferência ou na predição.
    Fica a sugestão de disponibilizar no comentário do vídeo, o notebook da aula.
    Abs!

    •  3 года назад +1

      Boa Carlos! Valeu por falar comigo cara!

  • @nilbezerra1303
    @nilbezerra1303 2 года назад

    Ficou fantástica a aula! Aprendi muito mais do que na faculdade.

  • @mariaeduardasantos2198
    @mariaeduardasantos2198 Год назад

    Que aula! Obrigada por compartilhar seus conhecimentos conosco

    •  Год назад

      Nó!!! valeu Cecília!!!

  • @douglasmoraes3886
    @douglasmoraes3886 2 года назад

    Ótima didática. Parabéns!

    •  2 года назад

      Obrigado 😃

  • @phsaraiva19
    @phsaraiva19 3 года назад +1

    Obrigado pelo vídeo. Deu pra entender como faz e como funciona, mas não deu pra entender qual é a utilidade prática. O que eu faço com esses 2 componentes que eu achei? Como uso a informação pra gerar algo útil? Não deu pra entender de que forma eu saio dos componentes principais para identificar as variáveis mais relevantes para explicar a variabilidade dos dados.

    •  3 года назад +1

      Boa Paulo, vamos lá garoto!
      1) utilidade prática:
      Imagine que vc tenha 1000 variáveis para construir uma Máquina Preditiva. Olha que não é exagero, pois já vi isso com meus próprios olhos....
      Cara, é trabalho demais para fazer tudo, desde documentação até o processamento completo desses dados.
      Diante disso, uma das saídas que vc pode tentar é exatamente usar o PCA para reduzir a quantidade de variáveis, transformando-as em Componentes Principais por meio do PCA. Das 1000, vc reduz para 10......
      2) identificar as variáveis mais relevantes :
      Para identificar as variáveis relevantes vc precisará de uma profundidade maior na Álgebra. Digo isso porque vc vai identificar isso exatamente por meio de umas paradas chamadas AUTOVETORES E AUTOVALORES.....A análise desses caras vai permitir vc fazer essa decomposição, identificando inclusive quais variáveis estão em cada componente e o % de relevância de cada uma....
      De boa cara? Deu p entender? Se por acaso quiser mais profundidade ainda, mande email para suporte@cienciadosdados.com que vou responder , ok?
      Valeu!

  • @alisco
    @alisco 3 года назад +1

    Muito boa aula professor, explica bem demais!

    •  3 года назад

      Nóoooossa! Q massa, Line! Obrigado! Espero contribuir mais e mais...Simbóra!

  • @diegocosta2383
    @diegocosta2383 2 года назад

    Aula excelente.

  • @MrFabioGomez
    @MrFabioGomez 2 года назад

    Boa noite, boa didática, acho que consegui entender o que é PCA, mas não consigo aplicar. Se fizesse uso de um dataframe completo e executando todas as etapas, acho que ficaria mais claro a usabilidade. Parabéns pelo canal.

    •  2 года назад +1

      Anotadíssimo....

  • @ericgomes5568
    @ericgomes5568 Год назад

    Entendi como construir o pça e sua teoria, agora como eu aplico esse pça numa regressão, por exemplo?

  • @AFBRT
    @AFBRT Год назад

    Opa Eduardo, tudo bom? Mto massa a aula... mas fiquei com uma dúvida.... faz sentido a gente saber qual(is) são essas dimensões? Por exemplo nos dadaset da IRIS, qual "coluna" ou qual dado foi o menos relevante?

  • @laventury
    @laventury Год назад

    Excelente explicação

    •  Год назад

      Cara valeu mesmo! Fico muito feliz em contribuir. TMJ

  • @carolvieira151
    @carolvieira151 3 года назад +1

    Obrigada pelo video! Bem explicadinho! Acho que agora entendi! :)

    •  3 года назад

      Que massa, Carol! Tamojunto

  • @fabianel.2892
    @fabianel.2892 Год назад

    Caraca... mto bom! Já estou inscrita.

    •  Год назад

      Que top. Fico muito feliz em poder contribuir com o meu conhecimento. TMJ

  • @icaroquintao1718
    @icaroquintao1718 2 года назад

    Excelente conteúdo! Parabéns!

  •  Год назад

    Isso é só o começo. Você já viu a Aula 3 do Treinamento Gratuito "A Era do Cientista de Dados"? Elas ficam no ar somente até DOMINGO. São 3 aulas sequenciais e imperdíveis. Vou te ensinar como ganhar acima de 8000 como Cientista de Dados e a criar um CHATBOT IA. Não perde....
    cientistadedadosnapratica.com.br/inscrever-org-ig-bio
    Simbóra

  • @emersongaldino7366
    @emersongaldino7366 3 года назад +1

    Obrigado pela aula, esclareceu mtas coisas na minha cabeça... só fiquei com uma dúvida... vc mostrou o percentual dos fatores, mas como eu saberia as variáveis que fazem parte dos componentes principais pra depois usa-los em uma clusterização ?
    Obrigado mais uma vez.

    •  3 года назад +2

      Uáu Emerson, que massa cara! Tô vendo q tu é JEDI!!! Excelente pergunta.....Vamos lá:
      Vc precisa sacar antes uma parada chamada "Eigenvalue" ( Isso é Algebra Linear...) ....O Eigenvalue da variável dentro do componente representa a relevância da variável....
      É meio chato, mas como tú é JEDI, vale a pena dar uma verificada......De boa?
      Vou te deixar uma fonte massa aqui p vc entender melhor, mais profundamente:
      machinelearningmastery.com/introduction-to-eigendecomposition-eigenvalues-and-eigenvectors/
      Valeu!!! Obrigado por compartilhar....

    • @emersongaldino7366
      @emersongaldino7366 3 года назад +1

      @ Maravilha!!! Muito obrigado pelo apoio... continue com o ótimo trabalho... Forte abraço!!

    •  3 года назад

      Tamojunto

  • @rodrigoschammass5205
    @rodrigoschammass5205 2 года назад

    muito top. PCA pode ser usando em qual tipo de problema? Regressão e Classificação? Ou é mais usado em Aprendizado não supervisionado?

    • @renansk8flip
      @renansk8flip Год назад

      Em ambos, lembrando que ao contrário de um cluster que resulta em uma variável qualitativa,o pca resulta e valores quanti que podem ser usados em qualquer modelo que aceite esse tipo de valor

  • @Mrjacksurvival
    @Mrjacksurvival 2 года назад

    Como que usa essas informações pra fazer uma regressão? por exemplo se eu tenho 4 variaveis como você, y, x1, x2, x3? já vi exemplos de aprendizagem de máquina q era uma relação multiparamétrica e usavam PCA pra achar os parâmetros da equação y= a*x1 + b*x2 + c*x3 + d.

  • @carolzillaa
    @carolzillaa 3 года назад

    Muito bom, didática sensacional

    •  3 года назад +1

      Vaaaaleu, Carol! Tamojunto! Simbóra!

  • @danieljborges
    @danieljborges Год назад

    Pode chamar essas variáveis de colunas em uma tabela?

  • @adalbertooliveira8395
    @adalbertooliveira8395 5 месяцев назад

    Em 30 minutos aprendi o que não consegui em 4 horas!

  • @williandiegodoamaral9593
    @williandiegodoamaral9593 3 года назад

    Parabéns pela aula Eduardo.
    Muito boa a aula.
    Apenas uma dúvida: como eu verifico as variáveis / atributos que compõem cada Componente?
    Muito obrigado.

  • @marianaferreira597
    @marianaferreira597 3 года назад

    Sugiro fazer um vídeo complementar mostrando com o gráfico é interpretado.

    •  3 года назад

      OK, Mari! Anotado aqui.....

  • @dersonsantana
    @dersonsantana 7 месяцев назад

    Muito Bom

  • @Mrjacksurvival
    @Mrjacksurvival 2 года назад

    A primeira componente explica X%. Isso significa que as variáveis com maior carga nessa componente são as mais importantes na relação?
    ex.: 4 variaveis, a PCI (70%) é dominada por duas variaveis e a PCII (25%), por uma variavel. Juntas explicam 95% da variância. A quarta variável domina o PCIII, mas só explica 5%.

    •  2 года назад

      Isso mesmo garoto! Tamojunto

  • @alexandremartins8979
    @alexandremartins8979 2 года назад

    Ótimo vídeo. Seria possível fazer um sobre GLRM?

    •  2 года назад

      Anotado, grande Alê!! Simbóra!

  • @fernandovieira306
    @fernandovieira306 3 года назад

    Muito boa a a explicação, mas fiquei em dúvida ainda na interpretação desses valores. Por exemplo, num modelo de regressão linear, qual dos pca (1 ou 2) seria x ou y? Como eu faço pra escolher qual é qual?

    • @marianaferreira597
      @marianaferreira597 3 года назад +1

      Fernando, o PC entra como variável X porque você vai usar essa "nova variável" para avaliar o efeito na sua variável de interesse, o Y. A aula foi excelente, mas faltou explicar a como interpretamos o gráfico, daí sua dúvida.

    •  3 года назад

      Boa Mari! JEDI vc! Vou trazer mais detalhes.....SImbóra!

  • @tutubaPE
    @tutubaPE Год назад

    kd o link para testar esse codigo?

  • @barbarapaulaborges3755
    @barbarapaulaborges3755 2 года назад

    Parabéns pela aula! Estou tentando utilizar PCA nos meus dados e ao igualar as variáveis o valor das médias fica próximo de zero (1,5173E-16; 1,44329E-16; 5,73615E-17) e o desvio padrão 1. A análise pode ser feita assim ou só estaria correto se a média for zero? Utilizei a fórmula z = escore bruto - média/ desvio padrão.

    •  2 года назад

      Báh, beleza? Me explica melhor via email, beleza? suporte@cienciadosdados.com

  • @maronydf
    @maronydf 2 года назад

    Ótima aula! Mas, eu preciso saber como eu uso PCA para construir um índice de desempenho?

    •  2 года назад +1

      Q massa , Maria! Beleza com vc? Depende muito do tipo de índice que vc precisa construir beleza? Se for bem Raiz mesmo, de forma bem simplória, pode usar os próprios Componentes Principais, criados na análise, como indicador. É claro que para quem está de fora, vc precisaria explicar a participação das variáveis em cada componente....Consegui ajudar de alguma forma, Maria? Me responde aqui, blz?

    • @maronydf
      @maronydf 2 года назад

      Obrigada. Sim, conseguiu esclarecer. Mas, ainda assim eu queria fazer um índice, baseado nas componentes principais que juntas explicassem até 90 % dos dados. Com isso, eu conseguiria estabelecer uma variável explicativa consistente para aplicar num modelo de painel de dados

    •  2 года назад

      Vai conseguir sim. O fato é que, na grande maioria dos casos, esses 90% vão ficar no mesmo "componente"....Daí , seria legal você calibrar a quantidade para ver se atende o propósito, ok? Valeu!!

  • @elidasilva9668
    @elidasilva9668 3 года назад

    ótimo video, tenho uma pergunta. Se eu quero trabalha com dois tipos de unidade de medida, como por exemplo: mm e g. Eu tenho que fazer duas analises de PCA?

    •  3 года назад

      Não Élida! O PCA é exatamente para vc compilar em Componentes Principais as variáveis diferentes também....Beijão!

  • @khayansm
    @khayansm 2 года назад

    Qual a ferramenta que você usa pra escrever na tela ?

    •  2 года назад

      Esse aí ó:
      www.softpedia.com/get/Multimedia/Graphic/Graphic-Others/gInk.shtml

  • @rogeriolustosa6370
    @rogeriolustosa6370 3 года назад

    qual a dificuldade de os professores ensinar assim? kkk
    muito boa a didática!

    •  3 года назад

      Boa Rogerio!!! É só o começo......vamos transformar essa parada aí.....

  • @beatrizdelourdesdeoliveira196
    @beatrizdelourdesdeoliveira196 3 года назад

    Parabéns Eduardo mas pega leve na cafeína... eu dusse "cafeína" 👀

    •  3 года назад

      kkkkkkk essa Bia!! Simbóra menina....

  • @andressasousa7098
    @andressasousa7098 2 года назад

    muito bom, parabens