Bom dia, Fernanda. Você tem um dom muito especial. Sou Estatístico e foram poucas as vezes que vi esse conteúdo explicado com tanto amor. Pode dar continuidade a esse trabalho que o sucesso é garantido. Parabéns!
Boa tarde Fernanda! Tuas explicações são maravilhosas! Em um tempo ótimo e com retomadas e lembretes perfeitos para quem ainda não domina as análises estatísticas e nem os programas. Tu tens me acompanhado em todo o doutorado e me salvado muitas vezes. Nunca pare com teus conteúdos! Obrigada e ótimo trabalho!
Achei sensacional seu canal! Conheci hoje, pesquisando sobre algumas funções do R (Comecei a aprender agora), e sua explicação está sendo muito rica. Passei o link do canal para todos do meu grupo de estudo na pós :) Parabéns pelos vídeos e pela didática!!
Parabéns pelo excelente trabalho, bem como pela objetividade e clareza da contextualização. Também parabenizo-a pela nobreza de compartilhar seus conhecimentos. Obrigado!
Nosssssaaa!!! Sensacional!!! Muito bom mesmo. Com a forma de representar os dados (gráficos), fica muito melhor explicar os testes. Parabéns pelo vídeo (aula) :)
Muito obrigada. Está-me ajudando muito. A sua didática é fabulosa. Poderia ensinar os passos para a criação de normas ou mesmo a construção estatística de testes e escalas de avaliação (psicológica). Seria ótimo!
Mto bom! No meu R a base de dados não tava carregando por conta dos acentos. Caso aconteça com alguém aqui tb, fica a dica pra tirar os acentos da base de dados!
Como funciona essa questão de tamanho de efeito? Vc teria alguma referência bibliográfica para que eu possa entender melhor esses casos em que o p-valor está 'fora' da faixa mas o coeficiente é alto ?
A referência para a interpretação do coeficiente de correlação está na descrição do vídeo. Eu também tenho uma playlist sobre valor de p, o terceiro vídeo dela discute o porquê o p não representa a magnitude do efeito.
Olá professora, boa noite ! Obrigada pelos vídeos ! Gostaria de verificar a correlação de Spearman entre 2 parâmetros (vazão e fósforo), só que são para 3 pontos de coleta. Seria mais indicado eu fazer o teste separado para os valores de cada um dos pontos ou posso colocar todos os valores (dos 3 pontos) que tenho , para cada variável e fazer o teste 1 vez ?
Oi, Jussara, depende. Se esses pontos forem considerados medidas repetidas, eu faria a correlação separadamente para cada um - ou usaria um modelo como o GEE que permite esse delineamento com medidas repetidas nos previsores.
Como sempre excelente aula Fernanda. Parabéns !!! Eu vejo muita gente questionar que ao invés de fazer um teste de correlação, já querem fazer direto uma regressão linear. Eu exergo assim Fernanda, me corrija se eu estiver errado por favor: Acredito que devemos fazer a correlação linear para nos dar uma ideia e preparar o terreno para fazer a regressão linear, pois se eu tenho 15 variáveis e apenas 9 apresentara um coeficiente de correlação estatisticamente significativo, então devo incluir na minha regressão apenas estes. Aguardo seu valoroso comentário.
Oi, Elias. Não necessariamente devemos incluir apenas os que são estatisticamente significativos. Porque quando uma variável é adicionada à regressão, o efeito das outras fica controlado por ela. Então, faz sentido manter algumas variáveis não significativas. E tudo bem partir direto para a regressão. O que não pode é ignorar a checagem de multicolinearidade. E também é importante entender que elas estão fazendo a mesma coisa. Se a correlação foi baixa, uma regressão simples com aquelas duas variáveis vai ter um coeficiente baixo. O R quadrado nada mais é que o r da correlação de Pearson elevado ao quadrado.
Professora, curti muito o conteúdo e gostaria de entender se não existe um pressuposto para a aplicação do teste de spearman sobre repetição de valor. Queria também entender o que acontece ao ignorarmos um pressuposto. O teste/modelo perde a validade ou passar a ser menos confiável? Desde já, obrigado!
Muito legal o conteúdo professora, já virei fã. Queria só entender como uso os dados do dropbox, pois eles estão separado de forma errônea nas colunas.
Bom dia Fernanda, tudo bem? Podemos usar correlação de Pearson quando temos medidas repetidas para um mesmo indivíduo? Por exemplo, uma correlação entre temperatura corporal e temperatura ambiente, nesse caso a temperatura corporal dos indivíduos foi medidas várias vezes ao longo do tempo. Obrigada pela aula
Excelente aula! Professora, ao fazer uma matriz para posterior regressão, o que eu devo considerar e quando eu devo excluir variáveis altamente correlacionadas?
Primeiramente PA-RA-BÉNS!!!👏🏾👏🏾 Estou maratonando uma série de vídeos sobre estatística no R. e suas aulas sao maravilhosas. Muito completas, didática ótima, explica teoria e sobre o R. Tenho um problema. Quando rodo a função tanto para o pearson quanto para sperman da erro no código. Erro in match.arg(alternative): arg deve ser NULL ou um vetor caractere. Meus dados são parâmetros físico-químico da água em 4 locais de coleta em 2 períodos de coleta distintos. Como proceder? Pode me ajudar? Preciso ver quais dessas variáveis tem uma significância para esses locais. Deveria fazer outra análise?
Oi, Vitória, obrigada! Com essa informações, não tenho como ter certeza se esse é o teste adequado a você. Recomendo que você assista a uma live que eu fiz no canal das R Ladies (chama como escolher o teste estatístico adequado), que talvez te ajude a entender o melhor teste pra você. Com relação ao erro, também não tenho informações suficientes para ter certeza do que se trata. Mas tente nomear os argumentos da função, como sugerem nesse tópico: stackoverflow.com/questions/22145089/arg-must-be-null-or-a-character-vector
Boa tarde professora! Quando spearman e kendall retratam p-value > 0,05 tem alguma observação a ser feita de forma complementar, nos casos em que o n é pequeno?
Importante sempre reportar o coeficiente de correlação, que é uma medida de tamanho de efeito. Se o n é pequeno, mas a correlação é moderada ou alta, o p pode mesmo ser maior que 0,05.
Fiquei um pouco confusa. Pensei que sendo o p > 0,05 eu desconsideraria o coeficiente e diria que ele é 0 . Correlação estatisticamente igual a 0 ou não significativa estatisticamente (analogia ao passo 24:21 só que considerando p> 0,05). Estaria incorreto ?
@@jussaradossantosferreira5630 A gente nunca desconsidera o valor do coeficiente de correlação. Se o p é maior que 0,05, indica apenas que não temos evidências para afirmar que o coeficiente é estatisticamente diferente de zero. Então, claro, você vai reportar o p. Mas vai reportar também o valor do coeficiente, que pode ser alto. Essa não significância estatística pode vir de um n pequeno.
@@FernandaPeres muitooo obrigada!! Você comentou ao final do vídeo que no insta tem conteúdo mais teórico, vou correr pra lá te seguir também. Excelente aula, didática e atenção!
Parabéns pelo vídeo! Uma perguntinha: eu consigo gerar uma tabela única com t e p-value da correlação, sem precisar fazer um por um? Exemplo, eu tenho um dataframe de 13 colunas e 8 linhas e queria saber como retirar essas informações, já que eu vou testar cada variável
@@FernandaPeres Vlw demais! Dei uma olhada lá numas perguntas, achei um "corr.test" que me deu uma lista com vários itens, e to batendo cabeça para extrair e transformar em dataframe só o que eu quero que são os t e o p-value de cada correlação
Olá, ótimo vídeo, parabéns 👏👏, somente uma pergunta, quando a variável depende é uma variável dicotómica, pode-se fazer teste de correlação? Se sim, qual o mais adequado?
Oi Fernanda, mais uma vez muito obrigado mesmo por todo o conhecimento comaprtilhado. Queria saber se vc poderia me ajudar (vc é a minha esperança). Tem função chamada "network_plot" do pacote "corrr", esta função cria uma network das correlações, como no exemplo abaixo. Mas, quando são muitas variaveis (>30), acontecem problemas que resultam em um gráfico muito poluido, já tentei (sem sucesso) solucionar esta situação com três ações : a) melhroar o espaçamento do nodulos. b) reduzir a largura das linhas ou arcos. Assim peço se vc poderia me ajudar a mudar as solucionar os três problemas citado a continuação: 1) Os nodulos (agrupamentos) formados, ficam muito proximos ums dos outros e 2) As linhas ou arcos formados são muito grosos (este último é independente do número de variavies) 3) Também não consegue mudar para itálico as letras do gráfico NOTA: Outra opção pdoeria ser criar o network das correlações diretamente com o ggplot2 desde a matriz de dados Exemplo: x
Ola, gostaria de saber caso eu queira usar outras colunas de variavéis diferentes la na criação da matriz, como eu coloco? ex vc usou essa [2:4] e eu quero usar a minha coluna 2 e 13
Excelente explicação! Fernanda, para realizarmos a análise não correlacionando tudo contra tudo, mas apenas as informações de dois conjuntos de dados, seria diferente? Por exemplo, gostaria de correlacionar parâmetros do solo (pH, N, S, etc), com dados de abundância de genes, mas só encontro modelos que implicariam na correlação de tudo contra tudo (genes com genes, parâmetros com parâmetros, parâmetros e genes), sendo que só necessito dos resultados que correlacionam parâmetros com genes. Desculpe te incomodar por aqui, mas realmente não encontrei nada. Abraços e obrigada pelos vídeos!!!
Eu não tô conseguindo imaginar uma fórmula que fizesse várias correlações, mas não fizesse as que você não quer. Uma opção é ir fazendo as correlações das variáveis de interesse uma a uma... Por exemplo: cor(dados$vargene, dados$varsolo) Mas, eu não vejo problema em você rodar tudo e analisar apenas as que te interessam (deixa isso definido a priori).
Obrigada, Diego. Então, para essa situação eu não conheço nenhum teste (e acho que não existe mesmo). O Levene não funcionaria porque ele compara grupos, eu teria que ter uma variável categórica. Como são duas contínuas, temos mesmo que olhar para a distribuição dos pontos no espaço...
Não tenho vídeo específico, mas é uma escala ordinal, né? Então, por exemplo, esse é um conteúdo que pode ser aplicado a escala Likert, só usar os testes não paramétricos.
@Fernanda Peres existe algum modo de analisar a correlação entre variáveis não numéricas? Pois, durante a execução, o R informa que o valor precisar ser numérico. No caso se o p-valor for maior que 0.05 significa que a correlação é fraca? Mil vezes obrigado!
Oi! Então, a correlação só pode ser usada para variáveis numéricas ou ordinais (e no caso das ordinais, só podemos usar correlações não paramétricas). Para variáveis categóricas nominais, a gente faz testes de associação (como o qui-quadrado). O valor de p ser maior que 0,05 significa que a correlação é nula, não há correlação. Ela não pode ser interpretada. Eu tenho uma série de três posts lá no Instagram só sobre correlações, se interessar, explicando essa parte mais teórica: instagram.com/estatisticaaplicada
Ótimo vídeo, parabéns Uma dúvida: No meu caso o valor de R foi de 0.44 e o valor de p foi superior a 0.5. Como devo interpretar? Seria uma correlação positiva moderada? Ou seria uma correlação não significativa pois o p foi superior a 0.05? Desde já agradeço 🙏🏽
Boa noite fernanda, Como faço para juntar diferentes gráficos de dispersão em uma mesma figura? A função par(mfrow=c()) não funcionou com gráficos de dispersão do ggplot.
Oi Fernanda. Seus vídeos são muuito bons. mas não estou conseguindo fazer correlação multivariada. Vc tem esse material disponível? Estou precisando muito
Oi, nunca fiz correlação multivariada. Pelo jeito até tem pacote no R que faz (CORREP), mas nunca usei. Mas, veja se o seu problema não é respondido com uma regressão múltipla, ou análise de componentes principais ou análise fatorial. São todas técnicas multivariadas, e que dá para achar tutoriais legais na internet...
Bom dia, Fernanda.
Você tem um dom muito especial. Sou Estatístico e foram poucas as vezes que vi esse conteúdo explicado com tanto amor. Pode dar continuidade a esse trabalho que o sucesso é garantido. Parabéns!
DEUSA da estatística, você salvou meu doc! Muuuito obrigado!
Boa tarde Fernanda! Tuas explicações são maravilhosas! Em um tempo ótimo e com retomadas e lembretes perfeitos para quem ainda não domina as análises estatísticas e nem os programas. Tu tens me acompanhado em todo o doutorado e me salvado muitas vezes. Nunca pare com teus conteúdos! Obrigada e ótimo trabalho!
Guria, tu me salva no doutorado! obrigada por existir e compartilhar conhecimento!
Gente, nem toda heroína usa capa. Maravilhosa, melhor aula. Obrigadaaa
Muito boa sua aula!!! Estou aprendendo muito com vc!!!
Finalmente, consegui aprender como e quando fazer uma Correlação e qual fazer, Glória a Deus a Sra professora Fernanda
Tu es a Deusa da estatistica . Adoro as suas aulas
Como sempre os seus vídeos são os melhores e muito detalhados! Parabéns pelo seu trabalho, saiba que você ajuda MUITOS!!!
Achei sensacional seu canal! Conheci hoje, pesquisando sobre algumas funções do R (Comecei a aprender agora), e sua explicação está sendo muito rica. Passei o link do canal para todos do meu grupo de estudo na pós :)
Parabéns pelos vídeos e pela didática!!
Ahh, que comentário maravilhoso de ler! Muito obrigada, fez meu dia :)
Parabéns pelo excelente trabalho, bem como pela objetividade e clareza da contextualização. Também parabenizo-a pela nobreza de compartilhar seus conhecimentos. Obrigado!
Vídeo Perfeito! Só no aguardo da Correlação Cruzada agora.
Como eu amo uma pessoa que possui didática. Muito bom e me ajudou bastante!!!
Fernanda, tuas explicações são ótimas ajudou bastante na minha manografia.
Muito legal!!! Adorei e me ajudou na minha pesquisa!!!
Muito obrigado por mais um vídeo sobre como trabalhar no R! E correlação é um teste super útil!
Não tenho palavras para agradecer! Excepcional o seu canal Fernanda
Nosssssaaa!!! Sensacional!!! Muito bom mesmo. Com a forma de representar os dados (gráficos), fica muito melhor explicar os testes. Parabéns pelo vídeo (aula) :)
Obrigada, Alex!! :)
Seu canal é maravilhoso! Tenho aprendido muito com suas aulas. Clara, didática e objetiva. Parabéns! +1 inscrito.
EXCELENTE!!! Parabéns pelos vídeos e compartilhamento de seus conhecimentos, continue assim...
Muito obrigada pelas explicações, você está salvando minha dissertação rs
Olá Fernanda! O que dizer de seus vídeos em? São maravilhosos! Você é excelente! Obrigado por compartilhar seus conhecimentos de forma tão generosa!
Fernanda Peres, Muto boa esta demonstração no R. Parabens. Voce me ajudo bastante. Sou muito Grata
Conteúdo de primeira! Muito obrigado :-).
Ótima aula, muito obeigado!!
Muito obrigada. Está-me ajudando muito. A sua didática é fabulosa. Poderia ensinar os passos para a criação de normas ou mesmo a construção estatística de testes e escalas de avaliação (psicológica). Seria ótimo!
Oi, Maria, não é um assunto que eu domine. Recomendo o conteúdo do Bruno, do Psicometria Online.
Obrigada Fernanda.
excelente, mais uma vez!!!
Parabéns pela aula. Muito didática.
Excelente aula, obrigada por compartilhar o conhecimento!!!
Muito bom. Obrigado pelo aula!!!
Parabéns pelo conteúdo!!! Sempre muito claro e objetivo.
Você explica muito bem, parabéns!
Inscrita nesse canal abençoado! Obrigada! Continua com mais vídeos!!
Fernanda, muito obrigada pelo conteúdo. Muito útil.
Parabéns!! Vc é muito competente. BEIJOS
Muito obrigado, seu vídeos são ótimos!!!!
Adorei! Muito didático!
Muito bom!!!!
Parabéns pela iniciativa!!!
Como sempre, ótima explicação.
Muito boa aula. Obrigada!
Mto bom! No meu R a base de dados não tava carregando por conta dos acentos. Caso aconteça com alguém aqui tb, fica a dica pra tirar os acentos da base de dados!
Oi, Eduarda, eu tenho um vídeo mais recente no canal explicando exatamente como lidar com acentos no R ;)
Obrigadaaaaaaaaa gatona
Como funciona essa questão de tamanho de efeito? Vc teria alguma referência bibliográfica para que eu possa entender melhor esses casos em que o p-valor está 'fora' da faixa mas o coeficiente é alto ?
A referência para a interpretação do coeficiente de correlação está na descrição do vídeo. Eu também tenho uma playlist sobre valor de p, o terceiro vídeo dela discute o porquê o p não representa a magnitude do efeito.
Olá professora, boa noite ! Obrigada pelos vídeos ! Gostaria de verificar a correlação de Spearman entre 2 parâmetros (vazão e fósforo), só que são para 3 pontos de coleta. Seria mais indicado eu fazer o teste separado para os valores de cada um dos pontos ou posso colocar todos os valores (dos 3 pontos) que tenho , para cada variável e fazer o teste 1 vez ?
Oi, Jussara, depende. Se esses pontos forem considerados medidas repetidas, eu faria a correlação separadamente para cada um - ou usaria um modelo como o GEE que permite esse delineamento com medidas repetidas nos previsores.
Como sempre excelente aula Fernanda. Parabéns !!!
Eu vejo muita gente questionar que ao invés de fazer um teste de correlação, já querem fazer direto uma regressão linear.
Eu exergo assim Fernanda, me corrija se eu estiver errado por favor: Acredito que devemos fazer a correlação linear para nos dar uma ideia e preparar o terreno para fazer a regressão linear, pois se eu tenho 15 variáveis e apenas 9 apresentara um coeficiente de correlação estatisticamente significativo, então devo incluir na minha regressão apenas estes. Aguardo seu valoroso comentário.
Oi, Elias. Não necessariamente devemos incluir apenas os que são estatisticamente significativos. Porque quando uma variável é adicionada à regressão, o efeito das outras fica controlado por ela. Então, faz sentido manter algumas variáveis não significativas.
E tudo bem partir direto para a regressão. O que não pode é ignorar a checagem de multicolinearidade.
E também é importante entender que elas estão fazendo a mesma coisa. Se a correlação foi baixa, uma regressão simples com aquelas duas variáveis vai ter um coeficiente baixo. O R quadrado nada mais é que o r da correlação de Pearson elevado ao quadrado.
Professora, curti muito o conteúdo e gostaria de entender se não existe um pressuposto para a aplicação do teste de spearman sobre repetição de valor.
Queria também entender o que acontece ao ignorarmos um pressuposto. O teste/modelo perde a validade ou passar a ser menos confiável?
Desde já, obrigado!
Muito legal o conteúdo professora, já virei fã.
Queria só entender como uso os dados do dropbox, pois eles estão separado de forma errônea nas colunas.
Não estão separados erroneamente, não. É só baixar e ler no R como csv que ele vai ler da forma como o meu leu (é exatamente o mesmo banco de dados).
Bom dia Fernanda, tudo bem? Podemos usar correlação de Pearson quando temos medidas repetidas para um mesmo indivíduo? Por exemplo, uma correlação entre temperatura corporal e temperatura ambiente, nesse caso a temperatura corporal dos indivíduos foi medidas várias vezes ao longo do tempo. Obrigada pela aula
Excelente aula! Professora, ao fazer uma matriz para posterior regressão, o que eu devo considerar e quando eu devo excluir variáveis altamente correlacionadas?
Eu explico isso na aula de regressão :)
Excelente, como sempre. Existe algum modo de calcular o IC 95% para o Spearman? No Pearson aparece automaticamente, mas no Spearman não
Olá Fernanda!
Ótimas explicações.
Como faço para adicionar a reta que aponta o sentido da correlação no ggplot (no gráfico de dispersão)?
Eu ensino a colocar a reta no vídeo de regressão linear simples :)
@@FernandaPeres muito obrigado!!!!!!
Primeiramente PA-RA-BÉNS!!!👏🏾👏🏾
Estou maratonando uma série de vídeos sobre estatística no R. e suas aulas sao maravilhosas. Muito completas, didática ótima, explica teoria e sobre o R.
Tenho um problema. Quando rodo a função tanto para o pearson quanto para sperman da erro no código. Erro in match.arg(alternative): arg deve ser NULL ou um vetor caractere.
Meus dados são parâmetros físico-químico da água em 4 locais de coleta em 2 períodos de coleta distintos. Como proceder? Pode me ajudar? Preciso ver quais dessas variáveis tem uma significância para esses locais. Deveria fazer outra análise?
Oi, Vitória, obrigada!
Com essa informações, não tenho como ter certeza se esse é o teste adequado a você. Recomendo que você assista a uma live que eu fiz no canal das R Ladies (chama como escolher o teste estatístico adequado), que talvez te ajude a entender o melhor teste pra você.
Com relação ao erro, também não tenho informações suficientes para ter certeza do que se trata. Mas tente nomear os argumentos da função, como sugerem nesse tópico: stackoverflow.com/questions/22145089/arg-must-be-null-or-a-character-vector
@@FernandaPeres obrigada pelo retorno. Vou tentar suas sugestões.
Fernanda, adorei a sua explicação, por acaso vc tem video explicando a correlação no R?
Procurei, mas não achei
Esse é o vídeo explicando a correlação no R, rs. De regressão ainda não tenho, mas deve sair logo.
@@FernandaPeres Me enganei, era de regressão linear mesmo que eu queria saber. Já deu pra perceber que você é boa de dedução, obrigado
Posso logaritimizar esses dados para fazer o gráfico e a análise pelo método de pearson ?
Boa tarde professora! Quando spearman e kendall retratam p-value > 0,05 tem alguma observação a ser feita de forma complementar, nos casos em que o n é pequeno?
Importante sempre reportar o coeficiente de correlação, que é uma medida de tamanho de efeito. Se o n é pequeno, mas a correlação é moderada ou alta, o p pode mesmo ser maior que 0,05.
Fiquei um pouco confusa. Pensei que sendo o p > 0,05 eu desconsideraria o coeficiente e diria que ele é 0 . Correlação estatisticamente igual a 0 ou não significativa estatisticamente (analogia ao passo 24:21 só que considerando p> 0,05). Estaria incorreto ?
@@jussaradossantosferreira5630 A gente nunca desconsidera o valor do coeficiente de correlação. Se o p é maior que 0,05, indica apenas que não temos evidências para afirmar que o coeficiente é estatisticamente diferente de zero. Então, claro, você vai reportar o p. Mas vai reportar também o valor do coeficiente, que pode ser alto. Essa não significância estatística pode vir de um n pequeno.
@@FernandaPeres muitooo obrigada!! Você comentou ao final do vídeo que no insta tem conteúdo mais teórico, vou correr pra lá te seguir também. Excelente aula, didática e atenção!
@@FernandaPeres Vc poderia indicar uma literatura que detalhe essa parte por gentileza ?
Obrigada
Parabéns pelo vídeo! Uma perguntinha: eu consigo gerar uma tabela única com t e p-value da correlação, sem precisar fazer um por um? Exemplo, eu tenho um dataframe de 13 colunas e 8 linhas e queria saber como retirar essas informações, já que eu vou testar cada variável
Tem como, sim. Dá uma pesquisada no StackOverflow que você encontra códigos para isso.
@@FernandaPeres Vlw demais! Dei uma olhada lá numas perguntas, achei um "corr.test" que me deu uma lista com vários itens, e to batendo cabeça para extrair e transformar em dataframe só o que eu quero que são os t e o p-value de cada correlação
Olá, ótimo vídeo, parabéns 👏👏, somente uma pergunta, quando a variável depende é uma variável dicotómica, pode-se fazer teste de correlação? Se sim, qual o mais adequado?
Não, correlação, não. Você pode fazer uma regressão logística.
@@FernandaPeres Certo, muito obrigado pela dica.
Oi Fernanda, mais uma vez muito obrigado mesmo por todo o conhecimento comaprtilhado.
Queria saber se vc poderia me ajudar (vc é a minha esperança). Tem função chamada "network_plot" do pacote "corrr", esta função cria uma network das correlações, como no exemplo abaixo. Mas, quando são muitas variaveis (>30), acontecem problemas que resultam em um gráfico muito poluido, já tentei (sem sucesso) solucionar esta situação com três ações :
a) melhroar o espaçamento do nodulos.
b) reduzir a largura das linhas ou arcos.
Assim peço se vc poderia me ajudar a mudar as solucionar os três problemas citado a continuação:
1) Os nodulos (agrupamentos) formados, ficam muito proximos ums dos outros e
2) As linhas ou arcos formados são muito grosos (este último é independente do número de variavies)
3) Também não consegue mudar para itálico as letras do gráfico
NOTA: Outra opção pdoeria ser criar o network das correlações diretamente com o ggplot2 desde a matriz de dados
Exemplo:
x
Ola, gostaria de saber caso eu queira usar outras colunas de variavéis diferentes la na criação da matriz, como eu coloco? ex vc usou essa [2:4] e eu quero usar a minha coluna 2 e 13
Viva por 1000 anos, por favor!
Excelente explicação! Fernanda, para realizarmos a análise não correlacionando tudo contra tudo, mas apenas as informações de dois conjuntos de dados, seria diferente? Por exemplo, gostaria de correlacionar parâmetros do solo (pH, N, S, etc), com dados de abundância de genes, mas só encontro modelos que implicariam na correlação de tudo contra tudo (genes com genes, parâmetros com parâmetros, parâmetros e genes), sendo que só necessito dos resultados que correlacionam parâmetros com genes. Desculpe te incomodar por aqui, mas realmente não encontrei nada. Abraços e obrigada pelos vídeos!!!
Eu não tô conseguindo imaginar uma fórmula que fizesse várias correlações, mas não fizesse as que você não quer.
Uma opção é ir fazendo as correlações das variáveis de interesse uma a uma...
Por exemplo:
cor(dados$vargene, dados$varsolo)
Mas, eu não vejo problema em você rodar tudo e analisar apenas as que te interessam (deixa isso definido a priori).
@@FernandaPeres muito obrigada pelo retorno! Sim, farei uma dessas opções que vc sugeriu!
35:50 Não entendi esse ,2. Porque o original do ingles é o ponto
Esse vírgula 2 é porque a vírgula é usada no R para separação dos argumentos das funções. Não tem nada a ver com separador de decimal.
Ficou ótimo!!! Parabéns!! Tem algum teste estatístico (como tem p a normalidade) para a parte que vc olha graficamente os resíduos?
Poderia ser o teste de levene?
Obrigada, Diego. Então, para essa situação eu não conheço nenhum teste (e acho que não existe mesmo). O Levene não funcionaria porque ele compara grupos, eu teria que ter uma variável categórica. Como são duas contínuas, temos mesmo que olhar para a distribuição dos pontos no espaço...
@@FernandaPeres Ahhhhhhh...entendi...então o Levene serve para qndo estamos fazendo o teste de anova...verdade...Muito obrigado!!
Legal, gostei! 👍👍. Profa. tem algum vídeo falando sobre análise de dados com escala likert (1 a 5 ou 1 a 10)?
Não tenho vídeo específico, mas é uma escala ordinal, né? Então, por exemplo, esse é um conteúdo que pode ser aplicado a escala Likert, só usar os testes não paramétricos.
Fernanda, o que eu faço quando eu tenho alguns dados faltantes ("NA") no meu dataframe? A análise não roda com eles.
Tenta incluir "na.rm=TRUE", dentro da função cor. Dessa forma os sujeitos experimentais com valores ausentes serão excluídos da análise.
@Fernanda Peres existe algum modo de analisar a correlação entre variáveis não numéricas? Pois, durante a execução, o R informa que o valor precisar ser numérico. No caso se o p-valor for maior que 0.05 significa que a correlação é fraca? Mil vezes obrigado!
Oi! Então, a correlação só pode ser usada para variáveis numéricas ou ordinais (e no caso das ordinais, só podemos usar correlações não paramétricas). Para variáveis categóricas nominais, a gente faz testes de associação (como o qui-quadrado). O valor de p ser maior que 0,05 significa que a correlação é nula, não há correlação. Ela não pode ser interpretada. Eu tenho uma série de três posts lá no Instagram só sobre correlações, se interessar, explicando essa parte mais teórica: instagram.com/estatisticaaplicada
Professora...estou precisando fazer um estudo sobre esse tema mas tenho que indicar bibliografia. Você tem alguma para indicar?
Tem na descrição do vídeo ;)
Mas você também pode usar o Manual de Análise de Dados (Favero e Belfiore), ou Estatística Básica (Bussab e Moretim)
Ótimo vídeo, parabéns
Uma dúvida: No meu caso o valor de R foi de 0.44 e o valor de p foi superior a 0.5.
Como devo interpretar?
Seria uma correlação positiva moderada?
Ou seria uma correlação não significativa pois o p foi superior a 0.05?
Desde já agradeço
🙏🏽
Não significativa, o p que define isso.
Muito obrigado!!!
🙏🏽
Salvou minha vida, deusa da estatística!
🙏🏽
Não sei se houve alguma modificação no código, mas os gráficos não estão aparecendo lado a lado.
Já descobri aqui ehehehehe era a última linha do código
Boa noite fernanda, Como faço para juntar diferentes gráficos de dispersão em uma mesma figura? A função par(mfrow=c()) não funcionou com gráficos de dispersão do ggplot.
Em ggplot2 essa função não vai funcionar mesmo. Uma opção é usar o pacote patchwork, dá uma pesquisada que tem tutoriais legais em blog ;)
@@FernandaPeres muito obrigado pela atenção, salvou meu dia e esta salvando meu mestrado. Suas aulas tem me ajudado muito, parabénsss ;)
Oi Fernanda. Seus vídeos são muuito bons. mas não estou conseguindo fazer correlação multivariada. Vc tem esse material disponível? Estou precisando muito
Oi, nunca fiz correlação multivariada. Pelo jeito até tem pacote no R que faz (CORREP), mas nunca usei. Mas, veja se o seu problema não é respondido com uma regressão múltipla, ou análise de componentes principais ou análise fatorial. São todas técnicas multivariadas, e que dá para achar tutoriais legais na internet...
Olá professora! Podia fazer uma seção só de gráficos.
Desde já agradeço.
Até tenho essa vontade, mas isso vai demorar um pouco para acontecer. Por enquanto, não entendo o suficiente de ggplot2.
@@FernandaPeres ok! Obrigado pela disposição.