Teste de hipóteses e valor-p: Teoria e simulação com Python

Поделиться
HTML-код
  • Опубликовано: 4 дек 2024

Комментарии •

  • @flesker7693
    @flesker7693 Год назад

    Que aula meus amigos!

  • @rborges111
    @rborges111 4 года назад +4

    Excelente vídeo... em poucos minutos uma quantidade enorme de conceitos bem explicados de maneira super didática. Obrigado professror!!!

  • @FranciscoRodrigues
    @FranciscoRodrigues  2 года назад +10

    Observação importante: quando afirmamos que aceitamos H0, não dizemos que H0 é verdadeira, mas que há evidência para aceitar essa hipótese com um dado nível de significância. Notem que o teste é feito baseando-se apenas na amostra coletada. Se coletarmos outra amostra, talvez o resultado do teste mude. Esta interpretação é importante, pois está ligada a muitos erros em resultados de experimentos científicos. Na verdade, o filósofo Karl Popper analisou essa ideia com o exemplo dos cisnes. Se observamos cisnes brancos ao longo de muitos anos, nunca podemos dizer com certeza que todos os cisnes são brancos. Não podemos generalizar conclusões baseando-se em nossas observações. Assim, se a hipótese nula é “todos os cisnes são brancos”, nunca podemos aceita-la como verdade. Portanto, podemos dizer que ao aceitar H0, falhamos em rejeitar a hipótese nula. Quando dizemos no vídeo “aceitamos H0”, não estamos dizendo que essa hipótese é verdadeira, mas que não há evidências suficientes para rejeitá-la. Quem preferir, pode trocar aceitamos H0 por “falhamos em rejeitar H0”. É uma questão de interpretação. No entanto, decidimos seguir a nomenclatura usada na maioria dos livros de estatística. Uma outra maneira mais precisa é dizer que "deixamos de rejeitar H0", ao invés de dizermos que "aceitamos H0". No entanto, o mais importante é ter em mente que nunca podemos dizer que H0 é verdadeira.

  • @jorgelutif1597
    @jorgelutif1597 3 года назад +2

    Parabéns pelo material e pelas aulas ... Está me ajudando muito ... Revisar aplicações de Estatística no formato EAD em vritude da pandemia está sendo um gigantesco desafio ... Está de Parabéns pelas aulas ...

  • @thaistakeuchi6189
    @thaistakeuchi6189 2 года назад

    Professor, tudo bem?
    Agradeço enormemente a atenção, didática e cuidado que o senhor tem em explicar conceitos abstratos de uma forma tão tangível. Há alguns anos tento entender p-valor e neste vídeo tive a oportunidade de clarear minha mente com sua explicação. Assistir seus vídeos são refrescantes pra mente! Muito obrigada!☺

    • @FranciscoRodrigues
      @FranciscoRodrigues  2 года назад +1

      Obrigado Thais! Fico feliz que esteja aproveitando as aulas.

    • @thaistakeuchi6189
      @thaistakeuchi6189 2 года назад

      @@FranciscoRodrigues Parabéns pelo trabalho! Abs!!

  • @mxaraujo
    @mxaraujo 3 года назад +2

    Estas classes são muito boas.

  • @donizetenunes748
    @donizetenunes748 2 года назад

    Excelente aula

  • @Edgardpfn
    @Edgardpfn 4 года назад +2

    Excelente, Professor!

  • @Fehh99
    @Fehh99 Год назад

    Excelente aula Professor Francisco! Só fiquei com uma questão, quando fazemos uma reamostragem com bootstrap, agora passamos a conhecer o desvio padrão da nossa amostra, então para analisar a amostra podemos utilizar a distribuição normal com o desvio padrão, certo? Minuto do vídeo que gerou a dúvida (33:47). Tem algum video que explica algum exemplo utilizando bootstrap?

  • @maxwellvaz5852
    @maxwellvaz5852 3 года назад

    top

  • @rodrigo-pereira
    @rodrigo-pereira 4 года назад

    Boa tarde professor.
    Estava na dúvida sobre quando usar a distribuição normal ou a de t de Student, mas o diagrama em 33:40 veio a calhar.
    Obrigado.
    Fiquei na dúvida pois no curso de inferência estatística do Coursera entendi que a estatística t é usada quando temos a situação de ou não conhecer σ ou quando queremos confrontar se duas ou mais amostras partem da mesma função geradora.
    Mas me parece que é o caso de não sabermos σ ou quando a amostra é pequena.
    Correto?

    • @FranciscoRodrigues
      @FranciscoRodrigues  4 года назад

      Olá Rodrigo, na verdade depende de dois fatores: se você conhece sigma e do tamanho da amostra. Se a amostra for pequena e sigma desconhecido, você deve usar a distribuição t. Para amostras grandes a distribuição t fica muito próxima da normal. Note que para N>50 nós usamos a distribuição normal.

  • @IdeiaDeJirico
    @IdeiaDeJirico 4 года назад

    Olá professor, tudo bem? Fiquei com uma dúvida no exercício do fabricante de cigarros. Com nível de significância de 5%, eu não deveria ter 2,5% em cada lado da distribuição?
    Um grande abraço, e parabéns pelo trabalho. Com certeza um dos melhores canais de ciência de dados do RUclips.

    • @FranciscoRodrigues
      @FranciscoRodrigues  4 года назад +4

      Obrigado Bruno! Sobre sua dúvida, pode ser feito assim também, mas aí muda o teste. Como consideramos apenas Ha: mu > 20, entao temos que p(Z > z) = 0,05. Se considerássemos diferentes de 20, aí seria 2,5%, pois consideraríamos os dois lados da distribuição. Em resumo, você deve observar se Ha seria >, < ou diferente de mu. Se for diferente, tem que considerar os dois lados da distribuição (alpha/2 em cada lado). Se for > ou

    • @IdeiaDeJirico
      @IdeiaDeJirico 4 года назад +1

      @@FranciscoRodrigues entendido professor, muito obrigado pelo esclarecimento! E mais uma vez parabéns pelo trabalho!

  • @Gaga-vb3qv
    @Gaga-vb3qv 3 года назад

    Bom dia. Ótimo vídeo! Agradeço pela ótima didática. Eu tive uma dúvida: porque no código você usou
    Ns = 1000 e outro de 10000? Também n = 10 e n =20. Não ficou muito claro para mim

    • @FranciscoRodrigues
      @FranciscoRodrigues  3 года назад

      Olá, na verdade essa escolha é arbitrária. Ns é o número de simulações. Quanto maior, melhor é a aproximação. n é o tamanho da amostra e quanto maior, melhor é a estimação também. Você pode baixar os códigos e testar como os resultados variam se você alterar Ns e n.