Estimation d'un paramètre

Поделиться
HTML-код
  • Опубликовано: 7 авг 2024
  • - Liste complète des cours de Statistique et Épidémiologie : formation.epiter.org
    - Exercices, Qcm et Quizz : qcmquizz.free.fr
    - Chapitrage :
    Estimation d'un pourcentage : 4:15
    Estimation d'une moyenne : 14:53
    Interprétation d'un I.C : 21:42
    Risque d'erreur alpha et intervalle de confiance : 25:08
    Précision d'une estimation : 31:36
    Taille d'un échantillon : 32:18
    - Sujets connexes :
    • Paramètres descriptifs...
    • Quartiles
    • Variance
    • Écart type
    • Coefficient de variation
    • Coefficient d'asymétri...
    • Coefficient d'aplatiss...
  • НаукаНаука

Комментарии • 10

  • @jesusjetedonnemavieabameko3257

    merci prof

  • @DidiZahui
    @DidiZahui 3 месяца назад

    bonsoir docteur j'aime bien votre travail, mais moi je comprends pas pourquoi les échantillons on la même taille ce que moi je comprends , je sais que estimateur est une variable aléatoire mais quand on dit la taille de l'échantillon augmente alors variance de l'estimateur diminue la notion de la convergence (précisions ) de l'"estimation. mais dans votre cas vous dites que les échantillons doivent rester constant
    question et comment calculer le sans biais de l'estimateur ?

  • @DidiZahui
    @DidiZahui 3 месяца назад

    je comprends pas le sens augmenter soit c'est le n qui augmente ou c'est le faite de faire plusieurs tirage de même taille c'est ce qu'on appel augmenter ?

  • @medecinemostaganem556
    @medecinemostaganem556 Год назад

    Merci beaucoup Professeur pour cette vidéo. J'ai une question à vous poser: lorsqu'on calcul un seuil de référence (Cut-off) sur la courbe ROC avec SPSS et avec MedCalc et on trouve une grande différence malgré que c'est la même base de données, quelle valeur prendre (de quelle logiciel) ??

  • @medecinemostaganem556
    @medecinemostaganem556 Год назад

    de quel logiciel ?

  • @user-zg3mw6wn2p
    @user-zg3mw6wn2p 8 месяцев назад

    j ai pas bien saisi d ou vient 2.58 au lieu de 2

  • @seanedmond2602
    @seanedmond2602 Год назад

    Bonjour,
    J'ai du mal à comprendre comment la formule permettant à calculer la précision d'un IC peut fonctionner en omettant la taille de la population réelle et comment le facteur p(1-p) peut considérer les cas où la proportion est faible ; en effet :
    - pour p = 0.1 et p = 0.9 , p(1-p) est identique, ce qui suppose que l'on peut se satisfaire d'un échantillon plus petit alors, que la proportion qu'on veut observée est plus faible. Comment déceler une maladie dont l'incidence est 1/100 000 en Haute-Savoie si on se contente de n=627 ? de fait, on aura aucun cas dans l'échantillon.
    - enfin, quid de la population réelle, si le nb d'enfant en Haute-Savoie est de 627, notre échantillon est "parfait", en revanche, si la population réelle est de 1 million, il me semble plutôt faible, malgré la maximisation de la formule à p(1-p)=0.25 ?

    • @ThierryAncelle
      @ThierryAncelle  Год назад

      Bonjour. Le nombre de 627 correspondait à la taille d'un échantillon nécessaire pour obtenir une précision de 3% alors que la proportion escomptée dans la population était de 17% . Le rapport entre précision et proportion escomptée est donc ici de 3/17 . Dans l'exemple que vous prenez, si la proportion escomptée est de 0,00001, exiger une précision de 3% n'a pas de sens. il faudrait exiger une précision de environ 0,000002. Ce qui entraine une taille d'échantillon de plus de 10 millions!! En fait il serait totalement déraisonnable de vouloir estimer une incidence aussi faible par un sondage aléatoire. Lorsque les incidences sont faibles, il faut mettre en place un système de surveillance pour connaître la fréquence d'une maladie, soit par déclaration obligatoire, soit par des recueils exhaustif de cas sur des registres. Dans votre exemple, on aurait environ 10 cas déclarés . Cordialement. T. Ancelle
      statepid.monsite-orange.fr/

    • @seanedmond2602
      @seanedmond2602 Год назад

      @@ThierryAncelle Bonjour, Merci pour votre réponse.
      Je comprends que pour les incidences très faibles, la méthode d'échantillonnage ne fonctionne pas.
      La condition " n.pinf >=5 " est-elle la condition qui me permet de savoir dans quels cas je ne peux plus appliquer la formule pour trouver n et me fier à mon échantillon ?
      En effet, je ne comprends pas comment on peut omettre la taille N de la population réelle. le rapport n/N doit être de

    • @ThierryAncelle
      @ThierryAncelle  Год назад

      @@seanedmond2602
      Je crains que nous mélangions dans cette discussion deux concepts : la taille relative de l’échantillon par rapport à celle de la population et d’autre part la proportion attendue , sachant qu’il en existe un troisième, et de loin le plus important qui est la précision exigée.
      1) La condition n.pinf>5 est due à l’utilisation de la formule qui est basée sur la loi normale. Comme toujours avec cette loi, elle fournit une estimation acceptable si les effectifs sont « assez » grands ». C’est-à-dire si n ou pinf et 1-psup ne sont pas trop faibles. Si la condition n’est pas remplie, on doit alors utiliser la loi binomiale pour calculer les bornes précises de l’intervalle de confiance.
      2) La condition n/N supérieure à 10% n’est qu’une façon rigide de dire que la taille de l’échantillon doit être négligeable par rapport à la taille de la population. C’est le cas dans la plupart des enquêtes. Mais lorsque la taille de la population est petite relativement à l’échantillon, alors la loi normale donne un résultat biaisé, plus élevé qu'il ne devrait être. On utilise alors la loi hypergéométrique avec le facteur d’exhaustivité (N-n)/(N-1) pour calculer l’intervalle de confiance. La formule présentée dans le site « surveymonkey » que vous signalez tient compte de ce correctif. Mais vous remarquerez que si la taille N de la population est grande, le dénominateur de cette formule tend vers 1, et donc la formule approchée s’applique. C’est la raison pour laquelle vous ne voyez pas ce terme dans la formule que je vous ai présentée.
      3) Il faut bien avoir à l’esprit que le calcul de la taille d’un échantillon n’exige pas un résultat précis. Ce qu’on veut savoir , c’est la taille MINIMALE que doit avoir un échantillon pour obtenir une précision désirée à l’avance. La formule approchée fournit toujours un nombre n légèrement supérieur au nombre donnée par la formule « exacte ». Si on exige une précision de 0,03 avec p=0,5, la formule approchée donne n=1067 et la formule du site « monkeysurvey » pour une taille de population N=100 000 donne n= 1056. Or qui peut le plus peut le moins. Si votre échantillon est légèrement supérieur à ce que donnerait une formule exacte, tant mieux. La précision obtenue sera meilleure.
      4) Vous utilisez un exemple où l’incidence est très faible, c’est-à-dire où la probabilité de l’événement est rare. Dans ces situations, on ne peut plus utiliser la loi normale (qui s’appelle aussi loi des grands nombres). Il faut utiliser une loi probabilisant la survenue d’un nombre d’événements x connaissant la probabilité de survenue de k événements dans une période donnée. On est ici dans le domaine de la loi de Poisson.
      5) Enfin, il faut bien avoir à l’esprit que ces calculs ne sont pertinents que lorsqu’on les applique à des situations théoriques, avec des échantillons strictement aléatoires . Lorsqu’on décide d’échantillonner dans une population, on se retrouve dans la vraie vie. Les contraintes ne sont pas réduites à une simple exigence de précision. Il y a des contraintes logistiques et financières, des biais d’échantillonnage. Par ailleurs, dans une enquête multivariables avec plusieurs modalités par variables, on doit tenir compte de la précision exigée pour chacune de ces modalités. Donc en pratique, le simple calcul de la taille d’un échantillon au moment de bâtir le protocole d’une enquête, n’est qu’un élément du choix de cette taille. Il donne un ordre de grandeur minimal qui doit souvent être largement dépassé pour obtenir une précision acceptable.
      Cordialement. T. Ancelle
      statepid.monsite-orange.fr/