Je viens de commencer à apprendre les statistiques il y a quelques semaines et ma question est que, comme nous le savons, la moyenne, la médiane et le mode sont la tendance centrale des données et cela suggère que nous ne devrions pas aller avec une seule de ces mesures car peu de circonstances peuvent bien les affecter ce que nous devrions considérer comme la tendance centrale des données si leur moyenne, leur médiane et leur mode racontent une histoire complètement différente à propos des données
exemple
mean = 43.26 median = 14 and mode = 9
et ma question est de savoir que devrions-nous interpréter à partir de ces mesures quelle serait la meilleure estimation pour le tendance
Commentaires
- Il semble très étrange de citer le conseil puis de demander à " lequel " vous devriez utiliser. Quelle partie du conseil " don ' t aller avec un seul dentre eux " est déroutant?. Si cest
nest pas déroutant, pourquoi alors choisir de " aller avec " un seul?
Réponse
Des situations différentes appellent des réponses différentes. Les statisticiens appliqués devraient trouver la mesure qui répond le mieux à la question sous-jacente.
Considérez la phrase suivante:
La plupart des gens ont un nombre supérieur à la moyenne de jambes
La plupart des gens ont 2 jambes, certains nen ont quune ou aucune. Donc la moyenne est probablement de 1,9 …
Si quelquun dans la rue vous demandait « Combien de jambes les gens ont-ils? » ils sattendront généralement à la réponse « deux jambes », qui est le mode . Le mode est souvent « la chose normale ». Si, toutefois, vous étiez dans une position où vous deviez planifier un stock de prothèses de membre inférieur pour un pays lointain, vous voudriez multiplier la moyenne avec la taille de la population. Dans de nombreux cas où vous souhaitez évaluer une moyenne à partir dun petit échantillon mais que vous craignez les valeurs aberrantes, la médiane sera un un meilleur estimateur.
La question de la meilleure mesure nest donc pas une question mathématique universelle et ne dépend pas nécessairement de ce que vous mesurez, mais cela dépend du problème du monde réel que vous essayez de résoudre.
Réponse
À mon avis, la réponse devrait dépendre de la forme de votre distribution. Par exemple, si vous avez une densité en forme de cloche, vous pouvez envisager dutiliser la moyenne comme estimateur informatif. Si vous avez un peu de valeurs aberrantes ou si vous avez une distribution asymétrique ou si votre distribution na pas de moyenne bien définie, vous pouvez utiliser la médiane. Si vous avez une distribution multimodale, vous pouvez utiliser le mode.
Tous ces estimateurs sont essentiellement différents et fournissent des informations différentes sur votre variable aléatoire sous-jacente.
Une autre chose mérite dêtre discutée ( à lexception des différences profondes sous-jacentes dans la signification de ces estimateurs) est lefficacité de lestimation et le point de rupture. La moyenne est lestimateur le plus efficace (votre estimation sera aussi proche de la valeur réelle en utilisant léchantillon de taille que vous avez). La médiane est beaucoup plus robuste (a presque 50% de point de rupture), mais beaucoup moins efficace. Lestimateur de Lehman-Hodges se situe quelque part entre les deux. Le mode, qui est souvent obtenu via lestimation de la densité du noyau, nest pas du tout efficace et il est logique de ne lutiliser que si vous avez> 50% de «valeurs aberrantes» – même dans ce cas, vous devez être très prudent avec le noyau qui vous utilisez, par exemple, le noyau par défaut de R y est conservé pour des raisons historiques et ne doit pas être utilisé.
Ce sont à mon avis et peuvent être faux.
Crédit dimage: https://www.tutor2u.net/geography/reference/mean-median-and-mode