Bedste mål for centralt for tendens

Jeg begyndte lige at lære statistik for et par uger siden, ja, mit spørgsmål er, at som vi ved, at middelværdien, medianen og tilstanden er den centrale tendens i dataene og dens antydede, at vi ikke kun skulle gå med en af disse foranstaltninger, da få omstændigheder kan påvirke dem godt, hvad vi skal overveje den centrale tendens til dataene, hvis deres gennemsnit, median og tilstand fortæller en helt anden historie om data

eksempel

mean = 43.26 median = 14 and mode = 9 

og mit spørgsmål er, hvad vi skal fortolke ud fra disse foranstaltninger, hvad der ville være det bedre skøn for det centrale tendens

Kommentarer

  • Det virker meget underligt at citere rådene og derefter spørge " hvilken " du skal bruge. Hvilken del af rådgivningen " don ' t gå med kun en af dem " er forvirrende? Hvis det

er ikke forvirrende, hvorfor så vælge " gå med " bare en?

  • undskyld, jeg forstår ikke, hvad du taler om
  • Du citerede bogstaveligt talt råd om ikke kun at bruge en foranstaltning, og nu beder du os om at fortælle dig kun en foranstaltning. Du ' bemærker ikke nogen modsigelse der?
  • Svar

    Forskellige situationer kræver forskellige svar. Anvendte statistikere skal finde det mål, der bedst svarer på det underliggende spørgsmål.

    Overvej følgende sætning:

    De fleste mennesker har et gennemsnit over antallet ben

    De fleste mennesker har 2 ben, nogle har kun et eller ingen. Så middelværdien er sandsynligvis 1,9 …

    Hvis nogen på gaden spurgte dig “Hvor mange ben har folk?” de forventer normalt svaret “to ben”, som er -tilstand . Tilstanden er ofte “den normale ting”. Hvis du imidlertid var i en position, hvor du skulle planlægge et lager af proteser i underekstremiteter for et land langt væk, ville du gerne multiplicere middel med befolkningsstørrelsen. I mange tilfælde, hvor du gerne vil vurdere et middel fra en lille prøve, men er bange for outliers, vil median være en bedre estimator.

    Så spørgsmålet om det bedste mål er ikke et universelt matematisk spørgsmål, og det afhænger heller ikke nødvendigvis af, hvad du måler, men det afhænger af, hvilket problem i den virkelige verden du prøver at tackle.

    Svar

    indtast billedebeskrivelse her Efter min mening skal svaret afhænge af din distributionsform. F.eks. Hvis du har en klokkeformet tæthed, kan du overveje at bruge middel som en informativ estimator. Hvis du har en smule afvigelser, eller hvis du har en skæv fordeling, eller hvis din distribution ikke har et veldefineret gennemsnit – kan du bruge medianen. Hvis du har multimodal distribution, kan du bruge tilstand.

    Alle disse estimatorer er i det væsentlige forskellige og giver forskellige oplysninger om din underliggende tilfældige variabel.

    En anden ting værd at blive diskuteret ( undtagen de dybe underliggende forskelle i, hvad disse estimatorer betyder) er estimeringens effektivitet og nedbrydningspunktet. Gennemsnit er den mest effektive estimator (dit estimat vil være så tæt på den sande værdi ved hjælp af den stikprøve, du har). Median er meget mere robust (har næsten 50% nedbrydningspunkt), men meget mindre effektiv. Lehman-Hodges estimator er et sted imellem. Tilstanden, som ofte opnås via Kernel Density Estimation, er overhovedet ikke effektiv, og det giver kun mening at bruge den, hvis du har> 50% af “outliers” – selv i dette tilfælde skal du være meget forsigtig med kernen, som du bruger f.eks. standardkernen i R opbevares der af historiske årsager og bør ikke bruges.

    Dette er min mening og kan være forkert.

    Billedkredit: https://www.tutor2u.net/geography/reference/mean-median-and-mode

    Skriv et svar

    Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *