Beste mål på sentralt for tendens

Jeg begynte nettopp å lære statistikk for noen uker siden, vel, spørsmålet mitt er at som vi vet at gjennomsnittet, medianen og modusen er den sentrale tendensen til dataene og den antydet at vi ikke skulle gå med bare ett av disse tiltakene, siden få omstendigheter kan påvirke dem godt. Vi bør vurdere den sentrale tendensen til dataene hvis deres gjennomsnitt, median og modus forteller en helt annen historie om dataene

eksempel

mean = 43.26 median = 14 and mode = 9 

og spørsmålet mitt er hva skal vi tolke ut fra disse tiltakene hva som er det bedre estimatet for det sentrale tendens

Kommentarer

  • Det virker veldig rart å sitere rådene og deretter spørre " hvilken " du bør bruke. Hvilken del av rådet " don ' t gå med bare en av dem " er forvirrende? Hvis det

er ikke forvirrende, hvorfor velger du da å " gå med " bare en?

  • beklager, jeg forstår ikke hva du snakker om
  • Du siterte bokstavelig talt råd om ikke bare å bruke ett mål, og nå ber du oss om å fortelle deg bare ett mål. Du ' ikke merker noen motsetninger der?
  • Svar

    Ulike situasjoner krever forskjellige svar. Brukte statistikere bør finne det tiltaket som svarer best på det underliggende spørsmålet.

    Vurder følgende setning:

    De fleste har over gjennomsnittet av ben

    De fleste har to ben, noen har bare ett eller ingen. Så gjennomsnittet er sannsynligvis 1,9 …

    Hvis noen i gaten spurte deg «Hvor mange ben har folk?» de forventer vanligvis svaret «to ben», som er -modus . Modusen er ofte «den normale tingen». Hvis du derimot var i en posisjon der du måtte planlegge et lager av proteser i underekstremiteter for et land langt borte, vil du multiplisere middel med befolkningsstørrelsen. I mange tilfeller der du vil vurdere et gjennomsnitt fra et lite utvalg, men er redd for avvikere, vil median være en bedre estimator.

    Så spørsmålet for det beste målet er ikke et universelt matematisk spørsmål, og det er heller ikke nødvendigvis avhengig av hva du måler, men det avhenger av hva som helst problem i den virkelige verden du prøver å takle.

    Svar

    skriv inn bildebeskrivelse her Etter min mening bør svaret være avhengig av distribusjonsformen din. Hvis du for eksempel har en bjelleformet tetthet, kan du vurdere å bruke middel som en informativ estimator. Hvis du har litt avvik, eller hvis du har en skjev fordeling, eller hvis distribusjonen ikke har et veldefinert gjennomsnitt – kan du bruke median. Hvis du har multimodal distribusjon, kan du bruke modus.

    Alle disse estimatorene er i det vesentlige forskjellige og gir forskjellig informasjon om den underliggende tilfeldige variabelen.

    En annen ting det er verdt å diskutere ( bortsett fra de dype underliggende forskjellene i hva disse estimatorene betyr) er effektiviteten av estimeringen og nedbrytningspunktet. Mean er den mest effektive estimatoren (estimeringen din vil være så nær den sanne verdien ved å bruke størrelsesutvalget du har). Median er mye mer robust (har nesten 50% nedbrytingspunkt), men mye mindre effektiv. Lehman-Hodges estimator er et sted i mellom. Modusen, som ofte oppnås via Kernel Density Estimation, er ikke effektiv i det hele tatt, og det er fornuftig å bruke den bare hvis du har> 50% av «outliers» – selv i dette tilfellet må du være veldig forsiktig med kjernen som du bruker, f.eks., holdes standardkjernen i R der av historiske årsaker og bør ikke brukes.

    Dette er min mening og kan være feil.

    Bildekreditt: https://www.tutor2u.net/geography/reference/mean-median-and-mode

    Legg igjen en kommentar

    Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *