Bästa måttet på det centrala av tendensen

Jag började just lära mig statistik för några veckor sedan, min fråga är att som vi vet att medelvärdet, medianen och läget är den centrala tendensen för data och dess föreslog att vi inte skulle gå med bara en av dessa åtgärder eftersom få omständigheter kan påverka dem väl, vad vi bör betrakta den centrala tendensen för data om deras medelvärde, median och läge berättar en helt annan historia om data

exempel

mean = 43.26 median = 14 and mode = 9 

och min fråga är vad ska vi tolka utifrån dessa åtgärder vad som skulle vara den bättre uppskattningen för den centrala tendens

Kommentarer

  • Det verkar väldigt konstigt att citera råd och sedan fråga " vilken " du ska använda. Vilken del av rådet " don ' t gå med bara en av dem " är förvirrande?. Om det

är inte förvirrande, varför då välja att " gå med " bara en?

  • ledsen, jag förstår inte vad du pratar om
  • Du citerade bokstavligen råd att inte bara använda en åtgärd, och nu ber du oss att berätta bara en åtgärd. Du märker inte ' någon motsägelse där?
  • Svar

    Olika situationer kräver olika svar. Tillämpade statistiker bör hitta det mått som svarar bäst på den underliggande frågan.

    Tänk på följande mening:

    De flesta har ett över genomsnittligt antal av benen

    De flesta har två ben, vissa har bara en eller ingen. Så medelvärdet är förmodligen 1,9 …

    Om någon på gatan frågade dig ”Hur många ben har människor?” de förväntar sig vanligtvis svaret ”två ben”, vilket är -läget . Läget är ofta ”det normala”. Om du emellertid var i en position där du skulle behöva planera ett lager av nedre extremiteter för ett land långt borta, skulle du vilja multiplicera medelvärdet med befolkningsstorleken. I många fall där du vill bedöma ett medelvärde från ett litet urval men är rädd för avvikare kommer median att vara en bättre uppskattning.

    Så frågan för det bästa måttet är inte en universell matematisk fråga och beror inte nödvändigtvis på vad du mäter, men det beror på vilket problem som helst i den verkliga världen du försöker ta itu med.

    Svar

    ange bildbeskrivning här Enligt min mening bör svaret bero på din distributionsform. Om du till exempel har en klockformad densitet kan du överväga att använda medel som en informativ uppskattning. Om du har lite avvikare eller har en sned fördelning eller om din distribution inte har ett väldefinierat medelvärde – kan du använda median. Om du har multimodal distribution kan du använda läge.

    Alla dessa uppskattare är väsentligen olika och ger olika information om din underliggande slumpmässiga variabel.

    En annan sak som är värt att diskuteras ( förutom de djupa underliggande skillnaderna i vad dessa uppskattare betyder) är uppskattningens effektivitet och uppdelningspunkt. Medelvärdet är den mest effektiva uppskattaren (din uppskattning kommer att vara så nära det sanna värdet med hjälp av urvalet av storlek som du har). Median är mycket mer robust (har nästan 50% uppdelningspunkt), men mycket mindre effektiv. Lehman-Hodges uppskattare är någonstans däremellan. Läget, som ofta erhålls via Kernel Density Estimation, är inte effektivt och det är vettigt att använda det bara om du har> 50% av ”outliers” – även i det här fallet måste du vara mycket försiktig med kärnan som du använder t.ex. standardkärnan i R förvaras där av historiska skäl och bör inte användas.

    Dessa är min åsikt och kan vara fel.

    Bildkredit: https://www.tutor2u.net/geography/reference/mean-median-and-mode

    Lämna ett svar

    Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *