Aloitin vasta tilastojen oppimisen muutama viikko sitten. Kysymykseni on, että koska tiedämme, että keskiarvo, mediaani ja tila ovat datan keskeinen suuntaus ja sen ehdotus, että meidän ei pidä mennä vain yhteen näistä toimenpiteistä, koska harvat olosuhteet voivat vaikuttaa niihin hyvin, mitä meidän pitäisi ottaa huomioon tietojen keskeisenä suuntauksena, jos niiden keskiarvo, mediaani ja tila kertovat täysin erilaisen tarinan tiedoista
esimerkki
mean = 43.26 median = 14 and mode = 9
ja kysymykseni on, mitä meidän tulisi tulkita näistä toimenpiteistä, mikä olisi parempi arvio keskitetylle taipumus
kommentit
- Vaikuttaa hyvin oudolta lainata neuvoja ja kysyä sitten " kumpi " sinun tulisi käyttää. Mikä neuvojen osa " älä ' t mennä vain yhden heistä " on sekava?. Jos se
ei ole sekava, miksi sitten valita " mennä " vain yhden kanssa?
Vastaa
Eri tilanteissa tarvitaan erilaisia vastauksia. Soveltavien tilastotieteilijöiden tulisi löytää mitta, joka vastaa parhaiten peruskysymykseen.
Harkitse seuraavaa virkettä:
Useimmilla ihmisillä on keskimääräistä enemmän jaloista
Useimmilla ihmisillä on 2 jalkaa, joillakin vain yksi tai ei yhtään. Joten keskiarvo on todennäköisesti 1,9 …
Jos joku kadulla kysyi sinulta ”Kuinka monta jalkaa ihmisillä on?” he yleensä odottavat vastausta ”kaksi jalkaa”, joka on -tila . Tila on usein ”normaali asia”. Jos kuitenkin olisit tilanteessa, jossa sinun olisi suunniteltava alaraajaproteesivarasto kaukaiselle maalle, haluat kertoa keskiarvo väestön koon mukaan. Monissa tapauksissa, joissa haluat arvioida keskiarvon pienestä otoksesta mutta pelkäät poikkeamia, mediaani on parempi estimaattori.
Joten paras mitta-arvo ei ole universaali matemaattinen kysymys, eikä se välttämättä riipu mitattavastasi, vaan se riippuu mistä tahansa todellisesta ongelmasta yrität ratkaista.
vastaus
Mielestäni vastauksen tulisi olla riippuvainen levitystavastasi. Jos sinulla on esimerkiksi kellon muotoinen tiheys, voit harkita keskiarvon käyttöä informatiivisena estimaattorina. Jos sinulla on vähän poikkeamia tai sinulla on väärä jakauma tai jakaumalla ei ole tarkasti määriteltyä keskiarvoa – voit käyttää mediaania. Jos sinulla on multimodaalinen jakauma, voit käyttää tilaa.
Kaikki nämä estimaattorit ovat olennaisesti erilaisia ja tarjoavat erilaisia tietoja taustalla olevasta satunnaismuuttujasta.
Toinen asia, josta kannattaa keskustella ( lukuun ottamatta syviä taustalla olevia eroja, mitä nämä estimaattorit tarkoittavat) on estimoinnin tehokkuus ja jakopiste. Keskiarvo on tehokkain estimaattori (arviosi on yhtä lähellä todellista arvoa käyttämällä käytössä olevaa koon otosta). Mediaani on paljon vankempi (siinä on lähes 50% hajoamispiste), mutta paljon vähemmän tehokas. Lehman-Hodgesin estimaattori on jossain välissä. Tila, joka saadaan usein ytimen tiheysestimaation avulla, ei ole lainkaan tehokas, ja on järkevää käyttää sitä vain, jos sinulla on> 50% ”poikkeavuuksia” – jopa tässä tapauksessa sinun on oltava hyvin varovainen ytimen kanssa käytät esim. R: n oletusydintä pidetään siellä historiallisista syistä eikä sitä pidä käyttää.
Nämä ovat mielestäni ja saattavat olla väärässä.
Kuvahyvitys: https://www.tutor2u.net/geography/reference/mean-median-and-mode