Onko virheellinen laskea prosenttien keskiarvoa ja keskihajontaa?

Tietoni ovat prosenttiosuuksia siitä, kuinka monta tapahtumaa kokonaisuudesta menetetään kuukaudessa. Prosenttiosuudet ovat 13 kuukautta ja vaihtelevat 97: stä 99 prosenttiin. Minua pyydettiin laskemaan keskiarvo ja keskihajonta, mutta en ole varma, olisiko tulos mielekäs ja voisiko keskiarvo laskea prosenttiosuuksille perinteisessä mielessä (esim. Excelissä, jossa keskiarvo (prosenttimatriisi)) verrattuna muihin menetelmä (painotettu keskiarvo), koska minulla ei ole muita tietoja kuin prosentit.

Auta minua ymmärtämään

  1. Voiko prosenttien keskiarvo ja keskihajonta olla laskettu,
  2. mitkä olosuhteet ovat tarpeen prosenttien keskiarvon ja keskihajonnan laskemiseksi,
  3. vaihtoehdot, jotka määräävät prosenttiluvun ja keskihajonnan tietylle ajanjaksolle.

Onko esimerkiksi seuraava virheellinen tekeminen olettaen, että prosenttiosuudet edustavat # menetettyä tapahtumaa / # tapahtuman kokonaismäärää jokaiselta kuukaudelta ja samaa laskutoimitusta käytetään joka kuukausi:

Month Data Feb-15 98.0% Mar-15 98.7% Apr-15 97.0% May-15 99.9% Jun-15 98.7% Jul-15 97.9% Mean 98.4% SD (Population) 0.90% 

tämä viesti näyttää siltä tulisi tehdä painotetuilla keskiarvoilla, koska kokonaismäärät ovat erilaiset, ja että keskiarvon ja keskihajonnan laskeminen on mahdollista prosentteille vain, jos ne tulevat samasta kokonaismäärästä, mikä tarkoittaa, että yllä oleva olisi väärin ja että tarvitsisin lisätietoja painon määrittämiseksi kerrata prosenttiosuudet, jos se on oikein.

Kommentit

  • Tietenkin voit laskea keskiarvon ja SD: n prosenttiosuudet: kytke ne vain kaavaan. Huolta tulisi saada siitä, miten tuloksena olevat arvot tulkitaan. Voisitko selittää, miksi sinua on pyydetty suorittamaan tämä laskelma ja mitä tuloksille tehdään?
  • @whuber on täällä. Loppujen lopuksi prosenttiosuus on vain keskiarvo 0 ’ s ja 1 ’ s. Tärkeintä ei ole se, voidaanko keskiarvo ja keskihajonta laskea, vaan se, mitä haluat tehdä niille ja onko sillä järkevää kyseisessä yhteydessä.
  • Keskiarvon ja metrijoukon keskihajonta kynnysten asettamiseksi niille. Joten tässä esimerkissä 98,4 prosentin keskiarvoa käytettäisiin kuluvan kuukauden mittaamiseen, olettaen, että mitä enemmän keskihajontoja se on keskiarvosta, sitä enemmän huolta se olisi.
  • Kuten näette, kaksi keskihajontaa keskiarvon ulkopuolella on jo yli 100 prosentin alueella. Jos tehtävänäsi on nähdä, kuinka äärimmäinen uusi havainto on verrattuna historiallisiin tietoihin, voit harkita jonkin listatason käyttämistä. Esimerkiksi. vain kuinka monta kuukautta kuukausien kokonaismäärästä on ollut huonompi tai parempi kuin kuluva kuukausi. Saat pisteitä kuten 2/13 tai 1/13 tai jopa 0/13.
  • @RichardHardy Riveillä tietysti jokin arvo on aina korkein ja osa pienin, joten se ei ole heti ilmeinen kuinka sijoitus- tai sijoitustilastot tarjoavat ratkaisun ” onko tämä arvo tarpeeksi erilainen huolestuttamaan? ”

vastaus

Kuten kysymykseen linkitetyssä artikkelissa todetaan, sinun ei pitäisi laskea prosenttiosuuksien keskiarvoa samalla menetelmällä kokonaislukuihin .

Sinun on käytettävä painotettua keskiarvoa.

Katso tämä viimeinen artikkeli sisältää lisätietoja https://www.indeed.com/career-advice/career-development/how-to-calculate-average-percentage , mutta se selittää saman menetelmän kuin kysymykseen linkitetty artikkeli.

vastaus

Kuten muut ovat huomauttaneet, riippuu siitä, onko oikein laskea keskiarvo ja prosentuaalinen keskihajonta käyttötarkoitus. Käytössäsi, ainakin ymmärrän sen, se näyttää olevan väärä.

Kuten ymmärrän kysymyksestäsi ja kommentistasi, yrität tehdä poikkeavuuksien havaitsemisen . Kysyt periaatteessa:

Onko menetettyjen tapahtumien lukumäärä ” normaaliksi ”, vai poikkeaako se niin paljon, että sitä pidetään poikkeavana?

Tähän ei ole selkeää vastausta kysymys. Parasta mitä voit tehdä, on laskea todennäköisyys :

Oletetaan, että tapahtuman tiedossa oleva todennäköisyys on ” mis ”, kuinka todennäköistä on, että annettu määrä epäonnistumisia kuukaudessa?

Jos se on hyvin epätodennäköistä (esimerkiksi todennäköisyys alle 0,05), voit pitää sitä poikkeavana. Joten kysymys on edelleen siitä, kuinka tämä todennäköisyys lasketaan.Jos prosenttisi jakautuvat normaalisti, voit helposti johtaa sen keskiarvosta ja keskihajonnasta: arvot, jotka ovat yli 2 SD: n päässä keskiarvosta, näkyvät todennäköisyydellä alle 0,05. Oletettavasti syy siihen, miksi sinua pyydettiin laskemaan nämä arvot.

Prosenttisi eivät kuitenkaan normaalisti jakaudu! Kuten Richard Hardy huomautti kommentissaan, kahden keskiarvon yläpuolella olevan SD: n saavuttaminen on jo mahdotonta, koska se olisi yli 100%. Sinun on käytettävä erilaista, sopivampaa todennäköisyysjakaumaa. Ilman verkkotunnuksen lisätietoa parhaiten voit käyttää binomijakaumaa:

$$ P (k) = {n \ select k} p ^ k ( 1-p) ^ {nk} $$

$ n $ on tapahtumien lukumäärä ja $ k $ epäonnistuneiden lukumäärä kyseisenä kuukautena. Voit arvioida $ p $ historiallisten tietojen perusteella epäonnistumisten kokonaismäärä ja tapahtumien kokonaismäärä viime kuukausina.

Kaiken tämän jälkeen voit laskea kumulatiivisen todennäköisyys havaita vähintään yhtä monta epäonnistumista kuin sinulla todellisuudessa oli kyseisenä kuukautena. Jos tämä todennäköisyys on jonkin ennalta määritetyn tason alapuolella (esimerkiksi edellä mainittu 0,05), sitä pidät poikkeavuutena.

Täydellisyys: Jos haluat olla vielä tarkempi (epäilen, koska sinulle on annettu väärä tehtävä ensinnäkin), voit saada $ p $ mallintamalla se beetajakaumalla, ja käytä äärimmäistä, mutta silti uskottavaa $ p $ yllä olevassa binomijakaumassa Beetajakauman parametrit olisivat esimerkiksi $ \ alpha = $ (epäonnistumisten määrä) ja $ \ beta = $ (tapahtumien kokonaismäärä $ – $ epäonnistuneiden lukumäärä).

Vastaa

En halua tehdä näitä laskutoimituksia prosentteina. Ensimmäinen vaihtoehto on työskennellä osoittajien ja nimittäjien kanssa ja fi tee manipulointia. Toinen vaihtoehto on muuntaa prosenttiosuudet lokiarvoiksi, mikä pakottaa tulokset välille 0–100 prosenttia.

Kommentit

  • Tämä ei näy vastaamaan kysymykseen.
  • Toisella vaihtoehdolla ei ole mitään järkeä. Jos prosenttiosuutesi on 0–100, lokien ottaminen ei toimi ’ ei toimi, jos sinulla on 0 arvoa ja se pakottaa prosenttimäärät alle 1 alle 0. prosentteina, mutta tyypillisesti likiarvona logit-asteikolla työskentelyyn.
  • Olen tottunut työskentelemään todennäköisyyksien ja melkein yksinomaan luonnollisten logaritmien (logit-asteikko) kanssa. Se toimii kyseisellä alueella tietyin oletuksin. Minun olisi pitänyt täyttää kommenttini. Aluksi ajattelin, että sitä voitaisiin soveltaa yleisemmin, mutta olet oikeassa, ei.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *