Beste maatstaf voor de centrale tendens

Ik ben net begonnen met het leren van statistieken een paar weken geleden. Mijn vraag is dat, zoals we weten, het gemiddelde, de mediaan en de modus is de centrale tendens van de gegevens en de suggestie dat we niet voor slechts één van deze maatregelen zouden moeten gaan, aangezien weinig omstandigheden ze goed kunnen beïnvloeden wat we moeten beschouwen als de centrale tendens van de gegevens als hun gemiddelde, mediaan en modus een heel ander verhaal vertellen over de gegevens

voorbeeld

mean = 43.26 median = 14 and mode = 9 

en mijn vraag is wat moeten we interpreteren uit deze metingen, wat zou de betere schatting zijn voor de centrale neiging

Opmerkingen

  • Het lijkt erg vreemd om het advies te citeren en dan " welke " je moet gebruiken. Welk deel van het advies " don ' is niet geschikt voor slechts één van hen " is verwarrend?. Als het

s niet verwarrend, waarom zou je er dan voor kiezen om " te gaan met " slechts één?

  • sorry, ik begrijp niet waar je het over hebt
  • Je citeerde letterlijk advies om niet slechts één maat te gebruiken, en nu vraagt je ons om je maar één maat te vertellen. U ' merkt daar geen tegenstrijdigheid op?
  • Antwoord

    Verschillende situaties vragen om verschillende antwoorden. Toegepaste statistici moeten de maat vinden die de onderliggende vraag het beste beantwoordt.

    Beschouw de volgende zin:

    De meeste mensen hebben een bovengemiddeld aantal of legs

    De meeste mensen hebben 2 benen, sommige hebben er maar één of geen. Dus het gemiddelde is waarschijnlijk 1,9 …

    Als iemand op straat je zou vragen “Hoeveel benen hebben mensen?” ze zullen gewoonlijk het antwoord “twee benen” verwachten, dat is de modus . De modus is vaak “de normale zaak”. Als u zich echter in een positie bevindt waarin u een voorraad prothesen voor de onderste ledematen moet plannen voor een land ver weg, zou u het gemiddelde met de populatiegrootte. In veel gevallen waarin u een gemiddelde van een kleine steekproef wilt beoordelen, maar bang bent voor uitschieters, is de mediaan een betere schatter.

    Dus de vraag voor de beste maatstaf is geen universele wiskundige vraag en hangt ook niet per se af van wat je meet, maar het hangt af van welk probleem in de echte wereld je ook probeert aan te pakken.

    Antwoord

    voer hier een afbeeldingbeschrijving in Naar mijn mening moet het antwoord afhankelijk zijn van uw distributievorm. Als u bijvoorbeeld een klokvormige dichtheid heeft, kunt u overwegen het gemiddelde te gebruiken als informatieve schatter. Als u een beetje uitschieters heeft of als u een scheve verdeling heeft, of als uw verdeling geen goed gedefinieerd gemiddelde heeft, kunt u mediaan gebruiken. Als je een multimodale distributie hebt, kun je de modus gebruiken.

    Al deze schatters zijn wezenlijk verschillend en geven verschillende informatie over je onderliggende willekeurige variabele.

    Nog iets dat de moeite waard is om besproken te worden ( behalve de diepe onderliggende verschillen in wat deze schatters betekenen) is de efficiëntie van de schatting en het uitsplitsingspunt. Gemiddelde is de meest efficiënte schatter (uw schatting zal zo dicht mogelijk bij de werkelijke waarde liggen op basis van de steekproef van grootte die u heeft). Mediaan is veel robuuster (heeft een afbraakpunt van bijna 50%), maar veel minder effectief. Lehman-Hodges-schatter zit ergens tussenin. De modus, die vaak wordt verkregen via Kernel Density Estimation, is helemaal niet efficiënt en het is zinvol om deze alleen te gebruiken als je> 50% “uitschieters” hebt – zelfs in dit geval moet je heel voorzichtig zijn met de kernel die je gebruikt bv. de standaard kernel in R wordt daar bewaard om historische redenen en mag niet gebruikt worden.

    Dit zijn mijn mening en kunnen onjuist zijn.

    Afbeeldingscredit: https://www.tutor2u.net/geography/reference/mean-median-and-mode

    Geef een reactie

    Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *