A tendencia középpontjának legjobb mércéje

Néhány hete kezdtem el tanulni a statisztikákat, a kérdésem az, hogy mivel tudjuk, hogy az átlag, a medián és a mód az adatok központi tendenciája és javaslata, hogy ne csak az egyik ilyen intézkedést tegyük meg, mivel kevés körülmény befolyásolhatja őket jól, akkor mit kell tekintenünk az adatok központi tendenciájára, ha átlaguk, mediánjuk és módjuk teljesen más történetet mesél el az adatokról

példa

mean = 43.26 median = 14 and mode = 9 

és a kérdésem az, hogy mit kell értelmeznünk ezekből az intézkedésekből, mi lenne a jobb becslés a központi tendencia

Megjegyzések

  • nagyon furcsának tűnik a tanácsot idézni, majd megkérdezni " melyik " melyiket kell használnia. A tanács melyik része " ne ' t csak az egyikükkel megy " zavaró?. Ha

s nem zavaró, miért választaná " a " csak egyet?

  • sajnálom, nem értem, miről beszélsz.
  • Szó szerint idézett tanácsot, hogy ne csak egy mértéket használjon, és most azt kéri tőlünk, hogy csak egy mértéket mondjunk meg. Nem ' nem vesz észre ott ellentmondást?
  • Válasz

    A különböző helyzetek különböző válaszokat igényelnek. Az alkalmazott statisztikusoknak meg kell találniuk azt a mértéket, amely a legjobban megválaszolja az alapul szolgáló kérdést.

    Vegye figyelembe a következő mondatot:

    A legtöbb ember átlagon felüli számmal rendelkezik lábak

    A legtöbb embernek 2 lába van, van, akinek csak egy vagy egyik sem. Tehát az átlag valószínűleg 1,9 …

    Ha valaki az utcán megkérdezte: “Hány lába van az embereknek?” általában a “két láb” választ várják, amely a mód . A mód gyakran “a normális dolog”. Ha azonban olyan helyzetben lenne, hogy egy távoli ország számára meg kellene terveznie az alsó végtag protézis készletét, akkor meg szeretné szorozni a átlagot a populáció méretével. Sok esetben, amikor kis átlagból szeretné értékelni az átlagot, de fél a kiugró értékektől, a medián jobb becslő.

    Tehát a legjobb mérés kérdése nem univerzális matematikai kérdés, és nem is feltétlenül függ attól, hogy mit mér, hanem attól függ, hogy milyen valós problémát próbál meg megoldani.

    Válasz

    írja ide a kép leírását Véleményem szerint a válasznak az Ön terjesztési alakjától kell függenie. Például, ha harang alakú sűrűsége van, fontolja meg az átlag használatát informatív becslésként. Ha van néhány kiugró érték, vagy torz eloszlása van, vagy az eloszlásnak nincs pontosan meghatározott átlaga – használhatja a mediánt. Ha multimodális eloszlásod van, használhatod a módot.

    Mindezek a becslések lényegében különböznek egymástól, és különböző információkat szolgáltatnak az alapul szolgáló véletlen változóról.

    Egy másik dolog, amelyet érdemes megvitatni ( kivéve a mélyreható különbségeket abban, amit ezek a becslők jelentenek) a becslés hatékonysága és a bontási pont. Az átlag a leghatékonyabb becslő (az Ön becslése olyan közel lesz a valódi értékhez, ha rendelkezik a rendelkezésre álló méretű mintával). A medián sokkal robusztusabb (majdnem 50% -os bontási ponttal rendelkezik), de sokkal kevésbé hatékony. Lehman-Hodges becslője valahol a kettő között van. A mód, amelyet gyakran a Kernel Density Estimation segítségével szereznek be, egyáltalán nem hatékony, és csak akkor van értelme használni, ha a “kiugró értékek”> 50% -a van – még ebben az esetben is nagyon körültekintően kell eljárnia a kernellel Ön például használja, az R alapértelmezett kernelét történelmi okok miatt ott tartják, és nem szabad használni.

    Ez az én véleményem, és téves lehet.

    Kép jóváírása: https://www.tutor2u.net/geography/reference/mean-median-and-mode

    Vélemény, hozzászólás?

    Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük