Wraz ze wzrostem wielkości próby (na przykład strategia handlowa z 80% przewagą), dlaczego standard odchylenie wyników maleje? Czy ktoś może wyjaśnić, dlaczego odchylenie standardowe maleje, a wyniki zbliżają się do prawdziwej średniej… być może dostarczą prostego, intuicyjnego, laikowego przykładu matematycznego.
Komentarze
- Możliwy duplikat Jakie intuicyjne wyjaśnienie centralnego twierdzenia granicznego?
- ” Odchylenie standardowe wyników ” jest niejednoznaczne (jakie wyniki ??) – i więc bardzo ogólne stwierdzenie w tytule jest całkowicie nieprawdziwe (istnieją oczywiste kontrprzykłady; ' jest tylko czasami prawdziwe). Lepiej byłoby podać konkretny przykład (na przykład rozkład próbkowania średnich z próby, który ma tę właściwość, że odchylenie standardowe zmniejsza się wraz ze wzrostem wielkości próby).
- Odchylenie standardowe nie ' t koniecznie zmniejsza się wraz ze wzrostem rozmiaru próbki. Standardowy błąd średniej może jednak oznaczać, że ' jest tym, do czego ' odwołujesz się ponownie, w takim przypadku jesteśmy bardziej pewni, gdzie średnia to wzrost wielkości próby.
- Tak, musiałem zamiast tego mieć na myśli błąd standardowy. Dlaczego przykładowy błąd średniej maleje? Czy możesz podać prostą, nieabstrakcyjną matematykę, aby wizualnie pokazać dlaczego. Dlaczego otrzymujemy ' bardziej pewne ' gdzie średnia jest wraz ze wzrostem wielkości próbki (w moim przypadku wyniki są w rzeczywistości bliższe 80% współczynnik zwycięstw) jak to się dzieje?
Odpowiedź
Dlaczego wielkość próbki rośnie (na przykład strategia handlowa z przewagą 80%), dlaczego odchylenie standardowe wyników maleje?
Kluczową koncepcją są tutaj „wyniki”. Jakie to wyniki ? Wyniki to wariancje estymatorów parametrów populacji, takich jak średnia $ \ mu $.
Na przykład, jeśli dokonujesz ponownego pomiaru wariancji próbki $ s ^ 2_j $ wartości $ x_ {i_j} $ w twojej próbce $ j $, nie maleje przy większym rozmiarze próbki $ n_j $: $$ s ^ 2_j = \ frac 1 {n_j-1} \ sum_ {i_j} (x_ { i_j} – \ bar x_j) ^ 2 $$ gdzie $ \ bar x_j = \ frac 1 n_j \ sum_ {i_j} x_ {i_j} $ jest średnią próbną.
Jednak estymator wariancji $ s ^ 2_ \ mu $ średniej próbki $ \ bar x_j $ będzie maleć wraz z rozmiarem próbki: $$ \ frac 1 n_js ^ 2_j $$
Wyjaśnienie dla laika wygląda następująco. Załóżmy, że wielkość całej populacji to $ n $. Gdybyśmy spojrzeli na każdą wartość $ x_ {j = 1 \ dots n} $, nasza próbna średnia byłaby równa prawdziwej średniej: $ \ bar x_j = \ mu $. Innymi słowy, niepewność wyniosłaby zero, a wariancja estymatora również byłaby równa zero: $ s ^ 2_j = 0 $
Jednak gdy patrzysz tylko na próbkę o rozmiarze $ n_j $ . Obliczasz estymator średniej próbki $ \ bar x_j $ z niepewnością $ s ^ 2_j > 0 $. Zatem gdzieś pomiędzy wielkością próbki $ n_j $ a $ n $ niepewność (wariancja ) średniej próbki $ \ bar x_j $ spadła z wartości niezerowej do zera. To najprostsze wyjaśnienie, jakie mogę wymyślić.
Odpowiedź
Być może najłatwiej o tym pomyśleć w odniesieniu do różnicy między populacją a próbą. Jeśli zapytam cię, jaka jest średnia zmiennej w twojej próbce , nie podajesz mi oszacowania, prawda? Po prostu obliczasz to i mówisz mi, ponieważ z definicji masz wszystko dane, które składają się na próbkę i dlatego mogą bezpośrednio obserwować statystykę będącą przedmiotem zainteresowania. Współczynniki korelacji nie różnią się w tym sensie: jeśli zapytam cię, jaka jest korelacja między X i Y w twojej próbie , a ja najwyraźniej nie przejmuj się tym, co to jest poza próbą iw większej populacji (rzeczywistej lub metafizycznej), z której jest narysowana, po prostu skompresuj liczby i powiedz mi, że nie ma teorii prawdopodobieństwa.
A co, jeśli zależy nam na korelacji między tymi dwiema zmiennymi poza próbą, tj. W jakiejś nieobserwowanej populacji lub w nieobserwowalnej iw pewnym sensie stałej przyczynowo-skutkowej dynamice rzeczywistości? (Jeśli „pojmujemy ją jako tę drugą to populacja jest „superpopulacją”; patrz na przykład https://www.jstor.org/stable/2529429 .) Następnie oczywiście wykonujemy testy istotności i w inny sposób używamy tego, co wiemy w próbie, aby oszacować, czego nie mamy w populacji, w tym odchylenie standardowe populacji, które zaczyna dochodzić do Twoje pytanie.
Ale najpierw pomyślmy o tym z drugiej skrajności, gdzie zbieramy próbkę, która jest tak duża, że po prostu staje się populacją.Wyobraź sobie dane ze spisu powszechnego, jeśli pytanie badawcze dotyczy całej realnej populacji kraju, a może jest to „ogólna teoria naukowa i mamy nieskończoną„ próbkę ”: wtedy znowu, jeśli chcę wiedzieć, jak działa świat, wykorzystuję moją wszechmoc i po prostu obliczaj, a nie tylko szacuj, moją interesującą statystykę. Co się stanie, jeśli mam oddanie mózgowi i nie jestem już wszechmocny, ale wciąż jestem blisko niego, tak że brakuje mi jednej obserwacji, a moja próbka jest teraz o jedną obserwację krótszą, aby uchwycić całą populację? Teraz muszę ponownie dokonać szacunków, z zakresem wartości, które może przyjąć z różnym prawdopodobieństwem – nie mogę już tego dokładnie określić – ale to, co szacuję, to nadal pojedyncza liczba – punkt na liczbie linia, a nie zakres – i nadal mam mnóstwo danych, więc mogę powiedzieć z 95% pewnością, że prawdziwa statystyka, która nas interesuje, mieści się gdzieś w bardzo małym przedziale. Wszystko zależy oczywiście od wartości tego Tak się składa, że ostatnia obserwacja jest, ale to tylko jedna obserwacja, więc musiałaby być szaleńczo nietypowa, aby znacznie zmienić moją interesującą statystykę, co oczywiście jest mało prawdopodobne i znajduje odzwierciedlenie w moim wąskim przedziale ufności.
Druga strona medalu opowiada tę samą historię: góra danych, które mam, może przez zwykły przypadek doprowadzić mnie do obliczenia przykładowych statystyk, które są bardzo różne od tych, które bym obliczył, gdybym mógłby po prostu uzupełnić te dane o obserwacje, których mi brakuje, ale są szanse, że je będę miał wylosowane takie mylące, stronnicze próbki wyłącznie przez przypadek są naprawdę, bardzo niskie. To jest w zasadzie to, co biorę pod uwagę i komunikuję, kiedy zgłaszam mój bardzo wąski przedział ufności, określający, gdzie naprawdę leży interesująca statystyka populacji.
Oczywiście, jeśli cofniemy się od tego punktu zmniejszać się, a zatem przedział prawdopodobnych wartości populacji – bez względu na to, gdzie ten przedział leży na osi liczbowej – zaczyna się rozszerzać. Moja próba jest nadal deterministyczna, jak zawsze, i mogę obliczyć średnie z próby i korelacje, i mogę traktować te statystyki tak jakby to były twierdzenia o tym, co bym obliczał, gdybym miał pełne dane na temat populacji, ale im mniejsza próba, tym bardziej sceptyczny muszę podchodzić do tych twierdzeń i tym bardziej muszę wierzyć, że to, co Naprawdę chciałbym, żeby dane populacyjne znacznie różniły się od tego, co widzę w tej próbce. Wszystko to ma na celu udzielenie odpowiedzi na pytanie w odwrotnej kolejności: nasze oszacowania wszelkich statystyk spoza próby stają się bardziej pewne i zbiegają się w jednym punkcie , reprezentant oburzenie pewnej wiedzy pełnymi danymi, z tego samego powodu, dla którego stają się one mniej pewne i obejmują szerszy zakres, im mniej danych mamy.
Ważne jest również, aby zrozumieć, że odchylenie standardowe statystyki w szczególności odnosi się do i określa ilościowo prawdopodobieństwa uzyskania różnych statystyk z różnych próbek w różnych próbach, wszystkie losowo pobrane z tej samej populacji, która, znowu, sama w sobie ma tylko jedną prawdziwą wartość dla interesującej nas statystyki. W samej populacji nie ma żadnego odchylenia standardowego tej statystyki – jest to liczba stała i nie zmienia się. Z drugiej strony zmienna ma swoje własne odchylenie standardowe, zarówno w populacji, jak i w dowolnej próbie, a następnie jest oszacowanie tego odchylenia standardowego populacji, które można podać, biorąc pod uwagę znane odchylenie standardowe tej zmiennej w danej próbie o określonej wielkości. Dlatego ważne jest, aby wszystkie odniesienia były proste, kiedy można mieć odchylenie standardowe (a raczej błąd standardowy) wokół oszacowania punktowego populacji odchylenie standardowe zmiennej, oparte na odchyleniu standardowym tej zmiennej w twojej próbie. Nie ma prostszego sposobu, aby o tym porozmawiać.
I na koniec zauważ, że tak, z pewnością jest to możliwe próbka, która daje tendencyjną reprezentację wariancji w populacji, więc chociaż jest to stosunkowo mało prawdopodobne, zawsze jest możliwe, że mniejsza próbka nie tylko okłamie Cię co do statystyki populacji, ale także okłamie Cię na temat jak bardzo powinieneś oczekiwać, że ta interesująca statystyka będzie się różnić od samp le do próbki. Nie da się tego obejść. Pomyśl o tym tak, jakby ktoś złożył roszczenie, a następnie zapytaj go, czy kłamie. Może powiedzą tak, w takim przypadku możesz być pewien, że nie mówią ci nic wartego rozważenia. Ale jeśli powiedzą nie, jesteś z powrotem na pierwszym miejscu. Albo „kłamią, albo nie”, a jeśli nie masz nikogo innego, o kogo mógłbyś zapytać, musisz po prostu zdecydować, czy im wierzyć, czy nie. (Bayesianom wydaje się, że mają lepszy sposób na podjęcie tej decyzji, ale pokornie się z tym nie zgadzam.)