Wie ' summiert ' eine Standardabweichung?

Ich habe einen monatlichen Durchschnitt für einen Wert und eine Standardabweichung, die diesem Durchschnitt entspricht. Ich berechne jetzt den Jahresdurchschnitt als Summe der monatlichen Durchschnittswerte. Wie kann ich die Standardabweichung für den summierten Durchschnitt darstellen?

Betrachten Sie beispielsweise die Ausgabe eines Windparks:

Month MWh StdDev January 927 333 February 1234 250 March 1032 301 April 876 204 May 865 165 June 750 263 July 780 280 August 690 98 September 730 76 October 821 240 November 803 178 December 850 250 

Wir können sagen, dass der Windpark im Durchschnitt 10.358 MWh produziert, aber wie hoch ist die Standardabweichung, die dieser Zahl entspricht?

Kommentare

  • In einer Diskussion nach einer jetzt gelöschten Antwort wurde eine mögliche Mehrdeutigkeit in dieser Frage festgestellt: Suchen Sie die SD der monatlichen Durchschnittswerte oder möchten Sie die SD wiederherstellen? aller ursprünglichen Werte, aus denen diese Durchschnittswerte erstellt wurden? In dieser Antwort wurde auch richtig darauf hingewiesen, dass Sie, wenn Sie Letzteres wünschen, die Anzahl der Werte benötigen, die in jedem der monatlichen Durchschnittswerte enthalten sind.
  • Ein Kommentar zu einer anderen gelöschten Antwort wies darauf hin, dass die Berechnung seltsam ist ein Durchschnitt als Summe : Sie meinen sicherlich, dass Sie die monatlichen Durchschnittswerte berechnen. Wenn Sie jedoch den Durchschnitt aller Originaldaten schätzen möchten, ist ein solches Verfahren normalerweise nicht gut: Es wird ein gewichteter Durchschnitt benötigt. Und natürlich ist es ‚ nicht möglich, eine gute Antwort auf Ihre Frage zur “ SD für den summierten Durchschnitt “ bis klar ist, was der “ summierte Durchschnitt “ ist und was er darstellen soll. Bitte klären Sie das für uns.
  • @whuber Ich habe ein Beispiel zur Verdeutlichung hinzugefügt. Mathematisch glaube ich, dass die Summe der Durchschnittswerte den monatlichen Durchschnittszeiten 12 entspricht.
  • Ja, klonq, das ist eine sehr vernünftige Anfrage. Diese Antworten wurden jedoch von ihrem Eigentümer und nicht von der Community gelöscht. Um ihren Wert zu erhalten, habe ich hier versucht, die Schlüsselideen, die sich aus diesen Antworten und ihren Kommentaren ergeben, weiterzugeben. Übrigens sind Ihre letzten Änderungen sehr hilfreich: Leute sehen gerne Beispieldaten.
  • Sicherlich kann die Mittelwertbildung der Varianz und damit die Berechnung der durchschnittlichen Standardabweichung ‚ nicht die sein ganze Antwort! Dies alles ist die durchschnittliche Varianz bei der Messung der Leistungsabgabe innerhalb eines einzelnen Monats. Dies ist ein guter Anfang, um eine genaue Messung des Messfehlers zu erhalten, aber ‚ muss diese Standardabweichung von 232 nicht in irgendeiner Weise mit der intermonatlichen Variation der Leistungsabgabe kombiniert werden. Das heißt, ich denke, dass die am Ende resultierende Standardabweichung für den Grand Mean etwas höher als 232 sein sollte, wenn Sie den kombinierten Messfehler sowohl innerhalb eines jeden Monats als auch der BET

berücksichtigen

Antwort

Kurze Antwort: Sie mitteln die Abweichungen ; Dann können Sie eine Quadratwurzel ziehen, um den Durchschnitt Standardabweichung zu erhalten.

Beispiel

Month MWh StdDev Variance ========== ===== ====== ======== January 927 333 110889 February 1234 250 62500 March 1032 301 90601 April 876 204 41616 May 865 165 27225 June 750 263 69169 July 780 280 78400 August 690 98 9604 September 730 76 5776 October 821 240 57600 November 803 178 31684 December 850 250 62500 =========== ===== ======= ======= Total 10358 647564 ÷12 863 232 53964 

Und dann ist die durchschnittliche Standardabweichung sqrt(53,964) = 232


Von Summe normalverteilter Zufallsvariablen :

Wenn $ X $ und $ Y $ unabhängige Zufallsvariablen sind, die normalverteilt sind (und daher auch gemeinsam), dann ist ihre Summe auch normalverteilt

… die Summe zweier unabhängiger Normalvariablen Verteilte Zufallsvariablen sind normal, wobei der Mittelwert die Summe der beiden Mittelwerte und die Varianz die Summe der beiden Varianzen ist.

Und von Wolfram Alpha „s Normale Summenverteilung :

Erstaunlicherweise die Verteilung einer Summe von zwei normalverteilte unabhängige Variablen $ X $ und $ Y $ mit Mitteln und v Arianzen $ (\ mu_X, \ sigma_X ^ 2) $ und $ (\ mu_Y, \ sigma_Y ^ 2) $ sind jeweils eine andere Normalverteilung

$$ P_ {X + Y} (u) = \ frac {1} {\ sqrt {2 \ pi (\ sigma_X ^ 2 + \ sigma_Y ^ 2)}} e ^ {- [u – (\ mu_X + \ mu_Y)] ^ 2 / [2 (\ sigma_X ^ 2 + \ sigma_Y ^ 2)]} $$

mit dem Mittelwert

$$ \ mu_ {X + Y} = \ mu_X + \ mu_Y $$

und der Varianz

$$ \ sigma_ {X + Y} ^ 2 = \ sigma_X ^ 2 + \ sigma_Y ^ 2 $$

Für Ihre Daten:

  • Summe: 10,358 MWh
  • Varianz: 647,564
  • Standardabweichung: 804.71 ( sqrt(647564) )

Geben Sie hier die Bildbeschreibung ein

Um Ihre Frage zu beantworten:

  • So „summieren“ Sie eine Standardabweichung ?
  • Sie summieren sie quadratisch:

    s = sqrt(s1^2 + s2^2 + ... + s12^2) 

Konzeptionell summieren Sie die Varianzen Nehmen Sie dann die Quadratwurzel, um die Standardabweichung zu erhalten.


Weil ich neugierig war, wollte ich die durchschnittliche monatliche mittlere Leistung wissen, und seine Standardabweichung . Durch Induktion benötigen wir 12 Normalverteilungen, die:

  • zu einem Mittelwert von 10,358
  • zu einer Varianz von 647,564

Das wären 12 durchschnittliche monatliche Verteilungen von:

  • Mittelwert von 10,358/12 = 863.16
  • Varianz von 647,564/12 = 53,963.6
  • Standardabweichung von sqrt(53963.6) = 232.3

Geben Sie hier die Bildbeschreibung ein.

Wir können unsere monatlichen Durchschnittsverteilungen überprüfen, indem wir sie 12 Mal addieren, um festzustellen, ob sie vorliegen gleich der jährlichen Verteilung:

  • Mittelwert: 863.16*12 = 10358 = 10,358 ( korrekt )
  • Varianz: 53963.6*12 = 647564 = 647,564 ( korrekt )

Hinweis : Ich überlasse es jemandem mit Kenntnissen der esoterischen Latexmathematik, meine Formelbilder zu konvertieren, und formula code in Stackexchange-formatierte Formeln.

Bearbeiten : Ich habe den Kurzschluss nach verschoben der Punkt, antworten Sie oben. Weil ich dies heute noch einmal tun musste, aber noch einmal überprüfen wollte, ob ich die Varianzen gemittelt habe.

Kommentare

  • Dies alles scheint davon auszugehen, dass die Monate nicht korreliert sind – haben Sie diese Annahme irgendwo explizit gemacht? Warum müssen wir auch die Normalverteilung einbringen? Wenn wir ‚ nur über Varianz sprechen, erscheint dies unnötig – siehe beispielsweise meine Antwort hier
  • @Marco Weil ich in Bildern besser denke und es alles leichter verständlich macht.
  • @Marco Ich glaube auch, dass diese Frage auf der (inzwischen nicht mehr existierenden) Website stats.stackexchange begann. Eine Wand aus Formeln ist weniger zugänglich als einfachere, grafische, weniger strenge Behandlungen.
  • Ich bezweifle, dass dies richtig ist. Stellen Sie sich zwei Datensätze mit jeweils nur einer Messung vor. Ihre Varianz jedes Satzes ist 0, aber der Satz beider Messungen hat eine Varianz größer als 0, wenn sich die Datenpunkte unterscheiden.
  • @Njol, ich denke, dass ‚ s warum wir annehmen, dass alle Variablen eine Normalverteilung haben. Und wir können es hier tun, weil wir über physikalische Messungen sprechen. In Ihrem Beispiel sind beide Variablen nicht normal verteilt.

Antwort

Dies ist eine alte Frage, aber die Antwort wurde akzeptiert ist nicht richtig oder vollständig. Der Benutzer möchte die Standardabweichung über 12-Monats-Daten berechnen, wobei der Mittelwert und die Standardabweichung bereits über jeden Monat berechnet werden. Unter der Annahme, dass die Anzahl der Stichproben in jedem Monat gleich ist, ist es möglich, den Stichprobenmittelwert und die Abweichung über das Jahr aus den Daten jedes Monats zu berechnen. Der Einfachheit halber nehmen wir an, dass wir zwei Datensätze haben:

$ X = \ {x_1, …. x_N \} $

$ Y. = \ {y_1, …., y_N \} $

mit bekannten Werten für Stichprobenmittelwert und Stichprobenvarianz, $ \ mu_x $ , $ \ mu_y $ , $ \ sigma ^ 2_x $ , $ \ sigma ^ 2_y $ .

Nun wollen wir die gleichen Schätzungen für

$ Z berechnen = \ {x_1, …., x_N, y_1, …, y_N \} $ .

Betrachten Sie, dass $ \ mu_x $ , $ \ sigma ^ 2_x $ werden berechnet als:

$ \ mu_x = \ frac {\ sum ^ N_ {i = 1} x_i} {N} $

$ \ sigma ^ 2_x = \ frac {\ sum ^ N_ {i = 1} x ^ 2_i} {N} – \ mu ^ 2_x $

Um den Mittelwert und die Varianz über die Gesamtmenge abzuschätzen, müssen wir Folgendes berechnen:

$ \ mu_z = \ frac {\ sum ^ N_ {i = 1} x_i + \ sum ^ N_ {i = 1} y_i} {2N} = (\ mu_x + \ mu_y) / 2 $ , die in der akzeptierten Antwort angegeben ist. Aus Gründen der Varianz ist die Geschichte jedoch anders:

$ \ sigma ^ 2_z = \ frac {\ sum ^ N_ {i = 1} x ^ 2_i + \ sum ^ N_ {i = 1} y ^ 2_i} {2N} – \ mu ^ 2_z $

$ \ sigma ^ 2_z = \ frac {1 } {2} (\ frac {\ sum ^ N_ {i = 1} x ^ 2_i} {N} – \ mu ^ 2_x + \ frac {\ sum ^ N_ {i = 1} y ^ 2_i} {N} – \ mu ^ 2_y) + \ frac {1} {2} (\ mu ^ 2_x + \ mu ^ 2_y) – (\ frac {\ mu_x + \ mu_y} {2}) ^ 2 $

$ \ sigma ^ 2_z = \ frac {1} {2} (\ sigma ^ 2_x + \ sigma ^ 2_y) + (\ frac {\ mu_x- \ mu_y} {2} ) ^ 2 $

Wenn Sie also die Varianz über jede Teilmenge haben und die Varianz über die gesamte Menge wollen, können Sie die Varianzen jeder Teilmenge mitteln, wenn alle den gleichen Mittelwert haben. Andernfalls müssen Sie die Varianz des Mittelwerts jeder Teilmenge addieren.

Nehmen wir an, wir produzieren in der ersten Jahreshälfte genau 1000 MWh pro Tag und in der zweiten Jahreshälfte 2000 MWh pro Tag. Dann der Mittelwert und die Varianz der Energieerzeugung in der ersten und Die Sekundenhälfte ist 1000 und 2000 für den Mittelwert und die Varianz ist 0 für beide Hälften. Nun gibt es zwei verschiedene Dinge, die uns interessieren könnten:

1- Wir wollen die Varianz der Energieerzeugung über das ganze Jahr berechnen : Dann erreichen wir durch Mitteln der beiden Varianzen Null, was seit der Energie pro Tag über das ganze Jahr nicht korrekt ist Jahr ist nicht konstant. In diesem Fall müssen wir die Varianz aller Mittelwerte aus jeder Teilmenge addieren. Mathematisch ist in diesem Fall die interessierende Zufallsvariable die Energieerzeugung pro Tag. Wir haben Stichprobenstatistiken über Teilmengen und möchten die Stichprobe berechnen Statistiken über einen längeren Zeitraum.

2- Wir möchten die Varianz der Energieerzeugung pro Jahr berechnen: Mit anderen Worten, wir sind daran interessiert, wie stark sich die Energieerzeugung von einem Jahr zum anderen ändert. In diesem Fall führt die Mittelung der Varianz zu der richtigen Antwort, die 0 ist, da wir in jedem Jahr durchschnittlich genau 1500 MHW produzieren. In diesem Fall ist die interessierende Zufallsvariable mathematisch der Durchschnitt der Energieerzeugung pro Tag, wobei die Mittelung über das ganze Jahr erfolgt.

Kommentare

  • Schöne Antwort. Meiner Meinung nach hängt die Berechnung davon ab, wie Sie die resultierende SD präsentieren möchten (und welche Hypothese Sie mit dieser SD ansprechen möchten, wenn Sie versuchen, sie mit einem anderen Windpark usw. zu vergleichen).

Antwort

Ich möchte noch einmal die Unrichtigkeit in einem Teil der akzeptierten Antwort hervorheben. Der Wortlaut der Frage führt zu Verwirrung.

Die Frage hat Durchschnitt und StdDev eines jeden Monats, aber es ist unklar, welche Art von Teilmenge verwendet wird. Ist es der Durchschnitt von 1 Windkraftanlage des gesamten Betriebs oder der Tagesdurchschnitt des gesamten Betriebs? Wenn es sich um den Tagesdurchschnitt für jeden Monat handelt, können Sie den Monatsdurchschnitt nicht addieren, um den Jahresdurchschnitt zu erhalten, da sie nicht denselben Nenner haben. Wenn es sich um den Einheitendurchschnitt handelt, sollte in der Frage

angegeben werden. Wir können sagen, dass im durchschnittlichen Jahr Jede Turbine in des Windparks erzeugt 10.358 MWh, …

Anstelle von

Wir können sagen, dass der Windpark im durchschnittlichen Jahr 10.358 MWh produziert, …

Darüber hinaus ist Die Standardabweichung oder Varianz ist der Vergleich mit dem eigenen Durchschnitt der Menge. Es enthält KEINE Informationen zum Durchschnitt seiner übergeordneten Menge (der größeren Menge, zu der die berechnete Menge gehört).

Varianzvisualisierung

Das Bild ist nicht unbedingt sehr präzise, aber es ist vermittelt die allgemeine Idee. Stellen wir uns die Ausgabe eines Windparks wie im Bild vor. Wie Sie sehen können, hat die “ lokale “ Varianz nichts zu tun Machen Sie mit der “ globalen “ Varianz, unabhängig davon, wie Sie diese addieren oder multiplizieren. Wenn Sie die lokale “ Abweichungen zusammen sind im Vergleich zu “ global “ Varianz. Sie können die Varianz des Jahres nicht mit einer Varianz von 2 halben Jahren vorhersagen. Wenn also in der akzeptierten Antwort die Summenberechnung korrekt ist, die Division durch 12, um die monatliche Zahl zu erhalten, bedeutet nichts. . Von den drei Abschnitten sind der erste und der letzte Abschnitt falsch, der zweite ist richtig.

Wiederum „Eine sehr falsche Anwendung, bitte folgen Sie ihr nicht, sonst geraten Sie in Schwierigkeiten. Berechnen Sie einfach das Ganze und verwenden Sie die jährliche / monatliche Gesamtleistung jeder Einheit als Datenpunkte, je nachdem, ob Sie eine jährliche oder eine monatliche Zahl wünschen. Dies sollte die richtige Antwort sein. Sie wollen wahrscheinlich so etwas. Dies sind meine zufällig generierten Zahlen. Wenn Sie die Daten haben, sollte das Ergebnis in Zelle O2 Ihre Antwort sein.

Geben Sie hier die Bildbeschreibung ein

Kommentare

  • Vielen Dank für das Bild, das mir sehr geholfen hat zu verstehen, warum die akzeptierte Antwort unvollständig ist und möglicherweise sogar falsch liegen. Sie haben es sehr gut erklärt, danke!
  • Dies zeigt die Gefahr einer Abstimmung. Die Leute, die wählen, sind die Leute, die ‚ die Antwort nicht kennen. Im Gegensatz zur Codierung sind die Personen, die abstimmen, Personen, die den Code zum Laufen bringen. Je mehr Stimmen, desto besser die Antwort.Für Statistik / Mathematik bedeutet mehr Stimmen nur, dass ‚ ansprechender ist.

Antwort

TL; DR

Bei mehreren Tagen und für jeden Tag erhalten wir den Durchschnitt, die Stichprobe StdDev und die Anzahl der Stichproben, bezeichnet als: $$ \ mu_d, \ \ sigma_d, \ N_d $$ Wir möchten den Durchschnitt und die Stichprobe StdDev über alle Tage berechnen.

Der Durchschnitt ist einfach ein gewichteter Durchschnitt: $$ \ mu = \ frac {\ sum {\ mu_dN_d}} {\ sum {N_d}} = \ frac {\ sum {\ mu_dN_d}} {N} $$

Beispiel StdDev ist dieses Ding: $$ \ sigma = \ sqrt {\ frac {\ sum_ {d} {(\ sigma_d ^ 2 (N_d-1) + N_d (\ mu- \ mu_d) ^ 2})} {N-1}} $$ Wobei Index d bezeichnet einen Tag, an dem wir Durchschnitt, Stichprobe StdDev und Anzahl der Stichproben für gesammelt haben.

Details

Wir hatten ein ähnliches Problem, bei dem wir einen Prozess hatten, der einen täglichen Durchschnitt berechnet und Beispiel StdDev und speichert es neben der Anzahl der täglichen Proben. Mit dieser Eingabe mussten wir einen wöchentlichen / monatlichen Durchschnitt und StdDev berechnen. Die Anzahl der Proben pro Tag war in unserem Fall nicht konstant.

Bezeichnen Sie den Durchschnitt, Probe StdDev und Anzahl der Stichproben des gesamten Satzes als: $$ \ mu, \ \ sigma \ und \ N \ $$ Und für Tag d bezeichnen den Durchschnitt, die Stichprobe StdDev und die Anzahl der Stichproben als: $$ \ mu_d, \ \ sigma_d, \ N_d $$ Die Berechnung des Durchschnitts der gesamten Menge ist einfach ein gewichteter Durchschnitt der Tage. „Betroffene Durchschnittswerte: $$ \ mu = \ frac {\ sum {\ mu_dN_d} } {\ sum {N_d}} = \ frac {\ sum {\ mu_dN_d}} {N} $$ Bei der Betrachtung von Sample StdDev sind die Dinge jedoch viel komplizierter. Für das Beispiel eines Tages StdDev haben wir: $$ \ sigma_d = \ sqrt {\ frac {\ sum_ {N_d} (x_j- \ mu_d) ^ 2} {N_d-1} } $$ Zuerst ein bisschen aufräumen: $$ \ sigma_d ^ 2 (N_d-1) = \ sum_ {N_d} (x_j- \ mu_d) ^ 2 $ $ Schauen wir uns den rechten Term der obigen Gleichung an. Wenn wir von dieser Summe zu der folgenden Summe pro Tag gelangen können: $$ \ sum_ {N_d} {(x_j- \ mu) ^ 2} $$ , dann Summation über Die Tage geben uns das, wonach wir suchen, da die Tage unzusammenhängend sind und die gesamte Menge abdecken: $$ \ sum_ {d} {\ sum_ {N_d} {(x_j- \ mu ) ^ 2}} = \ sum_ {N} {(x_j- \ mu) ^ 2} $$ Der Einblick, der vom täglichen StdDev zum StdDev des gesamten Sets kommt, besteht darin, zu bemerken, dass wir dies nicht tun Haben Sie die täglichen Proben, Wir haben die Summe der täglichen Proben durch den täglichen Durchschnitt . Angesichts dieser Einsicht arbeiten wir am rechten Term der obigen Gleichung: $$ \ sum_ {N_d} (x_j- \ mu_d) ^ 2 = \ sum_ {N_d} {(x_j ^ 2-2x_j \ mu_d + \ mu_d ^ 2)} = \\ = \ sum_ {N_d} {(x_j ^ 2-2x_j \ mu_d + \ mu_d ^ 2)} + (\ sum_ {N_d} {\ mu ^ 2} – \ sum_ {N_d} {\ mu ^ 2}) + (2 \ sum_ {N_d} {x_j (\ mu- \ mu_d}) – 2 \ sum_ {N_d} {x_j (\ mu- \ mu_d}) ) $$ Zu diesem Zeitpunkt haben wir nichts anderes getan, als Terme zu addieren und zu subtrahieren, die die Gleichung auf Null halten, wobei die Gleichung gleich bleibt Summierungen für Spaß und Gewinn: $$ \ require {cancel} = \ sum_ {N_d} {(x_j ^ 2-2x_j (\ cancel {\ mu_d} + \ mu- \ cancel { \ mu_d}) + \ mu ^ 2)} + \ sum_ {N_d} {\ mu_d ^ 2} – \ sum_ {N_d} {\ mu ^ 2} +2 \ sum_ {N_d} {x_j (\ mu- \ mu_d }) $$ Summierungen sind über j , sodass Summationsterme, die nicht von j abhängig sind, einfach mit multipliziert werden können N d : $$ = \ sum_ {N_d} {(x_j ^ 2-2x_j \ mu + \ mu ^ 2)} + N_d \ mu_d ^ 2- N_d \ mu ^ 2 + 2 \ sum_ {N_d} {x_j (\ mu- \ mu_d)} $$ Und wir nähern uns: $$ = \ sum_ {N_d} {(x_j- \ mu) ^ 2} + N_d \ mu_d ^ 2-N_d \ mu ^ 2 + 2 \ sum_ {N_d} {x_j (\ mu- \ mu_d)} $$ Lassen Sie uns nun den Begriff ganz rechts behandeln, da wir x j nicht verwenden können direkt, aber wir können seine Summe verwenden, da wir den Durchschnitt dieses Tages haben. Multiplizieren und dividieren Sie einfach durch N d , um den Durchschnitt zu erhalten: $$ = \ sum_ {N_d} {(x_j- \ mu) ^ 2} + N_d \ mu_d ^ 2-N_d \ mu ^ 2 + 2 (\ mu- \ mu_d) {N_d} (\ frac {1} {N_d} \ sum_ {N_d} {x_j}) \\ = \ sum_ {N_d} {(x_j – \ mu) ^ 2} + N_d \ mu_d ^ 2-N_d \ mu ^ 2 + 2 (\ mu- \ mu_d) {N_d} \ mu_d $$ An diesem Punkt haben wir die Summe, die wir berechnen müssen Die Stichprobe StdDev des gesamten Satzes und alle anderen Begriffe sind uns bekannte Mengen, nämlich die Statistik des Tages und die Anzahl der Stichproben.Schließen wir es wieder an den obigen Bereinigungsschritt an: $$ \ sigma_d ^ 2 (N_d-1) = \ sum_ {N_d} {(x_j- \ mu) ^ 2 } + N_d \ mu_d ^ 2-N_d \ mu ^ 2 + 2 (\ mu- \ mu_d) {N_d} \ mu_d \\ \ leftrightarrow \ \ sigma_d ^ 2 (N_d-1) -N_d \ mu_d ^ 2 + N_d \ mu ^ 2-2N_d \ mu_d (\ mu- \ mu_d) = \ sum_ {N_d} {(x_j- \ mu) ^ 2} \\ \ leftrightarrow \ \ sigma_d ^ 2 (N_d-1) + N_d (\ mu- \ mu_d) ^ 2 = \ sum_ {N_d} {(x_j- \ mu) ^ 2} $$ Wir sind jetzt bereit, das Beispiel StdDev der Menge zu berechnen: $$ \ sigma = \ sqrt {\ frac {\ sum_ {N} (x_j- \ mu) ^ 2} {N-1}} \\ = \ sqrt {\ frac {\ sum_ {d} {\ sum_ {N_d } (x_j- \ mu) ^ 2}} {N-1}} \\ = \ sqrt {\ frac {\ sum_ {d} {(\ sigma_d ^ 2 (N_d-1) + N_d (\ mu- \ mu_d) ) ^ 2})} {N-1}} $$

Kommentare

  • Ihre Notation ist für mich etwas verwirrend ‚ macht nicht klar, was bedeutet, dass & Standardabweichungen bekannte (angenommene) Parameter sind & Dies sind Stichprobenschätzungen.
  • Bekannt sind Nd, Mu-d, Sigma-d. Wir müssen N, Mu, Sigma berechnen. Das Berechnen von N und Mu ist trivial, Sigma ist die Beteiligte.

Antwort

Ich glaube, was Sie können Seien Sie jedoch wirklich interessiert an dem Standardfehler und nicht an der Standardabweichung.

Der Standardfehler des Mittelwerts (SEM) ist der Standard Abweichung der Schätzung des Stichprobenmittelwerts eines Populationsmittelwerts, und dies gibt Ihnen ein Maß dafür, wie gut Ihre jährliche MWh-Schätzung ist.

Es ist sehr einfach zu berechnen: Wenn Sie $ n verwendet haben $ Stichproben Um Ihre monatlichen MWh-Durchschnittswerte und Standardabweichungen zu erhalten, berechnen Sie einfach die Standardabweichung wie von @IanBoyd vorgeschlagen und normalisieren sie anhand der Gesamtgröße Ihrer Stichprobe. Das heißt,
$$ s = \ frac {\ sqrt {s_1 ^ 2 + s_2 ^ 2 + \ ldots + s_ {12} ^ 2}} {\ sqrt {12 \ times n}} $$

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.