Ce descriu pandele () valorile percentile despre datele noastre?

Să spunem că acesta este cadrul meu de date

x=[0.09, 0.95, 0.93, 0.93, 0.34, 0.29, 0.14, 0.23, 0.91, 0.31, 0.62, 0.29, 0.71, 0.26, 0.79, 0.3 , 0.1 , 0.73, 0.63, 0.61] x=pd.DataFrame(x) 

Când x.describe() acest cadru de date obținem rezultatul ca acesta

>>> x.describe() 0 count 20.000000 mean 0.50800 std 0.30277 min 0.09000 25% 0.28250 50% 0.47500 75% 0.74500 max 0.95000 

Ce se înțelege prin valorile 25,50 și 75 percentile? Se spune că 25% din valorile din x sunt mai mici de 0,28250?

Comentarii

  • Mi-am actualizat răspunsul. ' mă voi bucura dacă aruncați o privire, deoarece presupun că ilustrația mea anterioară a fost înșelătoare.

Răspuns

Acesta descrie distribuția datelor dvs. 50 ar trebui să fie o valoare care descrie „mijlocul” datelor, cunoscut și sub denumirea de mediană. 25, 75 este marginea trimestrului superior / inferior al datelor. Puteți să vă faceți o idee despre cât de înclinate sunt datele dvs. Rețineți că media este mai mare decât mediana, ceea ce înseamnă că datele dvs. sunt corect înclinate .

Încercați:

import pandas as pd x=[1,2,3,4,5] x=pd.DataFrame(x) x.describe() 

Răspuns

Mai întâi, aparent, tabelul de descriere nu este descrierea matricei dvs. x.

apoi, trebuie să sortați matricea (x), apoi să calculați locația procentului (care în metoda .describe p este 0,25, 0,5 și 0,75),

în exemplul dvs.:

sorted_x = [0.09, 0.1 , 0.14, 0.23, 0.26, 0.29, 0.29, 0.3 , 0.31, 0.34, 0.61, 0.62, 0.63, 0.71, 0.73, 0.79, 0.91, 0.93, 0.93, 0.95] 

și elementul în care este situat în procentul 25 se realizează atunci când împărțim lista la 25 și 75 la sută, | afișat este de 25% aici:

sorted_x = [0.09, 0.1 , 0.14, 0.23, 0.26,**|** 0.29, 0.29, 0.3 , 0.31, 0.34, 0.61, 0.62, 0.63, 0.71, 0.73, 0.79, 0.91, 0.93, 0.93, 0.95] 

Deci valoarea este calculată ca 0,26 $ + (0,29-0,26) * \ frac {3} {4} $ care este egal cu 0,28250000000000003 $ $

În general Percentila vă oferă datele reale pe care le se află în acel procent din date (fără îndoială, după sortarea matricei)

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *