Statistica descriptiva: media, mediana, modalul, deviatia standard, IQR (interquartile range), tipuri de grafice |
Statistica descriptiva descrie datele dintr-un esantion. Masurarea tendintei centrale
Masurarea dispersiei
Ghid in folosirea masuratorilor pentru tendinta centrala Media este utilizata pentru date numerice si distributia simetrica a datelor Mediana este utilizata pentru date ordinale si distributii non-simetrice Modalul este utilizat pentru distributii bimodale Media geometrica este utilizata pentru observatii masurate pe o scala logaritmica
Ghid in folosirea masuratorilor pentru dispersie (imprastiere) SD se foloseste impreuna cu media pentru valori simetrice (normal distribuite) Percentilele si IQR sunt folosite :
IQR este folosit pentru a evidentia tendinta centrala a 50% din date indiferent de distributie Intervalul (range) este folosit pentru valori numerice pentru a evidentia valorile extreme Coeficientul de variatie este folosit cand se intentioneaza compararea distributiei numerice masurate pe scale diferite
Media Media aritmetica
Media geometrica
Mediana (“punctul de mijloc”) M = jumatatea distantei intre 2 medii (media a 2 valori medii pentru un numar dat de observatii) Se utilizeaza cind datele nu sunt simetrice (neuniform distribuite)
Media vs mediana m = M → date simetric distribuite (normal) m > M → date non-simetrice micsorate la dreapta (“subtiate”) m < M → date non-simetrice micsorate la stanga
![]() ![]() ![]()
Teorema limitei centrale Distributia mediei este aproximativ normala daca marimea esantionului este suficient de mare (n = 30), indiferent de distributia valorilor ale masuratorilor initiale
Modalul Cea mai frecventa aparitie a unui eveniment (valoarea care apare cel mai frecvent intr-un set de date) Se utilizeaza in special cand distributia este bimodala (care arata o populatie neomogena)
Intervalul (range) Intervalul = diferenta intre cea mai mare si cea mai mica observatie x є [a, b]; range = b-a; b > a; a,b є R Coeficientul de variatie = masoara imprastierea relativa a datelor si se aplica in testele de laborator si in procedurile de control ale calitatii CV = (SD/μ)100
Intervalul de incredere (confidence interval) Reprezinta un interval ce defineste un nivel maxim si unul minim, numite nivele de incredere cu o anumita probabilitate asociata Utilizat impreuna cu valoarea mediei sau RR (risk ratio), OR (odds ratio) CI = m +/- t SE; t – coeficientul de incredere (valoarea critica pentru distributia tip t), m – media esantionului, SE – eroarea standard CI - 90%, 95% (cel mai frecvent), 99% Cu cat esantionul este mai mare cu atat CI este mai mic
Deviatia (abaterea) standard Arata distributia valorilor populatiei in jurul mediei (imprastierea fata de medie) Se utilizeaza numai pentru valori uniform distribuite (simetrice) SD (σ) = √[∑(xi-μ)2/(n-1)] μ+/-σ include 68.2% din valori μ+/-2σ include 95.4% din valori μ+/-3σ include 99.7% din valori Eroarea standard : SE = SD/√n Variatia (variance) = SD2
![]()
Percentilele si IQR Percentila = procentul (%) de distributie < decat un numar particular Este folosita pentru a compara o valoare individuala cu un set de norme (o norma) IQR (interquartile range) – contine 50% din observatii IQR = percentila 75 – percentila 25 IQR contine mediana
Grafice folosite pentru vizualizarea datelor
![]()
|
Last Updated on Saturday, 18 April 2009 19:26 |
This site complies with the HONcode standard for trustworthy health information:
verify here.
Dr. Andrei Popescu - Artroscopie umar, ortopedie sportiva, chirurgia umarului