Scrigroup - Documente si articole

Username / Parola inexistente      

Home Documente Upload Resurse Alte limbi doc  

CATEGORII DOCUMENTE





BulgaraCeha slovacaCroataEnglezaEstonaFinlandezaFranceza
GermanaItalianaLetonaLituanianaMaghiaraOlandezaPoloneza
SarbaSlovenaSpaniolaSuedezaTurcaUcraineana

BiografiaBiologiaBotanicaChimicaComputerComunicazioneCostruzioneDiritto
EducazioneElettronicaFisicaGeografiaGiochiGrammaticaIngegneriaLetteratura
LibriMarketingMatematicaMedicinaMusicaNutrizionePsicologiaRicette
SociologiaStoriaVarie

La media aritmetica per variabili quantitative

matematica

+ Font mai mare | - Font mai mic







DOCUMENTE SIMILARE

Trimite pe Messenger

La media aritmetica per variabili quantitative

Se le modalità sono classi non è possibile applicare direttamente le formula nota perché le modalità non sono numeri bensì intervalli. In questo caso occorre determinare un valore centrale per ogni classe.



In genere si considera la semisomma degli estremi dell'intervallo.

Es.: Classi di statura

Classi

Val. centr. xi

     fi

   xi fi

[155-164)

159.5

0.093

14.833

[164-169)

166.5

0.194

32.398

[169-174)

171.5

0.290

49.880

[174-179)

176.5

0.248

43.896

[179-184)

181.5

0.126

22.932

[184-194)

189

0.049

9.285

Totali

1.000

173.225

Quando le classi estreme sono aperte, il valore centrale viene scelto in altro modo, tenendo conto del problema specifico.

Lezione 4

Moda, Mediana e Quantili

Esistono indicatori di posizione che, per essere calcolati, non utilizzano tutti i dati a disposizione

(a differenza di quanto avveniva per le medie).

Il più semplice di tali indicatori è la MODA, definito come

la modalità con frequenza più elevata

Es. Per un collettivo di 28 studenti registriamo il comune di residenza: risulta

Comune

Freq. Ass.

 Latina

9

Velletri

6

Nettuno

3

Fondi

6

Sezze

4

Totale

28

Qui il carattere è il Comune di residenza e la modalità modale è Latina.

·      La moda non è necessariamente unica: se nell’esempio precedente anche Velletri avesse avuto una frequenza pari a 9 avremmo avuto due mode.

·      La moda è un indice molto rozzo perché non tiene conto di quello che avviene “dietro”: distribuzioni molto diverse potrebbero avere la stessa moda pur essendo sostanzialmente diverse

·      Può avere un comportamento contro intuitivo come dimostra l’esempio seguente

Es. 

X

1

2

3

4

5

Freq.

13

30

35

17

5

La moda è la modalità 3. Se ora spostiamo 20 unità dalla modalità 3 e le mettiamo alla modalità 5, otteniamo

X

1

2

3

4

5

Freq.

13

30

15

17

25

E’ innegabile che la distribuzione si è spostata verso valori più grandi ma la moda ora è 2 !!

Il caso di distribuzioni continue

In questo caso sappiamo che le modalità vengono raggruppate per classi.

Occorre allora determinare la classe modale che non necessariamente corrisponde a quella di maggiore frequenza: infatti, bisognerà tenere conto dell’ampiezza delle classi, così come abbiamo già visto a proposito dell’Istogramma.

Es.

X

[0,1)

[1,3)

[3,6)

[6,10)

[10,15]

Freq.

10

22

24

36

25

Fr./Am.

10

11

8

9

5

Qui la classe modale  non è [6,10) bensì  è [1,3).

In generale la classe modale è quella con maggiore  densità di frequenza.

La mediana




Un altro indicatore molto utile e molto usato è la mediana (Me). Essa può essere calcolata quando

·      Il carattere è quantitativo

·      Il carattere è qualitativo ordinabile

Occorre prima ordinare le osservazioni in modo che le modalità osservate risultino in ordine crescente e poi definire la mediana come

La modalità assunta dalla/e unità che occupano la posizione centrale

Es.  Si osserva il carattere numero di fratelli su un collettivo di 9 studenti e, dopo aver ordinato i valori si ha

1,2, 3, 4, 4, 5, 5, 6, 7

In questo caso n è dispari e la mediana è la modalità relativa all’unità che occupa la posizione (n+1)/2, ovvero, in questo caso la quinta: la mediana è quindi la modalità Me=4.

Quando n è pari non esiste una sola unità mediana, bensì 2. Infatti, se nell’esempio precedente aggiungiamo un’osservazione pari, ad esempio a 5, la distribuzione diventa

1,2, 3, 4, 4, 5, 5, 5, 6, 7

e le mediane sono ora le modalità osservate sulle unità che occupano le posizioni n/2 e n/2+1.

Questo problema è importante quando n  è piccolo ma perde importanza per grandi valori di n.

·      Il caso delle distribuzioni di frequenze

Quando la distribuzione è organizzata per frequenze, la mediana si calcola utilizzando la Funzione di ripartizione (o le Frequenze cumulate). La mediana è quella modalità xi per la quale risulta

·      F(xi-1)< 0.5

·      F(xi )³ 0.5

Esempio

X= Tit. di studio

         ni

Fi

Lic. Elementare

       6

0.3

Lic. Media

       2

0.4

Maturità

       6

0.7

Laurea

       6

1.0

Totale

      20

La mediana è dunque Me = Maturità perché la decima e la undicesima unità assumono entrambe questa modalità.

·      Il caso delle variabili continue

Quando le modalità sono raggruppate per classi occorre

·      Individuare la classe mediana

·      Assumere una uniforme distribuzione all’interno delle classi

·      Individuare esattamente la mediana all’interno della classe

In parole povere è sufficiente disegnare l’istogramma relativo alla distribuzione e tracciare una linea che divide in due l’area sottesa all’istogramma.

Es.: Classi di statura

Classi

Val. centrale

fi

Fi

[155-164)

159.5

0.093

0.093

[164-169)

166.5

0.194

0.287

[169-174)

171.5

0.290

0.577

[174-179)

176.5

0.248

0.825

[179-184)

181.5

0.126

0.951

[184-194)

189

0.049

1.000

Totali

1.000

La classe mediana è la classe [169-174). Assumendo una distribuzione uniforme nella classe occorre allora individuare il valore che lascia alla sua  sinistra esattamente il 50% delle unità. Il problema si risolve partendo dalla classe mediana (xi+1,xi] attraverso la formula

Me = xi-1 + (xi – xi-1)*(0.5 –F(xi-1)) / (F(xi)F(xi-1))

difficile da ricordare ma semplice da ricavare. Nell’esempio si ha

Me = 169 + 5*(0.5-0.287)/(0.577-0.287) =172.67

Caratteristiche della mediana

·      Me minimizza la somma degli scarti in valore assoluto. Per ogni valore reale d si ha

Si ÷ xi - Me÷ £ Si ÷ xi - d÷

·      Me è più robusta della media aritmetica m rispetto a valori anomali della distribuzione

Es.

Caso A:

1, 2, 2, 4, 6, 6, 7            Me = 4        m = 4.

Cambiando l’ultimo valore da 7 a 700 si ha

Caso B:

1, 2, 2, 4, 6, 6, 700        Me = 4        m = 180.25.

·      Può essere più facile ed economico calcolare Me piuttosto che m.

Es.: Dati di sopravvivenza.

Si osserva il tempo di durata di un insieme di 21 lampadine. Per calcolare il tempo medio occorre attendere che le 21 lampadine si rompano e calcolare il tempo medio. Per calcolare la mediana, invece, è sufficiente osservare le prime 11 “morti”.

I Quantili

Si può reinterpretare la mediana come la più piccola modalità che lascia alla sua sinistra il 50% delle unità statistiche.  Si può effettuare lo stesso ragionamento cercando di individuare la modalità che lascia alla sua sinistra una percentuale di unità statistiche pari ad una frequenza relativa p. In questo senso la mediana diventa il quantile di ordine p=1/2.

Più in generale si definisce quantile di ordine p la modalità xi tale che

·      F(xi-1)< p

·      F(xi )³ p

I quantili più utilizzati sono i percentili, soprattutto il 25-esimo, 50-esimo (mediana) e il 75-esimo

Tutte le proprietà della mediana si estendono naturalmente ai quantili.

 








Politica de confidentialitate

DISTRIBUIE DOCUMENTUL

Comentarii


Vizualizari: 1060
Importanta: rank

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Termeni si conditii de utilizare | Contact
© SCRIGROUP 2019 . All rights reserved

Distribuie URL

Adauga cod HTML in site