ESTADÍSTICA Objectius - losclicos.files.wordpress.com · Els graus de cada sector es calculen amb...
Transcript of ESTADÍSTICA Objectius - losclicos.files.wordpress.com · Els graus de cada sector es calculen amb...
Departament de Matemàtiques Escola Tècnica Professional del Clot
1
ESTADÍSTICA
Objectius
Freqüències d’una sèrie estadística. Càlcul i representació.
Estudi dels paràmetres estadístics: o Mesures de centralització:
Mitjana aritmètica Mediana Moda
o Paràmetres de dispersió: Recorregut Desviació mitjana Variància Desviació típica
1. ESTADÍSTICA DESCRIPTIVA
L’estadística és la ciència que proporciona mètodes pel tractament de les dades,
permetent comprovar la verificació o no de certes relacions o lleis.
ESTADÍSTICA DESCRIPTIVA
La finalitat és recollir dades d’un procés aleatori, classificar-les, representar-les
gràficament i reduir-les a nombres estadístics.
Per fer l’estudi necessitem uns conceptes bàsics:
Població: conjunt sobre el qual es realitza l’estudi estadístic.
Individu: és qualsevol element del conjunt població.
Mostra: és el conjunt d’alguns individus d’una població que és representatiu
d’aquesta.
Caràcter: és l’aspecte, el fenomen o la qualitat que s’estudia en cadascun del
individus de la mostra.
Tipus de caràcters:
o Qualitatius: (qualitats) sexe, professió, ... S’anomenen atributs. Poden
ser:
Nominals: no són ordenables, sexe, ...
Ordinals: es poden ordenar: notes,...
o Quantitatius: (nombres) edats, alçades,.... S’anomenen variables
estadístiques. Poden ser:
Discretes: només poden prendre determinats valors. Ex: el
nombre de fills,...
Contínues: poden prendre tots els valors d’un interval. Ex:
alçades.
Departament de Matemàtiques Escola Tècnica Professional del Clot
2
2. FREQÜÈNCIES
Mitjançant un procés s’estudia un caràcter d’una població. Aquests procés llança unes
dades, repetides o no, que s’anomenen sèrie estadística. Quant organitzem i agrupem
aquestes dades apareixen els conceptes relacionats amb freqüències:
Freqüència absoluta (ni): corresponent a la dada xi, d’una sèrie estadística, és
el nombre de vegades que apareix aquesta dada ni.
Freqüència relativa (fi): és el quocient entre la freqüència absoluta d’xi (ni) i el
nombre total de dades de la sèrie estadística (n).
n
nf i
i k
nnnn ...21
Freqüència absoluta acumulada (Ni): respecte de la dada xi és la suma de les
freqüències absolutes de totes les dades, fins la xi inclosa. Si són qualitatives
han d’estar ordenades. i
iiii
nnnnN1
21... Si hi ha k dades nN
k
Freqüència relativa acumulada (Fi): respecte a la dada xi és la suma de les
freqüències relatives de totes les dades, fins la xi inclosa. Si són qualitatives han
d’estar ordenades. i
iiii
ffffF1
21... Si hi ha k dades 1
kF
Intervals de classe: S la variable és contínua s’agafen intervals normalment de la
mateixa amplitud. Poden ser [ ) o ( ].
La marca de classe és el punt mig de cada interval.
Taula de freqüències
Per a una lectura més fàcil d’una sèrie estadística, les freqüències s’ordenen en taules:
xi Freqüències ordinàries Freqüències acumulades
Absoluta ni
Relativa fi
Absoluta Ni
Relativa Fi
Suma (n)
Departament de Matemàtiques Escola Tècnica Professional del Clot
3
Exemple 1
Al mesurar el diàmetre de 10 cargols anotem el seu valor. Trobar totes les freqüències:
1,2 cm 1,4 cm 1 cm 1,2 cm 0,8 cm
1,4 cm 1,2 cm 1 cm 1,4 cm 1,2 cm
xi Freqüències ordinàries Freqüències acumulades
Absoluta ni
Relativa fi
Absoluta Ni
Relativa Fi
0,8 1 1/10=0.1 1 0.1
1 2 2/10=0.2 3 0.3
1.2 4 4/10=0.4 7 0.7
1.4 3 3/10=0.3 10 1
10 Exemple 2
Al agafar 8 caramels anotem el seu color:
Groc, vermell, groc, blau, vermell, verd, groc, vermell.
Fer la taula de freqüències:
Color del caramel
Freqüències ordinàries Freqüències acumulades
Absoluta ni
Relativa fi
Absoluta Ni
Relativa Fi
Groc 3 3/8=0.375 3 0.375
Vermell 3 3/8=0.375 6 0.75
Blau 1 1/8=0.125 7 0.875
verd 1 1/8=0.125 8 1
8 Exercici 1
Completa la següent taula de freqüències, feta amb un estudi sobre el nombre de fills
en 50 famílies en Barcelona l’any 2001:
Nombre de fills xi
Freqüències ordinàries
Absoluta ni
Relativa fi
0 16 0,32
1
2 13
3 3
4 0,02
Departament de Matemàtiques Escola Tècnica Professional del Clot
4
Solució:
n =50
n
nf 4
4
15002.044 nfn
17)131316(502n
La resta normalment.
Exercici 2
Les notes de 25 alumnes en un cert control han estat:
5,8 5,3 4,8 8,9 8 7,8 7,5 6,8 4 7,5 4,5 5 5
8,3 5 8,3 5,8 10 7,8 6,5 9 10 8,3 4,8 8,9
Escriu la taula corresponent agrupant en classes d’amplitud 1 punt amb les freqüències
absolutes i relatives de cada classe.
Freqüències ordinàries Freqüències acumulades
Notes xi Absoluta
ni Relativa
fi Absoluta
Ni Relativa
Fi
(3,4]
(4,5]
(5,6]
(6,7]
(7,8]
(8,9]
(9,10]
Solució: Freqüències ordinàries Freqüències acumulades
Notes xi Absoluta
ni Relativa
fi Absoluta
Ni Relativa
Fi
(3,4] 3,5 1 0,04 1 0,04
(4,5] 4,5 6 0,24 7 0,28
(5,6] 5,5 3 0,12 10 0,40
(6,7] 6,5 2 0,08 12 0,48
(7,8] 7,5 5 0,2 17 0,68
(8,9] 8,5 6 0,24 23 0,92
(9,10] 9,5 2 0,08 25 1
25
Nombre de fills xi
Freqüències ordinàries
Absoluta ni
Relativa fi
0 16 0,32
1 17 0,34
2 13 0,26
3 3 0,06
4 1 0,02
50
Departament de Matemàtiques Escola Tècnica Professional del Clot
5
3. REPRESENTACIONS GRAFIQUES
La informació sobre les variables es pot resumir en gràfics:
Diagrama de barres: sobre l’eix de les abscisses es representen els valors
possibles de la variable estadística. Sobre cada valor s’aixeca un segment
(barra) que representa la freqüència absoluta, la relativa o la acumulada.
Polígon de freqüències: és la línia formada per la unió de segments dels
extrems de les barres de distribució de la sèrie estadística.
Histograma: rectangles amb la base l’amplitud de la classe i l’alçada la freqüència absoluta o relativa. El polígon de freqüències s’obté unint els punts mitjos de la base superior dels rectangles.
Diagrama de sectors: és un cercle en el qual dibuixem sectors l’àrea del qual és proporcional a la freqüència de cada dada de la sèrie estadística.
Els graus de cada sector es calculen amb la fórmula: n
ni
i
360
Pictograma: dibuixos que fan referència al caràcter que s’està estudiant. La
mida és proporcional a la freqüència que representen.
Cartogrames: gràfics realitzats sobre mapes.
Exemple 3
En una comarca la població té les següents ocupacions:
Població ocupada Persones
Agricultura 450
Indústria 850
Construcció 382
Serveis 1200
2882
Dibuixa el diagrama de barres i el polígon de freqüències
Departament de Matemàtiques Escola Tècnica Professional del Clot
6
Exemple 4
Es fa un test a 20 persones i s’obtenen les puntuacions següents:
45 36 23 52 23
38 45 38 32 38
52 32 36 45 52
38 23 45 32 38
Dibuixa l’histograma i el diagrama de freqüències:
Puntuació xi ni
(20,30] 25 3
(30,40] 35 10
(40,50] 45 4
(50,60] 55 3
20
0
200
400
600
800
1000
1200
1400
Agricultura Indústria Construcció Serveis
Fre
qü
èn
cie
s ab
solu
tes
Sector
Ocupació per sectors
(20
,30
]
(30
,40
]
(40
,50
]
(50
,60
]
2
4
6
8
10
Intervals
Freq
üèn
cies
ab
solu
tes
Departament de Matemàtiques Escola Tècnica Professional del Clot
7
4. PARÀMETRES ESTADÍSTICS
S’utilitzen per comparar variables estadístiques (qualitatives).
Es poden comparar els valors centrals (paràmetres de centralització) o les desviacions
respecte d’aquests valors (paràmetres de dispersió).
4.1 Paràmetres de centralització
a) Mitjana aritmètica (_
x ) : es calcula sumant tots els valors i dividint-los pel total
d’individus de la mostra.
n
nx
x
k
i
ii
1_
b) Mediana: és el valor central de la mostra un cop ordenats els valors. Es pot
calcular veient quin valor ocupa la posició 2
1n
Si n és parell es fa la mitjana entre els valors anterior i posterior. Si n és senar
és el valor de la posició exacte.
c) Moda: és el valor de la sèrie que té major freqüència absoluta. Pot tenir més
d’una moda (bimodal, trimodal, ...)
Per fer els càlculs es sol utilitzar una taula:
Exemple 5
El nombre de gols marcats per un equip en 30 partits de futbol han estat:
0 1 6 3 2 6 1 5 4 6
2 1 3 4 2 2 3 2 1 3
2 3 2 1 3 2 2 6 1 2
Calcula els paràmetres de centralització:
a) Mitjana aritmètica
b )Mediana
c) Moda.
ix in iN iinx
suma
suma
Departament de Matemàtiques Escola Tècnica Professional del Clot
8
a) Mitjana aritmètica:
7,230
811_
n
nx
x
k
i
ii
b) Mediana:
5,152
31
2
130
2
1n
c) Moda: 2
ix in iN iinx
0 1 1 0
1 6 7 6
2 10 17 20
3 6 23 18
4 2 25 8
5 1 26 5
6 4 30 24
30 81
Posició 15: 2
Posició 16: 2 Mediana: 2 gols
Mitjana aritmètica: 2,7 gols
Moda: 2 gols
Departament de Matemàtiques Escola Tècnica Professional del Clot
9
4.2 Paràmetres de dispersió
Amiden el grau de separació respecte d’una mesura central.
a) Recorregut: és la diferència entre els valors extrems de la variable.
b) Desviació mitjana (d ): és la mitjana de les desviacions dels valors respecte de
la mitjana de la distribució.
n
nxx
d
k
i
ii
1
_
c) Variància ( 2
): és la mitjana dels quadrats de les desviacions respecte de la
mitjana
2__
2
2_
1
2
1
2_
2
)(
xxxn
nx
n
nxxK
I
ii
k
i
ii
La variància és la mitjana dels quadrats menys el quadrat de la mitjana.
d) Desviació típica ( ): és l’arrel quadrada positiva de la variància.
Per fer els càlculs es sol utilitzar una taula:
ix in iinx _
xxi ii nxx_
ii nx 2
suma suma suma suma
Exemple 6
Les notes finals de matemàtiques d’un grup d’alumnes es recullen en la següent taula:
ix 2 3 4 5 6 7 8 9 10
in 3 2 7 14 10 12 5 3 2
Calcula els paràmetres de dispersió: recorregut, desviació mitjana, variància i desviació
típica.
Departament de Matemàtiques Escola Tècnica Professional del Clot
10
ix in iinx _
xxi ii nxx_
ii nx 2
2 3 6 3,87 11,61 12
3 2 6 2,87 5,74 18
4 7 28 1,87 13,09 112
5 14 70 0,87 12,18 350
6 10 60 0,13 1,3 360
7 12 84 1,13 13,56 588
8 5 40 2,13 10,65 320
9 3 27 3,13 9,39 243
10 2 20 4,13 8,26 200
58 341 85,78 2203
a) Recorregut: 10-2 =8 b) Desviació mitjana: prèviament s’ha de calcular la mitjana
87,558
3411_
n
nx
x
k
i
ii
47.158
74,851
_
n
nxx
d
k
i
ii
c) Variància:
2__
2
2_
1
2
1
2_
2
)(
xxxn
nx
n
nxxK
I
ii
k
i
ii
53,345,3498,3787.558
2203 2
2_
1
2
2 xn
nxK
I
ii
d) Desviació típica:
87,153,3
47,1d
87,1
53,32
Recorregut: 8
Departament de Matemàtiques Escola Tècnica Professional del Clot
11
Variables contínues
Si les variables són contínues es divideixen per intervals. Els valors de la columna ix
són les marques de classe i es tracten com una variable discreta.
La moda és l’interval que té una freqüència absoluta més gran.
La mediana :
o Si n és parell es calcula el valor de la posició 2
n
o Si n és senar es calcula el valor de la posició 2
1n
Per calcular el valor de la posició es fa una interpolació lineal.
Els altres paràmetres es calculen amb ix.
Exemple 7
Les alçades d’un grup d’alumnes són:
Alçades Alumnes
(155,160] 2
(160,165] 6
(165,170] 8
(170,175] 9
(175,180] 4
(180,185] 1
Determina la moda, la mediana, la mitjana i la desviació típica.
Alçades ix in iN iinx ii nx 2
(155,160] 157.5 2 2 315 49612,5
(160,165] 162.5 6 8 975 158437,5
(165,170] 167.5 8 16 1340 224450
(170,175] 172.5 9 25 1552,5 267806,25
(175,180] 177.5 4 29 710 126025
(180,185] 182.5 1 30 182,5 33306,5
5075 859637,75
Departament de Matemàtiques Escola Tècnica Professional del Clot
12
Moda: és l’interval (170,175].
La mediana
n és parell, la posició és 152
30
2
n
8 → 165
16 →170
15 →?
La mitjana aritmètica:
166,16930
50751_
n
nx
x
k
i
ii
166,169_
x
Desviació típica: Primer necessito calcular la variància:
45,37166,16930
75,859637 2
2_
1
2
2 xn
nxK
I
ii
La desviació típica:
12,645,37
170 −165 = 5
16 − 8 = 8
15 – 8 = 7
5
7 1
78
5 p
375.48
75p
375.169375.4165
p
Mediana: 169,375 cm
La mitjana aritmètica: 169,166 cm
Desviació típica: 6,12 cm
Moda: (170,175].