10.Estadística y Probabilidad
-
Upload
beatriz-arias -
Category
Documents
-
view
214 -
download
0
description
Transcript of 10.Estadística y Probabilidad
1
TEMA 10:
ESTADÍSTICA
Y
PROBABILIDAD
2
INTRODUCCIÓN
Objetivo: La estadística tiene por objeto el desarrollo de técnicas para el conocimiento numérico de
un conjunto de datos empíricos (recogidos mediante experimentos o encuestas).
Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de
nuestro estudio.
Muestra: Es un subconjunto, extraído de la población, cuyo estudio sirve para inferir características
de toda la población.
Individuo: Es cada uno de los elementos que forman la población o la muestra.
Caracteres estadísticos: pueden ser cuantitativos, si pueden medirse, o cualitativos, si no pueden
medirse.
Variables estadísticas: Son los distintos valores que puede tomar un carácter estadístico
cuantitativo.
Una variable es discreta cuando solo puede tomar valores aislados. Por ejemplo, el número de hijos.
Una variable es continua cuando puede tomar todos los valores dentro de un intervalo. Por ejemplo,
la estatura.
ESTADÍSTICA DESCRIPTIVA
TABLAS DE FRECUENCIAS
Las tablas de frecuencias sirven para ordenar y organizar los datos estadísticos. Con ellas, una masa
amorfa de datos pasa a ser una colección ordenada y perfectamente inteligible.
Con los datos se construye la tabla de frecuencias:
- En la primera columna, la variable xi, con todos sus posibles valores
- En la segunda columna, la correspondiente frecuencia, ni: número de veces que aparece cada
valor.
FRECUENCIAS RELATIVAS
Cuando se desea comparar varias distribuciones similares con distinto número de elementos, se debe recurrir a las frecuencias relativas.Si N es el número de individuos:
FRECUENCIAS ACUMULADAS
En una distribución de frecuencias, se llama frecuencia acumulada, Ni, correspondiente al valor i-
ésimo, xi, a la suma de la frecuencia de ese valor con todas las anteriores:
Ni = n1 + n2 + … + ni
3
TABLAS CON DATOS AGRUPADOS
Cuando en una distribución estadística el número de valores que toma la variable es muy grande,
conviene elaborar una tabla de frecuencias agrupándolos en intervalos. Para ello:
- Se localizan los valores extremos, a y b, y se halla su diferencia, r = b–a
- Se decide el número de intervalos que se quiere formar, teniendo en cuenta la cantidad de datos que
se poseen. El número de intervalos no debe ser inferior a 6 ni superior a 15.
El punto medio de cada intervalo se llama marca de clase. Es el valor que representa a todo el
intervalo para el cálculo de algunos parámetros.
Cuando se elabora una tabla con datos agrupados, se pierde algo de información (pues en ella se
ignora cada valor concreto, que se difumina dentro de un intervalo). A cambio, se gana en claridad y
eficacia.
GRÁFICOS ESTADÍSTICOS
GRAFICOS PARA VARIABLES CUALITATIVAS O CUANTITATIVAS
DISCRETAS
Diagrama de barras:
- En el eje de las X : Se representan los valores de la
variable
- En el eje de las Y : Se representan los valores de la
frecuencia:
- Se levanta para cada valor de la X una barra que representa
la frecuencia de dicho valor.
Si unimos mediante una poligonal los puntos más altos de
cada barra obtenemos el polígono de frecuencias.
GRAFICOS PARA VARIABLES CUANTITATIVAS CONTINUAS
SI TODOS LOS INTERVALOS TIENEN LA MISMA AMPLITUD
Histograma :
- En el eje de las X : Se representan los valores de la
variable
- En el eje de las Y : Se representan los valores de la
frecuencia
- Se levanta para cada valor del intervalo de la X un
rectángulo de altura la frecuencia de dicho intervalo.
Si unimos mediante una poligonal los puntos medios de
cada uno de dichos rectángulos el polígono de
frecuencias.
Las barras están pegadas unas a otras.
4
DIAGRAMAS DE SECTORES
Se dibuja un círculo y los porcentajes
correspondientes a cada valor.
PARÁMETROS DE CENTRALIZACIÓN
Los parámetros de centralización son medidas que sintetizan los valores e indican la tendencia de los
datos a agruparse sobre un valor.
Se llaman de centralización porque los datos se distribuyen alrededor de ellos.
Las definiciones siguientes sirven tanto para datos aislados como para datos agrupados en intervalos:
- Si los datos son aislados: los xi son los valores que toma la variable
- Si los datos están agrupados en intervalos: los xi son las marcas de clase.
MEDIA
La media de un conjunto de datos es el resultado que se obtiene al dividir la suma de todos los datos
entre el número total de ellos:
MODA
La moda de una distribución es el valor que tiene mayor frecuencia.
Si hay dos valores que tienen la misma frecuencia máxima, se dice que es una distribución bimodal;
si hay tres, trimodal; y si hay varios, multimodal.
MEDIANA
Si los individuos de una población están colocados en orden creciente según la variable que
estudiamos, el que ocupa el valor central se llama individuo mediano, y su valor, la mediana: Me
La mediana, Me, está situada de modo que antes de ella está el 50% de la población y, detrás, el otro
50%.
Si el número de individuos es par, la median es el valor medio de los dos centrales.
PARÁMETROS DE DISPERSIÓN
5
Los parámetros de dispersión son unos valores que indican si los datos de la distribución estás más o
menos cercanos a los parámetros centrales.
RANGO O RECORRIDO
El recorrido es la diferencia entre el valor mayor y el menor de la distribución.
EJEMPLO CON DATOS DISCRETOS Al lanzar un dado se han obtenido los siguientes resultados:
Resultado 1 2 3 4 5 6
Nº de veces 5 9 14 7 9 6
Elabora la tabla estadística y calcula la media, moda, mediana, recorrido, varianza, desviación típica
y coeficiente de variación.
xi ni fi Ni xini xi2 ni
1
5
5/50
5 1-5
5
5
2
9
9/50
14 6-14
18
36
3
14
14/50
28 15-28
42
126
4
7
7/50
35 29-35
28
112
5
9
9/50
44 36-44
45
225
6
6
6/50
50 45-50
36
216
50
174
720
MEDIA:
=
MODA: 3
MEDIANA:
RECORRIDO: 6 – 1 = 5
6
EJEMPLO CON INTERVALOS
La edad de los socios de un club de ajedrez juvenil se distribuye en los siguientes intervalos.
Edad [10 , 12) [12 ,14 ) [14 ,16 ) [16 ,18]
Nº de socios 6 12 15 5
Elabora la tabla estadística y calcula la media, moda, mediana, recorrido, varianza, desviación típica
y coeficiente de variación.
Intervalos xi ni fi Ni xini xi2 ni
[10 , 12)
11
6
6/38
6 1-6
66
726
[12 ,14 )
13
12
12/38
18 7-18
156
2028
[14 ,16 )
15
15
15/38
33 19-33
225
3375
[16 ,18 )
17
5
5/38
38 34-38
85
1445
38
532
7574
MEDIA:
=
MODA: 15
MEDIANA:
RECORRIDO: 17 – 11 = 6
7
PROBABILIDAD
EXPERIMENTOS DETERMINISTAS Y DE AZAR
Un experimento es determinista si, al realizarse en las mismas condiciones, siempre se obtiene el
mismo resultado.
Un experimento es aleatorio o de azar si no es posible predecir el resultado aunque se realice en las
mismas condiciones.
SUCESOS
El espacio muestral está formado por el conjunto de todos los resultados que se pueden presentar.
Se representa con la letra E y los resultados entre llaves { } y separados por comas.
EJEMPLOS
- Espacio muest ra l de una moneda:
E = {C, X}.
- Espacio muest ra l de un dado:
E = {1, 2 , 3 , 4 , 5 , 6}.
Un suceso elemental es cada uno de los resultados del espacio muestral.
Un suceso es un conjunto de sucesos elementales. Éstos se representan con letras mayúsculas,
escribiendo sus elementos entre llaves y separados por comas.
El suceso contrario de un suceso A está formado por todos los sucesos elementales que no están en
A. Se representa por .
El suceso seguro es el que siempre se presenta, y es igual al espacio muestral.
El suceso imposible es el que nunca se presenta. Se representa con el símbolo .
8
EJEMPLO
1. Una bolsa cont iene bolas blancas y negras. Se extraen
sucesivamente t res bolas.
E = {(b,b,b) ; (b ,b,n) ; (b ,n,b); (n ,b,b) ; (b ,n,n) ; (n ,b,n) ; (n ,n ,b) ; (n ,
n ,n)}
2. El suceso A = {extraer t res bolas del mismo color}.
A = {(b,b,b) ; (n , n ,n)}
3. El suceso B = {extraer al menos una bola blanca}.
B= {(b,b,b) ; (b ,b,n) ; (b ,n,b) ; (n ,b,b) ; (b ,n,n) ; (n ,b,n) ; (n ,n ,b)}
4. El suceso C = {extraer una sola bola negra}.
C = {(b,b,n) ; (b ,n,b) ; (n ,b,b)}
EJEMPLO
Consideramos el experimento que consiste en lanzar un dado, si A = "sacar
par". Calcular .
A = {2, 4 , 6}
= {1, 3 , 5}
9
SUCESOS COMPATIBLES E INCOMPATIBLES
Dos sucesos son compatibles si se pueden presentar al mimo tiempo, es decir, si
Dos sucesos son incompatibles si no se pueden presentar al mimo tiempo, es decir, si
LA REGLA DE LAPLACE
La probabilidad de un suceso A de un experimento aleatorio es un número entre 0 y 1, que mide la
facilidad de que el suceso ocurra. Cuanto más se acerca a 1 mayor es la posibilidad de ocurrir.
Cuando un experimento aleatorio es regular, es decir que todos los sucesos elementales tienen la
misma probabilidad de ocurrir ó son equiprobables, para calcular la probabilidad de un suceso
cualquiera A, basta contar y hacer el cociente entre el nº de sucesos elementales que componen A
(casos favorables) y el nº de sucesos elementales del espacio muestral (casos posibles).
Este resultado se conoce como Regla de Laplace.