Intervalos de confianza

15
Intervalos de confianza Christian Michel Álvarez Ramírez

Transcript of Intervalos de confianza

Page 1: Intervalos de confianza

Intervalos de confianza

Christian Michel Álvarez Ramírez

Page 2: Intervalos de confianza

Intervalos de confianzaEn estadística, se llama intervalo de confianza a un par de números entre los cuales se estima que

estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos

números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor

desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa

con 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error

aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación

mediante tal intervalo.1

El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo

más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un

intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de

error.

Para la construcción de un determinado intervalo de confianza es necesario conocer

la distribución teórica que sigue el parámetro a estimar,θ. Es habitual que el parámetro presente

una distribución normal. También pueden construirse intervalos de confianza con la desigualdad de

Chebyshov.

En definitiva, un intervalo de confianza al 1 - α por ciento para la estimación de un parámetro

poblacional θ que sigue una determinadadistribución de probabilidad, es una expresión del tipo

[θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es la función de distribución de probabilidad de θ.

Intervalo de confianza para la media de una población

De una población de media   y desviación típica   se pueden tomar muestras de   elementos.

Cada una de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de

todas las medias muestrales coincide con la media poblacional:2 

Pero además, si el tamaño de las muestras es lo suficientemente grande,3 la distribución de medias

muestrales es, prácticamente, unadistribución normal (o gaussiana) con media μ y una desviación

típica dada por la siguiente expresión:  . Esto se representa como

sigue:  . Si estandarizamos, se sigue que: 

En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro del cual caigan un

determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 ≤ z

≤ z2] = 1 - α, donde (1 - α)·100 es el porcentaje deseado (véase el uso de las tablas en una

distribución normal).

Se desea obtener una expresión tal que 

Page 3: Intervalos de confianza

En esta distribución normal de medias se puede calcular el intervalo de confianza donde se

encontrará la media poblacional si sólo se conoce una media muestral ( ), con una confianza

determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este

valor se le llamará   (debido a que   es el error que se cometerá, un término opuesto).

Para ello se necesita calcular el punto   —o, mejor dicho, su versión estandarizada   

o valor crítico— junto con su "opuesto en la distribución"  . Estos puntos delimitan la

probabilidad para el intervalo, como se muestra en la siguiente imagen:

Dicho punto es el número tal que:

Y en la versión estandarizada se cumple que:

Así:

Haciendo operaciones es posible despejar   para obtener el intervalo:

De lo cual se obtendrá el intervalo de confianza:

Page 4: Intervalos de confianza

Obsérvese que el intervalo de confianza viene dado por la media muestra   ± el producto

del valor crítico   por el error estándar  .

Si no se conoce   y n es grande (habitualmente se toma n ≥ 30):4

, donde s es la desviación típica de una muestra.

Aproximaciones para el valor   para los niveles de confianza estándar son 1,96

para   y 2,576 para  .5

Intervalo de confianza para una proporción

El intervalo de confianza para estimar una proporción p, conocida una proporción muestral pn de

una muestra de tamaño n, a un nivel de confianza del (1-α)·100% es:

Page 5: Intervalos de confianza

Problemas1- Una empresa está interesada en lanzar un nuevo producto al mercado. Tras realizar una campaña publicitaria, se toma la muestra de 1000 habitantes, de los cuales, 25 no conocían el producto. A un nivel de significación del 1% ¿apoya el estudio las siguientes hipótesis?

a. Más del 3% de la población no conoce el nuevo producto. b. Menos del 2% de la población no conoce el nuevo producto

Datos:

n = 1000

x = 25

Donde:

x = ocurrencias

n = observaciones

= proporción de la muestra

= proporción propuesta

Solución:

a)

a = 0,01 

Page 6: Intervalos de confianza

2- Un gerente de ventas de libros universitarios afirma que en promedio sus representantes de ventas realiza 40 visitas a profesores por semana. Varios de estos representantes piensan que realizan un número de visitas promedio superior a 40. Una muestra tomada al azar durante 8 semanas reveló un promedio de 42 visitas semanales y una desviación estándar de 2 visitas. Utilice un nivel de confianza del 99% para aclarar esta cuestión.

Datos:

(= 40

n = 8

Nivel de confianza del 99%

Nivel de significación = (100%-99%)/2 = 0,5% = 0,005

Solución:

H0: (= 40

H1: (> 40

Grados de libertad: n-1 = 8-1 =7

a = 0,005 

3-Un investigador de mercados y hábitos de comportamiento afirma que el tiempo que los niños de tres a cinco años dedican a ver la televisión cada semana se distribuye normalmente con una media de 22 horas y desviación estándar 6 horas. Frente a este estudio, una empresa de investigación de mercados cree que la media es mayor y para probar su hipótesis toma una

Page 7: Intervalos de confianza

muestra de 64 observaciones procedentes de la misma población, obteniendo como resultado una media de 25. Si se utiliza un nivel de significación del 5%. Verifique si la afirmación del investigador es realmente cierta.

Datos:

n = 64

a = 5% = 0,05

Solución:

H0: (= 22

H1: (> 22

a = 0,05 

4-Cuando las ventas medias, por establecimiento autorizado, de una marca de

relojes caen por debajo de las 170,000 unidades mensuales, se considera razón

suficiente para lanzar una campaña publicitaria que active las ventas de esta

marca. Para conocer la evolución de las ventas, el departamento de marketing

realiza una encuesta a 51 establecimientos autorizados, seleccionados

aleatoriamente, que facilitan la cifra de ventas del último mes en relojes de esta

marca. A partir de estas cifras se obtienen los siguientes resultados: media =

169.411,8 unidades., desviación estándar = 32.827,5 unidades. Suponiendo que

Page 8: Intervalos de confianza

las ventas mensuales por establecimiento se distribuyen normalmente; con un

nivel de significación del 5 % y en vista a la situación reflejada en los datos. ¿Se

considerará oportuno lanzar una nueva campaña publicitaria?

Datos:

n = 51

Solución:

H0: (= 170000

H1: (< 170000

a = 0,05 

5-Un sociólogo ha pronosticado, que en una determinada ciudad, el

nivel de abstención en las próximas elecciones será del 40% como

mínimo. Se elige al azar una muestra aleatoria de 200 individuos, con

derecho a voto, 75 de los cuales estarían dispuestos a votar.

Determinar con un nivel de significación del 1%, si se puede admitir el

pronóstico.

Page 9: Intervalos de confianza

1. Enunciamos las hipótesis nula y alternativa:

H0: μ ≥ 0.40      La abstención será como mínimo del 40%.

H1: μ < 0.40     La abstención será como máximo del 40%;

2. Zona de aceptación

Para α = 0.01, le corresponde un valor crítico: z α = 2.33.

Determinamos el intervalo de confianza para la media:

3. Verificación.

4. Decisión

Aceptamos la hipótesis nula H0. Podemos afirmar, con un nivel de

significación del 1%, que la  La abstención será como mínimo del

40%.

6-Un informe indica que el precio medio del bil lete de avión entre

Canarias y Madrid es, como máximo, de 120 € con una desviación

Page 10: Intervalos de confianza

típica de 40 €. Se toma una muestra de 100 viajeros y se obtiene

que la media de los precios de sus bil letes es de 128 €.  

¿Se puede aceptar, con un nivel de significación igual a 0,1, la

afirmación de partida?

1. Enunciamos las hipótesis nula y alternativa:

H0: μ ≤ 120     

H1: μ > 120      

2. Zona de aceptación

Para α = 0.1 , le corresponde un valor crít ico:  z α = 1.28.

Determinamos el intervalo de confianza:

3. Verif icación.

Valor obtenido de la media de la muestra:  128 €.

4. Decisión

No aceptamos la hipótesis nula  H0. Con un nivel de significación

del 10%.

Page 11: Intervalos de confianza

7-Se sabe que la desviación típica de las notas de cierto examen de

Matemáticas es 2,4. Para una muestra de 36 estudiantes se obtuvo

una nota media de 5,6. ¿Sirven estos datos para confirmar la

hipótesis de que la nota media del examen fue de 6, con un nivel de

confianza del 95%?

1. Enunciamos las hipótesis nula y alternativa:

H0: μ = 6      La nota media no ha variado.

H1: μ ≠ 6       La nota media ha variado.

2. Zona de aceptación

Para α = 0.05, le corresponde un valor crítico: z α/2 = 1.96.

Determinamos el intervalo de confianza para la media:

(6-1,96 ·  0,4; 6+1,96 ·  0,4) = (5,22; 6,78)

3. Verificación.

Valor obtenido de la media de la muestra: 5,6 .

4. Decisión

Aceptamos la hipótesis nula H0, con un nivel de significación del 5%.

Page 12: Intervalos de confianza

8-Un gerente de ventas de libros universitarios afirma que en promedio sus representantes de ventas realiza 40 visitas a profesores por semana. Varios de estos representantes piensan que realizan un número de visitas promedio superior a 40. Una muestra tomada al azar durante 8 semanas reveló un promedio de 42 visitas semanales y una desviación estándar de 2 visitas. Utilice un nivel de confianza del 99% para aclarar esta cuestión.

Datos:

(= 40

n = 8

Nivel de confianza del 99%

Nivel de significación = (100%-99%)/2 = 0,5% = 0,005

Solución:

H0: = 40

H1: (> 40

Grados de libertad: n-1 = 8-1 =7

a = 0,005 

Page 13: Intervalos de confianza